Ugrás a tartalomra

Adatminőség javítás és adatintegráció

Menedzser

Minden vállalat, szervezet működéséhez elengedhetetlen a folyamatait jó minőségben leíró adat előállítása és használata, ahol az adatminőség javítása többszörösen megtérül. Ehhez viszont szerkezetében és tartalmában heterogén, hiányos, hibás forrásadatok egységesítésén, javításán és feldolgozásán keresztül vezet az út.

Adattisztító megoldásaink nyílt szabványú, újrafelhasználható transzformációs műveletekre épülnek: a valódi érték az itt leképzett üzleti, iparági tudásban rejlik. Gyorsan személyre szabható tartalommal rendelkezünk ügyféladatokra (nevek, postai címek, telefonszámok stb.) és log adatokra (applikációs és web szerver logok). Lehetőségünk van külső adatok, például címtörzsek, cégadatbázisok, térkép koordináták vagy akár közösségi hálók adatainak csatolására. Transzformációs készleteink folyamatos fejlődése mellett új adatkörök feldolgozási lépései is gyorsan kialakíthatók.

Adatbázisainkban a valós dolgok sokszor duplikálva, több lenyomattal is jelen vannak. Ilyen esetekben alapvető kérdéseket is nehéz megválaszolni: „Hány ügyfelünk, termékünk, felhasználónk van valójában?” Ahhoz, hogy valós képet alkothassunk a folyamatainkról elengedhetetlen az egyezések felderítése. Aktív kutatási tevékenységünk eredményein alapuló módszereink az elterjedt megoldásokhoz képest nagyságrendekkel több adatra alkalmazhatók olyan bonyolult esetekben is, mint például a háztartások azonosítása.

Módszereinkkel és eszközeinkkel gyorsan és költséghatékonyan tervezünk és implementálunk megbízható és robusztus adatintegráló folyamatokat. Kutatási eredményeinkre építve rendelkezünk alkalmazásokkal ügyfél-, log-, szenzor- és web adatokra, visszaélés-felderítés, IT security, okos város, trendelemzés és hálózatelemzés témakörökben.

Az egyre nagyobb ütemben növekvő adatmennyiségek, a „Big Data”, a valósidejűség elvárása komoly kihívást jelentenek. Ezt szem előtt tartva megoldásaink jól tervezhető és költséghatékony módon szétoszthatók

  • több processzormagra gépen belül, több gépes környezetekre, felhőbe, Hadoop-ra kötegelt feldolgozáshoz,
  • Strom-ra vagy in-memory adatbázisokra valós idejű feldolgozáshoz.

Követelmények

bármilyen adatforrásból érkező, az adott entitás megjelenéseit tartalmazó adathalmazok (adatbázis táblák, file-ok, web stb.)

Eredmény megnevezése

összevont rekord-halmazok, amik a valós entitásokhoz tartoznak – pl. valós személyek mentén létrehozott ügyfélrekord halmazok

Eredmény technikai leírása

Adatbázisainkban a valós dolgok sokszor duplikálva, több lenyomattal is jelen vannak. Ilyen esetekben alapvető kérdéseket is nehéz megválaszolni: „Hány ügyfelünk, termékünk, felhasználónk van valójában?” Ahhoz, hogy valós képet alkothassunk a folyamatainkról elengedhetetlen az egyezések felderítése. Aktív kutatási tevékenységünk eredményein alapuló módszereink az elterjedt megoldásokhoz képest nagyságrendekkel több adatra alkalmazhatók olyan bonyolult esetekben is, mint például a háztartások azonosítása.

Hossza

feladatfüggő, de két hónapnál kisebb projekt nehezen képzelhető el

Árazása

adathalmaz méretétől, minőségétől, a kitűzött céloktól függ

Célcsoportja

Jellemzően ügyfél-adatbázisok tulajdonosai, ahol sok folyamat épül CRM rendszerekre, ahol gondot okoz marketing adatbázisok ügyféladatbázisokhoz kapcsolása és felhasználása. Hasonló problémák előfordulnak nagy méretű termék-adatbázisokon, de bármilyen entitás okozhat gondot (webes dokumentumok, regisztrációk, gépjárművek, lakások, könyvek, cikkek stb.)

Követelmények

bármilyen adattisztítást igénylő adathalmaz, bármilyen formátumban – például ügyféladatbázisok, marketing címtörzsek, webshopok termékleírásai, webes dokumentumok stb.

Eredmény megnevezése

szabványosított, hibáktól szűrt és javított adathalmaz, a hibák egyértelmű megjelölésével

Eredmény technikai leírása

Az adatminőség javítása többszörösen megtérül, amihez viszont szerkezetében és tartalmában heterogén, hiányos, hibás forrásadatok egységesítésén, javításán és feldolgozásán keresztül vezet az út.

Adattisztító megoldásaink nyílt szabványú, újrafelhasználható transzformációs műveletekre épülnek: a valódi érték az itt leképzett üzleti, iparági tudásban rejlik. Gyorsan személyre szabható tartalommal rendelkezünk ügyféladatokra (nevek, postai címek, telefonszámok stb.) és log adatokra (applikációs és web szerver logok). Lehetőségünk van külső adatok, például címtörzsek, cégadatbázisok, térkép koordináták vagy akár közösségi hálók adatainak csatolására. Transzformációs készleteink folyamatos fejlődése mellett új adatkörök feldolgozási lépései is gyorsan kialakíthatók.

Hossza

feladatfüggő, de két hónapnál kisebb projekt nehezen képzelhető el

Árazása

adathalmaz méretétől, minőségétől, a kitűzött céloktól függ

Célcsoportja

- döntéstámogatási rendszerek bármilyen szervezetben, ahol heterogén adatforrások adatait kell importálni; pl. pénzügyi szolgáltatók, telekom szolgáltatók,
- automatikusan generált log- és szenzor adatok felhasználói, pl. telekom cégek, webes szolgáltatók