Skip to main content

TEXTREND

Project data

Cost
415.275.000 Ft

A pályázat két, egymásra épülő célja (1) az integrált TEXTrend Platform eszköztár és
szolgáltatási bázis létrehozása, ill. (2) az eszköztár demonstrációs alkalmazásainak kidolgozása a gazdasági és szakpolitikai döntéshozatal különböző területein.

A TEXTrend platform célja a weben található dinamikus és óriási mennyiségű információ mély elemzése valamely specifikus területen, mint például a tudomány vagy a gazdasági élet. Mély elemzésen azt értjük, hogy, szemben a szokásos kivonatolási vagy egyszerűen indexelési szolgáltatásokkal, a weben elérhető adathalmazból minőségileg új információt nyerjünk ki, aminek az előállítása egyenesen lehetetlen lenne pusztán emberi erőforrást felhasználva. Jó példa a trendek elemzése, ahol a cél az hogy nagy mennyiségű dokumentumból (blogok, cikkek, stb) meghatározzuk, sőt, megjósoljuk a közvélekedés vagy érdeklődés jellemzőit, vagy időbeli változását. Egy másik példa látens (pl. szociális) struktúrák felderítése és egy szempillantás alatt áttekinthetővé tétele automatikus szövegfeldolgozás, hálózatokat kezelő algoritmusok, és vizualizáció segítségével, pl. egy terület hatalmi és befolyási hálózata esetében. A sort sokáig lehetne folytatni. Ezek a mély információk a megfelelő területeken felbecsülhetetlen értékkel bírhatnak. Gondoljunk a politikai vagy gazdasági döntéshozatalra, vagy a tudományfinanszírozás kérdésére.

Az eszköztárnak modulárisnak (ezáltal bővíthetőnek) kell lennie, és függetlennek az alkalmazási területtől. Ez a két cél lehetővé teszi, hogy a kifejlesztett rendszer rugalmasan alkalmazható legyen a legkülönbözőbb területeken minimális befektetés mellett, megvalósíthatóvá téve a konzultációra alapuló üzleti modellt, amelyet jelenleg nem támogat elérhető szolgáltatás.

Végül, célunk, hogy a rendszer az angol és magyar nyelveket és a vegyes nyelvű információkeresést és elemzést támogassa, valamint egyéb nyelvek integrálása megoldható legyen jól definiált modulok későbbiekben történő kifejlesztésével.

A fenti célok megvalósítása néhány főbb feladatra bontható: a releváns dokumentumok
felkutatása és letöltése (webkeresés, intelligens letöltés, szűrés, stb), a letöltött adathalmaz
szövegbányászati eszközökkel történő elemzése (klaszterezés, hálózatok kinyerése számos
módon, stb), az előállított absztrakt hálózatok elemzése, és végül, vizualizáció és felhasználói
interfészek fejlesztése. Ezeket a feladatokat a későbbi fejezetekben és táblázatokban kimerítően részletezzük.

A letöltés és a szövegbányászat első lépései erősen területfüggők lehetnek, ami indokolttá teszi hogy egy további feladatként ezen feladatok speciális területekre való adaptációját is
automatizáljuk, de legalábbis elég olcsóvá és egyszerűvé tegyük.

A TEXTrend eszköztár elemeinek felhasználásával a három üzleti partner a következő három
demonstrációs alkalmazás fejlesztésére is vállalkozik, amelyeknek a célja hogy a TEXTrend
eszköztár rugalmas alkalmazhatóságát és ezáltal gazdasági életképességét illusztráljuk.

Manager