
Nyelvbányász / Language Miner
A szöveges e-dokumentumok elérhetővé tétele kritikus eleme a vállalatok hatékony működtetésének. A NYELVBÁNYÁSZ projekt célja, hogy megcélozza a világpiacon jelentkező ilyen irányú igények kielégítését egy a ma szokásostól radikálisan eltérő új megközelítésre építve, az önszervező tanulás segítségével felépített nyelvi rendszerek alkalmazásával. Szemben a korábbi megközelítésekkel, az önszervező módon tanult nyelvmodellek jóval kevesebb ad-hoc elemet tartalmaznak, s így általuk a korábbiaknál jobb eredmények érhetőek el. A projekt keretén belül a számítógépes nyelvészek, matematikusok, kognitív tudósok, fizikusok, adatbányászok, gépi tanulás szakemberek dolgoznak együtt - a multidiszciplináris megközelítéstől is várjuk a projekt újszerű, áttörést jelentő eredményeit. Szintén cél a tanult nyelvmodellekre szervesen ráépülő ipari igényeket kiszolgálni képes nyelvtechnológiák, illetve az ezekre épülő, tipikus vállalati problémákat megcélzó alkalmazás prototípusok kifejlesztése is. A munkába bevont ipari partnerek és végfelhasználók közreműködése biztosítja, hogy a hasznosításkor megjelenő felhasználói igények a projekt megvalósításának kezdetétől fogva reprezentálva legyenek.
Résztvevők
- MTA SZTAKI (Gépi tanulás és Adatbányászat és Webkeresés csoportok)
- ELTE (Számítógéptudományi Tanszék, Komplex Rendszerek Fizikája Tanszék)
- BME (Sztochasztikus Analízis Tanszék, Matematikai Intézet)
- MTA Nyelvtudományi Intézet
- MTA SZFKI
- Omega Consulting Kft.
- Pont Rendszerház Rt.