Ugrás a tartalomra

A HUN-REN SZTAKI és a Bosch együttműködése a mesterséges intelligenciával támogatott vállalati keresés területén

A HUN-REN SZTAKI Elosztott Rendszerek Osztálya (DSD) és a magyarországi Bosch csoport közösen megvalósított, hároméves kutatási együttműködési projektje sikeresen lezárult. Az együttműködés középpontjában a „Graph Database Project” állt, amely egy új információ-visszakeresési módszertant eredményezett, jelentősen javítva azt, ahogyan a nagyvállalatok hozzáférnek a strukturálatlan adatok tömegében rejlő tudáshoz, és azt hasznosítani tudják.

A kihívás: a vállalati tudás felszabadítása

A Bosch-hoz hasonló modern nagyvállalatok hatalmas mennyiségű információval rendelkeznek, amelyek számtalan dokumentumban találhatók meg – a PDF-ekben rögzített műszaki specifikációktól kezdve a prezentációkban szereplő projektjelentésekig. Az alapvető kihívás az volt, hogy túllépjenek az egyszerű kulcsszavas keresésen, és olyan rendszert hozzanak létre, amely képes megérteni az adatokban rejlő kontextust és összefüggéseket, ezáltal pontos és átfogó válaszokat nyújtva összetett kérdésekre.

Az együttműködés: az innováció útja a GraphRAG-gel

A projektcsapat arra vállalkozott, hogy a mesterséges intelligencia és a tudásgráf-technológia élvonalbeli megoldásait feltérképezve egy kifinomult információ-visszakereső rendszert hozzon létre. Az együttműködés lépésről lépésre fejlődött, több korszerű technológia vizsgálatával:

  1. Az alapok megteremtése:
    A projekt egy gráfadatbázis létrehozásával indult, amelynek célja a Bosch sokféle adatvagyonának feltérképezése és összekapcsolása volt, egy egységes és könnyen hozzáférhető tudásrendszer kialakítása érdekében.
  2. Fejlett RAG-megoldások feltárása:
    A csapat elmélyült a Retrieval-Augmented Generation (RAG) technológiában, amely a nagy nyelvi modellek(LLM-ek) tudását magán adatbázisokból származó információkkal tudja kiegészíteni. A kutatás hamar továbbfejlődött a GraphRAG irányába, amely a tudásgráfok lehetőségeit kihasználva olyan kapcsolódásokat és kontextuális összefüggéseket is képes feltárni, amelyeket a hagyományos RAG-módszerek nem észlelnek.
  3. Újszerű megközelítés a tudáskinyerésben:
    Az együttműködés egyik kulcsfontosságú innovációja egy egyedi keretrendszer kidolgozása volt a tudásgráf felépítésére. A csapat fejlett LLM-eket használt több mint 14 000 kulcsszó és kifejezés automatikus kinyerésére, kategorizálására és csoportosítására több száz műszaki dokumentumból. Ez a folyamat az egymástól elszigetelt dokumentumokat az intézményi tudás gazdag, egymással összekapcsolt hálózatává alakította.

A megoldás kulcsa a gráf

A projekt legjelentősebb eredménye egy többrétegű keresési stratégia kidolgozása volt, amely több technikát ötvöz a kiemelkedő pontosság érdekében. A végső rendszer az alábbi elemeket integrálja:

Teljes szöveges keresés a széles körű feltárás érdekében.
Vektoralapú keresés a szemantikai megértéshez.
Gráfalapú kulcsszavas lekérdezések a kontextuális kapcsolatok feltárására.

Fontos elem a csapat által bevezetett LLM-alapú utólagos szűrő is, amely intelligensen újrarangsorolja az egyesített keresési eredményeket, ezáltal háttérbe szorítja a kevésbé releváns találatokat, és jelentősen növeli a válaszok relevanciáját.

Bosh Campus

Eredmények és hatás

Az új, kombinált megközelítés teljesítménye kiemelkedő. A különféle módszerek eredményeit egy 365 műszaki dokumentumból álló tesztkészleten hasonlítottuk össze. A tesztek során a hagyományos szöveges és vektoros kereséshez képest a recall@10 érték 0,8-ról 1,0-ra emelkedett. Ez azt jelenti, hogy az összes teszt lekérdezésre válaszul adott lista első 10 eleme minden egyes releváns dokumentumot tartalmazott. Ez jelentős előrelépést jelent a vállalati keresés területén, és a HUN-REN SZTAKI és a Bosch kutatói közösen erről szóló belső találmányi jelentést adtak be.

A HUN-REN SZTAKI és a Bosch közötti sikeres együttműködés jól példázza az akadémiai szaktudás és az ipari ambíció ötvözésének erejét. A „Graph Database Project” nemcsak egy kritikus üzleti kihívásban nyújtott segítséget a Bosch számára, hanem új tudományos eredményekkel is gazdagította a mesterséges intelligencián alapuló információ-visszakeresés területét.