Ugrás a tartalomra

Az ARP újabb fejlesztései a Dataverse Community Meetingen

2026. május 11-15. között Barcelonában rendezték meg a Dataverse Community Meeting (DCM) 2026-os konferenciájaát. A tavalyi sikeres ARP bemutatkozást (DCM 2025 – Chapel Hill, NC, USA) követően az Elosztott Rendszerek Osztály munkatársai, Pataki Balázs és Finta Norbert, idén a legfrissebb ARP fejlesztéseket mutatták be a DCM szakmai közösségének.

A Dataverse kutatási repozitórium rendszer, amit a Harvard fejleszt, idén lett 20 éves, de ez a magas szoftver-életkor szerencsére nem látszik meg rajta: a szoftvert a Harvard vezetésével több kutatóintézet, így például a HUN-REN SZTAKI közreműködésével fejlesztik és negyedévente jelennek meg az új verziók. A szoftver népszerűsége ma is töretlen, már 147 installációja van, melyek közül egyes installációk több száz egyetemet vagy kutatóintézetet szolgálnak ki egyszerre, így a Dataverse-nek több ezer kutatóhelyen és oktatási intézményben vannak felhasználói.

A Dataverse számunkra azért kiemelt fontosságú, mert ez a rendszer képezi a HUN-REN Adatrepozitórium Platform (ARP) alapját is. Az ARP egyetlen Dataverse installációval a teljes HUN-REN kutatási hálózatot és 2026-tól a magyar egyetemeket is kiszolgálja. Az ARP-ban minden intézmény egy saját kis Dataverse-t, kollekciót kap, amit intézményenként külön jogosultságokkal tudnak kezelni az intézményi adatgazdászok.

Előadás az ARP-ről

A 147 Dataverse installáció fele, 73 található Európában. Ezt a kiemelkedő érdeklődést felismerve Slava Tyikhonov a CODATA mesterséges intelligencia technológiai vezetője és az első hivatalos "Dataverse nagykövet" elindított egy Dataverse.eu kezdeményezést, melynek célja, hogy az európai felhasználók és fejlesztők az eddigieknél jobban bekapcsolódjanak a Dataverse fejlesztésébe és a fejlesztéseik gyorsabban juthassanak el a végfelhasználókhoz. E kezdeményezés jelenleg még a tervezési fázisában tart, de a DCM 2026-on alkalmunk adódott személyes megbeszéléseket is folytatni és kialakítani a közös európai Dataverse stratégia alapjait. Ebben a munkában a ARP két partnerintézménye, a HUN-REN SZTAKI és az ELTE TK munkatársai is részt vesznek.

A 2026-os konferencia három területre fókuszált: a mesterséges intelligencia-megoldásokra a repozitóriumi munkafolyamatok, az adatminőség és az MI-re felkészített adatok fejlesztése érdekében; az interoperabilitás javítására az adatok gazdagabb összekapcsolhatósága és újrafelhasználása érdekében a különböző adatállományok, szakterületek és platformok között; valamint az érzékeny és korlátozott hozzáférésű adatok támogatásának bővítésére.

A rendezvény során Pataki Balázs bemutatta az ARP legújabb fejlesztését: a VibeARP AI ágenst, ami az adatgazdászoknak segít abban, hogy a metaadatolás fárasztó munkáját levegye vállukról és a fontosabb tartalmi kérdésekkel foglalkozhassanak. A konferencián természetesen az MI sokféle módon említésre került. Többek között a VibeARP-hoz hasonló megoldásokon keresztül, amik a metaadatok minél könnyebb és megbízhatóbb előállítását teszik lehetővé, valamint segítik ezen adatok minél jobb megértését és újrafehasználását. Kiemelt téma a kutatási adatrepozitóriumok körben a kuráció és a kutatási workflow-k támogatása, amik a jövőben az ARP számára is egyre fontosabbá válnak.

Pataki Balázs előad a DCM 2026 konferencián

A DSD munkatársai a konferencia során megismerték a Dataverse-t használó közösség számára fontos további use case-ket és megoldásokat, valamint jövőbeli együttműködések és projektek lehetőségeiről is egyeztettek.

A Harvard munkatársaival arról folytattak megbeszélést, hogy az ARP-ban használt CEDAR alapú metaadatséma regiszter és annak integrációja a Dataverse-sel miképpen kerülhet bele a Dataverse alapszoftverébe. Ha ez megvalósul, akkor már nem csak a magyar kutatói közösség, hanem a Dataverse 146 egyéb installációja számára is hozzáférhetővé válik a metaadatsémák egyszerű, felhasználóbarát létrehozása, használata és megosztása.

DCM 2026 konferencia résztvevői