Ugrás a tartalomra

Nemzetközi pályán az ARP: az első év mérlege és áttörései

A HUN-REN ARP (Kutatási Adatrepozitórium Platform) 2024. november 25-én nyitotta meg hivatalosan az „adatkapuit” a HUN-REN kutatói számára. A platform első fejlesztési szakasza ezzel lezárult, 2025-ben pedig a HUN-REN SZTAKI DSD (Elosztott Rendszerek Osztály) fejlesztői csapata már nemcsak a rendszer üzemeltetésére és hibajavítására fókuszált, hanem arra is, hogy a nemzetközi szakmai közönséggel is megismertesse az ARP innovációit.

A cél kettős volt: bemutatni a magyar ARP fejlesztéseket, és közvetlen szakmai visszajelzéseket szerezni arról, hogy hogyan illeszkednek ezek a világ élvonalában zajló kutatási adatkezelési és tárolási trendekhez. Kiemelt feladatunknak tartjuk, hogy az ARP hosszú távú vízióját a világtendenciákhoz igazítsuk.

ARP × Dataverse: CEDAR-integráció, ami felkeltette a Harvard és a Stanford érdeklődését

Az ARP nemzetközi disszeminációjának egyik kiemelkedő állomása a 2025-ös, Harvard által szervezett Dataverse Community Meeting volt Chapel Hillben, North Carolina-ban.

Ennek előzménye, hogy a januári Dataverse Community Call során az CoS (Center for Open Science) munkatársa bemutatta, hogy az OSF-ben (Open Science Framework), hogyan használják a CEDAR séma-template-eket. E megbeszélésen ad hoc demonstrációt tartottunk az ARP és a CEDAR mély integrációjáról.

Ez a prezentáció olyan nem várt fogadtatásra talált és annyira fontosnak találták a Dataverse harvardi fejlesztői, hogy felkértek minket, hogy az elkövetkező Dataverse Community Meetingen, Chapel Hillben mutassuk be a szélesebb Dataverse közönség számára is a fejlesztéseinket. Ott bemutattuk, hogy a CEDAR sémaregiszter integrációja és a Dataverse-be bevezetett RO-Crate alapú exportálási, importálási és szerkesztési lehetőségek – az általunk készített AROMA RO-Crate szerkesztővel – sokkal részletesebb és hatékonyabb metaadat-annotálást tesznek lehetővé, így jelentősen megkönnyítik FAIR adatcsomagok létrehozását.

Az amerikai látogatás során meghívták a Stanfordra is előadni a CEDAR fejlesztői a Dataverse - CEDAR integrációs projekt vezetőjét, Pataki Balázst, aki velük is megismertethette, hogy miképpen valósult meg ez az integráció a Dataverse-sel, illetve milyen egyéb fejlesztéseket végeztünk a CEDAR szoftverben, hogy még hatékonyabb lehessen a metaadatsémák létrehozása és megosztása, különös tekintettel a sémák verziókezelésére.

Mindezek az új fejlesztések, jelenleg az ARP saját Dataverse és CEDAR verzióiban érhetők csak el. A bemutatók és személyes megbeszélések eredményeként a Dataverse harvardi fejlesztőinek kérésére abban állapodtunk meg, hogy a saját CEDAR és RO-Crate integrációs fejlesztéseinket elérhetővé tesszük a világ számára az alap Dataverse-ben is, a szoftver egy későbbi verziójában. Így a fejlesztéseink minden Dataverse installáció és felhasználó számára közvetlenül elérhetővé válhatnak a jövőben.

ARP × RO-Crate: Aktív részvétel az RO-Crate specifikáció fejlesztésében

Az ARP fejlesztési víziójának egyik kulcseleme az RO-Crate szemantikus szintű adatcsomag létrehozás és kezelés, amely mára az egyik legelfogadottabb adatcsomagolási szabvány a kutatásban. Ezt használják egyre több kutatási adatkezelési workflow motorban, ELN-ben (Electronic Lab Note) és számos EOSC-szolgáltatásban is.

Jó döntés volt az ARP részéről az RO-Crate használata az egyre inkább feljövőben lévő FDO (Fair Data Objects) európai kezdeményezést is figyelembe véve, ami az adatobjektumok géppel támogatott, automatikus megtalálását és feldolgozását teszi lehetővé.

A FAIR kezdeményezés, a “Findable, Accessible, Interoperable, Reusable” alapvető célja az, hogy az adatobjektumok ne csak embereknek, hanem gépi ágenseknek is ugyanolyan jól és pontosan értelmezhetők legyenek. A FDO éppen ezt teszi lehetővé. A Dataverseben implementált “FAIR Signposting”, és az általunk implementált RO-Crate ábrázolás a kiterjesztett séma/profil kezeléssel a világon elsők között teheti az ARP-t FDO “kompatibilissé”.

Mivel az RO-Crate ennyire fontos központi eleme az ARP víziójának, ezért az RO-Crate közösség munkájában és az RO-Crate nemzetközi specifikációjának készítésében is részt veszünk, az 1.2-es verzióban már szerzőként is szerepelünk. Az RO-Crate közösségben is bemutattuk a fejlesztéseinket, így többek között az AROMA editort is, ami kiemelt helyen szerepel az RO-Crate közösség weboldalán is, illetve külön blog post is beszámol az oldalon az ARP projekt eredményeiről.

A következő 2026-os időszakban terveink szerint az RO-Crate profilok standardizációjában vállalunk szerepet – ebben az ARP már most is több gyakorlati tapasztalattal rendelkezik, mint sok nemzetközi partner.

ARP × AI: A VibeARP adatgazdász asszisztens első lépései

Az RO-Crate-tel, a RO-Crate profilokkal, metaadatsémákkal és FDO megfelelőséggel kapcsolatos munkáink egy új demonstrálható eredményre is vezettek. A HUN-REN ARP 2025. évi egész napos konferenciáján bemutattuk a VibeARP fejlesztésünket, ami egy kísérleti MI (mesterséges intelligencia) ágens, amelynek segítségével könnyebben és gyorsabban lehet adatcsomagokat jó minőségű és minél teljesebb metaadatokkal ellátni.

Ez a kísérletünk elindíthatja azt a folyamatot, ami a kódolási asszisztensekhez hasonlóan az ARP-ban egy adatgazdász asszisztens megjelenéséhez vezethet, ezzel levéve a mechanikus munkák terheit az adatgazdászok, vagy akár az egyes tudósok válláról, illetve megkönnyítheti a belépést az ARP használatába azoknak, akik nem akarják az ARP teljes funkcionális komplexitását kihasználni.

A VibeARP-ot sikeresen mutattuk be az októberi RO-Crate meetingen, és a novemberi Dataverse Community Call-on is.

ARP × EOSC: Felkészülés a magyar EOSC Node megteremtésére

Az ARP-ot fejlesztő SZTAKI DSD csapata, a korábbi évekhez hasonlóan kisebb szakmai küldöttséggel vett részt a 2025. novemberi EOSC Symposium rendezvényén.

Itt az volt a célunk, hogy egyrészt megismerjük az EOSC EU Node, illetve a már első körben elindított többi országos vagy tematikus node működését, hogy lássuk hazánk miképpen kapcsolódhat be ebbe a HUN-REN ARP és a HUN-REN Cloud eddigi eredményeivel.

Azt tapasztaltuk, hogy bár a magyar kutatói infrastruktúra országos federáció létrehozása még várat magára, de az ARP és a Cloud eddigi és jövőbeni tervezett fejlesztései európai szinten is élvonalbelinek tekinthetőek funkcionálisan. Az adottságaink miatt azonban méretben, kapacitásban még nem vesszük fel a versenyt- az európai hasonló infrastruktúrákkal és szolgáltatásokkal.

A szakmai beszélgetések során többször is azt a visszajelzést kaptuk, hogy az ARP lényegesen előrehaladottabb sok tekintetben. Nagy érdeklődés mutatkozott például a CEDAR alapú metaadat sémaregiszterünkkel és annak integrációjával kapcsolatban, az RO-Crate-tel és RO-Crate profilokkal kapcsolatos megoldásainkkal kapcsolatban, de a kötetlen beszélgetések során bemutatott VibeARP projektünk alapján is visszaigazolni látjuk az “AI for FAIR” irányába tett lépéseink helyességét, ami az EOSC szimpózium egyik kiemelt témája is volt egyben.

Az EOSC-ban a végső célunk, hogy megvalósuljon egy magyar nemzeti EOSC node, ezáltal a magyar és az európai kutatói infrastruktúrák összekötésre kerüljenek. Bár ez még távlati cél, a HUN-REN SZTAKI DSD munkatársai már ebben az évben is több EOSC munkacsoportban vettek részt. Micsik András az EOSC Technical and Semantic Interoperability Task Force-ban, Pataki Balázs az EOSC FAIR Metrics and Digital Objects Task Force-ban, Kovács László pedig az OA2: Metadata, Ontologies and Interoperability csoport munkájában vesz részt az EOSC illeszkedő policy-ainak kidolgozásában.

Az EOSC Technical and Semantic Interoperability Task Force-ban az elsők között mutattuk be az ARP fejlesztés eredményeit a metaadat sémák és metaadatok interoperabilitása terén, amely a metaadatsémák létrehozásán, alkalmazásán, RO-Crate formájú adatcsomagokban és az ARP föderált magyar kutatási adatrepozitórium hálózat közös keresőjében történő felhasználásán ível át, melyet több ARP komponens integrált működésével valósítottunk meg.

ARP × Jövő: Ez még csak a kezdet!

A különböző szakmai eseményeken, közösségekben való részvételünk, bemutatóink azt jelezték vissza számunkra, hogy az ARP jelenlegi eredményei és szolgáltatási portfóliója sok tekintetben műszakilag/tudományosan élvonalbelinek számít, de jól láthatók azok az irányok, amikben nagyobb és határozottabb lépéseket kell tennünk, hogy az EOSC-on keresztül a nagy európai kutatási infrastrukúrákban is helyet kapjunk és ott meg is álljuk a helyünket.