Vezető részleg
A projekt célja magyar kutatási adat repozitórium létrehozása a COVID-19 járvánnyal kapcsolatos kutatások támogatása céljából. A kutatási adat repozitórium hazai és nemzetközi szinten adattárolási és repozitórium szolgáltatásokat, valamint egyértelműen (peer-to-peer módon) szabályozott és megbízható adatmegosztást biztosít.
A rendszer épít a SZTAKI és a Wigner kutatóintézetek által működtetett MTA Cloud szolgáltatásaira mind a biztonságos adattárolás, mind pedig a jól definiált hozzáférhetőségi jogosultságok tekintetében.
Bár a repozitórium generikus, elméletileg bármely kutatói közösség számára hasznos szolgáltatásokat nyújt, előnyben részesítjük a COVID-19 járvánnyal kapcsolatos kutatók, kutató csoportok, intézmények kiszolgálását.
Az adat repozitórium fejlesztését két lépcsőben tervezzük. Az első lépcsőben megvalósul:
- Nemzetközileg megosztott, publikációhoz társított kutatási adathalmaz tárolás.
Maga a publikáció egyértelműen hivatkozhat a tárolt kutatási adatokra. A publikációhoz társított adat entitásokat individuálisan avagy összecsomagoltan szeretnék feltölteni, amely után a rendszer kicsomagolja és az adat hivatkozás alapján rendezetten tárolja el az entitásokat. - Adott tudományos közösség tudományos adatainak nemzetközi megosztása.
A kívánt repozitórium funkciók: adatentiások individuális és burst-ös feltöltése, metaadatok individuális bevitele formon keresztül és azok burst-ös feltöltése. Az adat entitások azonosítása, böngészése, kereshetősége, individuális és keresési eredmény halmazok együttes letöltése. - Kutatási adatok nyílt/zárt hosszú távú nemzetközi megosztása.
A tervezett metaadatolás teljes körű és megfelel a hosszú távú digitális tárolás elvárásainak (OAIS).
Az első lépcsőben kialakított szolgáltatás a Dataverse szoftverre épül, azt fejleszti tovább és egészíti ki a magyar igényekhez igazítva. A második lépcsőben a nyers adatok megosztására és közös előállítására, gondozására adunk megoldást. A rendszer így már a kezdetektől adja a következő szolgáltatásokat:
- Hivatkozások létrehozása adathalmazokra és fájlokra.
EndNote XML, RIS és BibTeX formátumok. - OAI-PMH (Harvesting) interfészt biztosít.
Metaadatok nyilvánossá tétele más rendszerek felé, illetve metaadatok gyűjtése. - EduID bejelentkezés támogatása.
- Schema.org JSON-LD támogatás.
Ez lehetővé teszi a Google Dataset Search szolgáltatás használatát más szolgáltatások felől. - Verziókövetés.
Az adathalmazok és fájlok változásainak listája tárolásra kerül. - Irányított keresés (Faceted search) támogatása.