Az ELKH Adatrepozitórium Platform projekt a kutatási adattárolás és megosztás országos föderált rendszere

The ELKH ARP Research Data Repository Project, National Federated Repository Network for Sharing Research Data

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Kovács László

Jegyzet elhelyezéséhez, kérjük, lépj be.!

műszaki doktor, osztályvezető

Jegyzet elhelyezéséhez, kérjük, lépj be.!

ELKH Számítástechnikai és Automatizálási Kutatóintézet Elosztott Rendszerek Osztály, Budapest

Jegyzet elhelyezéséhez, kérjük, lépj be.!

 
Összefoglalás
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az Eötvös Loránd Kutatási Hálózat Adatrepozitórium Platform projekt országos kiszolgálást nyújtó központi rendszert hoz létre, mely többek között az ELKH intézeteit szolgálja ki kutatási adatrepozitóriumi és vele szorosan integrált adat- és metaadat-kezelési szolgáltatásokkal.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az ELKH ARP-projekt alapfeladata, hogy megtervezze és megteremtse az országos föderált kutatási adatrepozitórium-hálózat központi rendszerkomponenseit, hálózati szolgáltatásait, amelyek segítségével egységes országos hálózati rendszerbe szervezhetők az ELKH meglévő és leendő kutatási adatrepozitóriumai.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A rendszer a központban biztosít kutatási adatrepozitórium (tárolási) szolgáltatást is azon intézmények és/vagy tudományágak, kutatócsoportok számára, amelyek nem tudnak, vagy nem akarnak saját kutatási adatrepozitóriumot felállítani vagy üzemeltetni.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A projekt kitűzött céljait, a létrehozandó rendszer átfogó logikai architektúráját, a rendszerkomponensek funkcióit, együttműködési mechanizmusaikat mutatom most be, valamint azt, hogy a rendszer milyen módon segíti elő a magyar kutatási adatkezelés FAIR-elveknek megfelelő szervezését.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az ELKH ARP-rendszer támogatni kívánja a kutatási adatkezelés új, FAIR-érzékeny szintjét lehetővé tévő kutatási objektum (Research Object, RO) magyarországi bevezetését és széles körű alkalmazását. A kutatási objektumok szoftveres megvalósulásának általunk használt formája az RO-Crate. Az RO-Crate kutatási objektumkezelési infrastruktúra szervesen illeszkedik a föderált kutatási adatrepozitórium-hálózat tárolási és egyéb szolgáltatásaihoz.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az ELKH ARP-repozitóriumhálózat föderációs mechanizmusai, integrált adatkezelési módozatai (protokollok és policyk) hosszú távon biztosítják az országos rendszer további fejlődése során a komponensek közötti harmonikus együttműködést adatkapcsolati, szemantikus, szervezeti szervezési és működtetési szinteken.
 
Abstract
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

ELKH ARP Research Data Repository project aims to establish a central data repository system supporting the whole ELKH research network, providing research data repository and related, integrated data- and metadata-management services.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

The mission of the ARP project is twofold: it designs and establishes the central system components and the network services of a national federated research data repository network and on the other hand creates the federated mechanisms and system components that enable to organize the existing and future research data repositories of ELKH into a single, uniform national network system.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

The system will also centrally provide research data repository services to the institutions and/or disciplines, research teams that cannot or will not establish and manage their own research data repository, filling an important gap by doing so.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

In the article we introduce the goals set by the project, the logical architecture of the system to be built, the functions and interoperability mechanisms of the system components, and the way the system facilitates the implementation of the FAIR principles in the process of managing national research data.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

The ELKH ARP system will support the introduction and widespread use of RO – Research Object, that enables the new, FAIR-sensitive level of research data management in Hungary. To achieve this, RO-Crate, the actual software implementation of the concept of RO, is fully supported within the system. The RO infrastructure that is to meet the requirements to apply RO-Crate technology in Hungary forms an integral part of the federated research data repository network (storage and other) services.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

The ELKH ARP repository network federated mechanisms, integrated data management methods (protocols and policies) will ensure, in the course of further development of the system, the interoperability between the components on data transfer, semantic, institutional, and operational levels in the long term.
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Kulcsszavak: kutatási adat, repozitórium, FAIR, kutatási objektum, RO-Crate
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Keywords: research data, repository, FAIR, research object, RO-Crate
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

DOI: 10.1556/2065.184.2023.7.3
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

 
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az Eötvös Loránd Kutatási Hálózat Adarepozitórium Platform (ELKH ARP) projekt az intézményhálózat kutatási adatkezelését támogató, új hálózati szolgáltatásrendszer alapjainak megteremtését célozza. A projekt a kutatási adatok kezelésének alapvető feltételeit, az adattárolás és adatmegosztás országos szervezeti, humán, és műszaki infrastruktúráját hozza létre.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Lehetővé válik a kutatási adatok mint értékkel bíró adatvagyon biztonságos digitális tárolása, azok használata, újrafelhasználása, másodlagos és többedleges hasznosítása a kutatási és egyéb, leginkább a gazdasági szféra számára. A kutatási adatok értékének tudatosítása, az értéknek megfelelő adekvát adatkezelési és tárolási erőforrás használat fontos és felvállalt küldetése a projektnek.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A kutatási adatok tárolásának, kezelésének fejlesztése, a szükséges know-how létrehozása és a tervezett szakmai képzés megteremti a ELKH-ban keletkező kutatási adatok jobb és hatékonyabb felhasználhatóságát. A hazai kutatási adatrepozitóriumok létrehozása és az ehhez szükséges fejlesztési és felhasználói kompetenciák kialakítása javíthatja a kutatók (európai) K+F-pályázatokban várható sikerességét.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Ezen belül is a legfontosabb a kiépülőben lévő EOSC (European Open Science Cloud) páneurópai kutatási infrastruktúrába való bekapcsolódásunk, amelyre a tervezett ELKH ARP-projekt megvalósítása nyújt lehetőséget.
 

1. A vízió: föderált kutatási adatrepozitórium-hálózat

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az ARP-projekt keretében az ELKH kutatási adatrepozitóriumait egységes hálózati rendszerbe kívánjuk fűzni. Ez az egységes rendszer az ARP-szoftverplatform által kiszolgált föderált kutatási adatrepozitórium-hálózat. Cikkemben a víziónkról és annak egyes megvalósítási lépéseiről írok.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A kutatási adatrepozitóriumok hálózatának kialakítása mellett, azok hazai alkalmazástechnológiáinak továbbfejlesztését elsősorban az alábbi részterületeken célozzuk meg:

Jegyzet elhelyezéséhez, kérjük, lépj be.!

  • a repozitóriumok, a repozitóriumi funkcionalitások kutatási munkafolyamatokba (workflow) történő integrálása;
  • a kutatási munkafolyamat során menet közben kinyerhető, a folyamatot és a felhasznált entitásokat, erőforrásokat jellemző metaadatok rögzítése, kezelése, felhasználása, megosztása;
  • az összetett kutatási objektumok (Research Objects, RO), laboratóriumi riportok, memók stb. létrehozása, megszerzése, kezelése, tárolása és felhasználása, a kutatások reprodukálhatóságának elősegítése érdekében, mind a kutatási adatok, mind pedig az alkalmazott tudományos módszerek és eljárások tekintetében.
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A kutatásba fektetett anyagi források, eszközök veszteségének hosszabb távú minimalizálását, egyben nagyobb fokú hasznosítását, illetve hasznosulását célozzuk meg.
 

1.1. Föderált repozitórium-hálózat – sematikus architektúra

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A hálózatba kötött, összekapcsolt kutatási adatrepozitóriumok hierarchiát alkotnak, melynek legalsó részén az elsődleges adattárolók (R1 - Ri, primary data repository) helyezkednek el. Az elsődleges tárolók magasabb szintű (intézményi [Ii], ágazati [Ái]) tárolókkal állnak adat- és egyéb pl. szervezeti, szervezési kapcsolatban. Bizonyos (nagy) intézmények egyben ágazati kiszolgálást célzó repozitóriumokat is üzemeltetnek. Ilyenkor az intézményi és ágazati repozitóriumok egybeeshetnek (pl. I2 = Á4).
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Jegyzet elhelyezéséhez, kérjük, lépj be.!

1. ábra. Az országos ELKH ARP föderált repozitórium-hálózat sematikus architektúrája (a szerző saját szerkesztése)
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A kutatási adatrepozitóriumok egyike a kitüntetett, és központilag létrehozott ARP-adatrepozitórium, amely ágazatfüggetlen, országos központi kiszolgálást nyújt (hiánypótlásként).

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az összekapcsolt tárolók közötti adatkapcsolat szervezett, vezérelt és kézbentartott adatátviteli lehetőség, amely egyaránt vonatkozik a tárolt adatokhoz társíott metaadatokra és a tárolt adatokra magukra. A rendszerbe kapcsolt repozitóriumok föderációja az egységesen megszervezett adatkapcsolati hálózaton alapul, de a föderációt magasabb (szemantikus és működési interoperabilitási) szinteken működő egyéb föderációs mechanizmusok is támogatják.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A föderált rendszerarchitektúra legfelső rétegében helyezkednek el az ARP-projekt központi szolgáltatásai (közös kereső, sémaregiszter, ontológiaregiszter stb. – az architektúravázlaton háromszögekkel jelölve). A háromszögek irányultsága mutatja, hogy a szolgáltatás elsősorban milyen irányokba (hálózaton belül, hálózaton kívül) szolgáltat.
 

2. ELKH ARP-platform

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az ELKH ARP-projekt keretében fejlesztjük ki az ARP-(szoftver)platformot.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az ARP-platform logikai architektúráját több forrásból (kutatói személyes interjúk, online kérdőív, szakértői háttértudás és a projekt keretében elvégzett szakmai elemzések, automatikus szoftverevaluációk stb.) származó elvárások, követelmények alapján terveztük meg, amelynek során figyelembe vettük a digitális könyvtári, repozitóriumi szakterület és a tudományos kommunikáció (scholarly communication) aktuális fejlődési trendjeit is.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A logikai architektúrában az ARP-platform részrendszereinek azonosítását és a részrendszer-funkcionalitások meghatározását rögzítettük. A részrendszerek közötti fontosabb adat- és vezérlésáramlások meghatározásával a rendszer integráltságának milyenségét határoztuk meg.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az ARP-szoftverplatform lazán (adat- és vezérléskapcsolatokkal) csatolt rendszerek integrációjával jön létre. A komponensek között preferáltan szabványos adatformátumokat használó adatátviteleket terveztünk. Az ARP saját, specifikus adatformátumainak, illetve protokollkapcsolatainak mennyisége minimalizált.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az ARP-platform bővíthetősége, új részrendszerek könnyű illeszthetősége (később, a projekt további fázisaiban) fontos tervezési szempont volt, pontosan ezért választottuk a lazán csatolt komponensekből történő rendszerépítkezést.
 

2.1. ELKH ARP-platform – főbb rendszerkomponensek

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az ARP-platform meghatározó komponensei a következők:

Jegyzet elhelyezéséhez, kérjük, lépj be.!

  1. Az ARP-adatrepozitórium a Harvard Dataverse-kódbázison alapuló, az eredeti Dataverse Repozitórium rendszer funkcionális bővítése révén létrejövő kutatási adatrepozitórium, amely központi repozitálási (tárolási) szolgáltatásokat nyújt.
  2. Metaadatséma-regiszter, az országos kutatási adatrepozitórium-hálózatban használt metaadatsémák egyértelmű definícióját kezelő, létrehozó, tároló és azokat szolgáltató rendszerkomponens.
  3. A föderált repozitóriumhálózat központi keresője. A hálózati rendszerben tárolt kutatási adatok megtalálását teszi lehetővé, bárhol is legyenek az adatok eltárolva a hálózatban.
  4. Az RO-Crate1-menedzser az RO-Crate-csomagolás formátumú kutatási objektumkezelő, a kutatási adattermékek FAIR2-elvárásoknak megfelelő objektumorientált kezelését, tárolását és felhasználását segíti elő adatcsomag- és adatfájlszintű szolgáltatásaival. (Csomagolási, metaadatolási, formátum-ellenőrzési, objektumkivonatoló adatkezelési stb. szolgáltatások.)
  5. Tudásgráf. Fenti rendszerkomponenseket a központi tudásgráf mint a komponensek között megosztott adatszerkezet kapcsolja össze, és teszi lehetővé a komponensek közötti belső kommunikációt és a rendszeren belüli szemantikusan helyes adatmegosztást.
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Jegyzet elhelyezéséhez, kérjük, lépj be.!

2. ábra. Az ELKH ARP-platform főbb központi rendszerkomponensei (a szerző saját szerkesztése)
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az ARP-platformban a központi tudásgráf mint a föderált rendszerben tárolt adatentitásokhoz társított metaadatok központi tárolója teszi lehetővé a közös keresés implementálását, ami részletes és fazettázható keresést nyújt a teljes hálózatban, különféle granulációs szinteken: a DC- (Dublin Core) metaadatséma-alapú közös globális kereséstől, a diszciplínaspecifikus sémavezérelt keresésen keresztül egészen a fájlszintű keresésig.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A rendszerben Harvard Dataverse-szoftverrendszeren alapuló tárolási, adatrepozitóriumi központi szolgáltatást terveztünk. A gazdag metaadatolást metaadatséma-regiszter és a hozzá kapcsolódó ontológiaregiszter támogatja. E két regiszterre dekomponált részrendszer lehetővé teszi a nemzetközileg elterjedt diszciplínaspecifikus metaadatsémák hazai alkalmazását a föderált repozitóriumhálózat minden kapcsolódó repozitóriumában és egyben a hazai-intézményi-ágazati specialitások mint sémaalkalmazási profilok (application profile) létrehozását és gondozását is.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az ARP-platform minden komponense támogatja a hazai bevezetésre és használatának elterjesztésére kiválasztott RO-Crate kutatási objektum adatcsomagolási implementációs technológiát, mely könnyen használható, a járatos szemantikus webtechnológiák, illetve ajánlások, szabványok használatával hoz létre kutatási objektum adatcsomagokat, egyben megfelel a jelenleg kialakítás alatt álló, az EOSC keretében is értelmezett FAIR Digital Object (FDO) magas szintű koncepcionális modell elvárásainak.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az RO-Crate csomagok szerializált mini tudásgráfokban ábrázolják az adatfájlokhoz társított metaadat-szerkezeteket. Ezeket az ARP minden általa kezelt RO-Crate-adatcsomagból kivonja, és azokat az ARP központi keresőjének tudásgráfjába integrálja. Ezáltal megteremtődik az alacsony granulációs szintű adatkereshetőség és a diszciplináris szintű specifikus keresési szolgáltatás központi támogatása. Az interdiszciplináris adatfelhasználás segítése mellett tehát az ARP-rendszer a lehető legerőteljesebben kívánja támogatni a mindennapi, diszciplínaspecifikus adatfelhasználást, megkönnyítve a kutatók saját adatállományainak saját használatát is.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A kutatási objektumok és azok RO-Crate-alapú csomagolása nem csupán a kutatási adatok mint adatentitások kezelését és gazdag metaadatolását segíti, de hosszabb távon alkalmas a teljes kutatási tevékenység archiválására is.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A kutatási tevékenységek, a humán résztvevők azonosításával, a kutatási munkafolyamatok leírásával (workflow), eredetinformációkkal stb. gazdagított metaadatolása, a FAIR adatkezelési követelmények jövőbeli várható fejlődési fázisaiban, a kutatási tevékenység reprodukálhatósága irányában lesz szükséges és elvárt alapkövetelmény akár már intézményi szinten is. Várhatóan újabb, hatékonyabb szoftvereszközök jelennek meg az RO-Crate-alapú kutatási objektum kezelésre, ami által a kutatók számára egyszerűbb lesz a kutatási adat- és metaadat-kezelés, valamint a teljes kutatási folyamat hosszú távú archiválása, reprodukálása és/vagy megosztása. Mindez a kutatásba fektetett erőforrások hatékonyabb és takarékosabb felhasználását alapozza meg.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az ARP-platform biztos jövőállóságát teremtjük meg a kutatási objektum RO-Crate-alapú technológiájának hazai bevezetésével és teljes körű országos támogatásával.
 

2.2. ARP-szolgáltatások

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az ARP-platformon központi hálózati szolgáltatásokat hozunk létre, melyek közül számos a hálózati föderáció megteremtését szolgálja. Ezek közül elsődleges a közös kereső szolgáltatás.
 
2.2.1. Közös keresés központi szolgáltatás
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az ARP-projekt központi kutatási adatkeresőt hoz létre, amely nem csupán a központi Adatrepozitóriumban elhelyezett adatcsomagokat teszi kereshetővé, de a föderált hálózat minden bekapcsolt repozitóriumában, minden hálózati csomópontban is lehetővé teszi a keresést. A központi kereső különféle adatrészletezettségi (granulációs) szinteken működik.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A föderált hálózatba kötött repozitóriumokban elhelyezett adatcsomagok egyedi metaadatsémáit közös DC- (Dublin Core) sémára képezzük le, ezáltal megteremtjük a teljes hálózatban a diszciplínafüggetlen (egyszerű) keresési lehetőséget.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A rendszer egy vagy több diszciplínaspecifikus metaadatséma kiválasztása után az ezekkel leírt adatobjektumok közötti teljes sémaalapú keresést biztosít a hálózati csomópontok mindegyikében.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A harmadik, legalacsonyabb granulációs szinten a kereső képes az adatcsomagok belsejében elhelyezett (fájlszintű) metaadatokban is keresni a korábban részletezett RO-Crate-formátumú adatcsomagok ARP-rendszerben történő belső kezelése révén.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A közös kereshetőség implementációs alapja az, hogy a központi kereső begyűjti a hálózatba kötött repozitóriumokból az ott tárolt adatentitásokhoz társított metaadatrekordokat, és egy központi tárolóban helyezi el azokat. Ez a begyűjtési folyamat a metaadat-aratás. Aratáskor a metaadatrekordokat változatlan formában gyűjtjük be. A központban a szemantikus szintű feldolgozás után a metaadatrekordok közösített adattárolóba (központi tudásgráf) kerülnek. Ezt a központi metaadat-tárolót használja a központi kereső és a többi központi rendszerkomponens is. Az aratási folyamatok ütemezése az aratandó repozitóriumok, adatállományok, metaadatfajták stb. kiválasztásával előre tervezhető, konfigurálható, a folyamat automatizált.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az ARP-projekt tehát egy országos, egyablakos keresőszolgáltatást hoz létre az eltérő granulációs szinteken az összes, a hálózatba bekötött repozitórium esetére.
 
2.2.2. Föderáció a metaadatolás tekintetében
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A kutatási adatok (újra)felhasználásához, archiválásához, az adatkezelő és feldolgozó rendszerek közötti interoperabilitás megteremtéséhez, az adatfeldolgozások gazdaságos megszervezéséhez stb. szükséges a metaadatok sémáját, legalább ágazati szinteken, szabványosítani.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A szabványosítás elektronikus támogatása érdekében az ARP-projekt létrehozza a kutatási metaadatsémák és adatformátumok digitális regiszterét (metaadatséma-regiszter), amely nem csupán a szabványosított metaadatsémák nyíltan hozzáférhető (open access) tárolója, hanem támogatja a szabványosítás kialakításának kooperatív szakértői tevékenységét is.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A metaadatsémák és adatformátumok szabványainak kialakítása esetén elsődleges követelmény a járatos, már (kvázi) szabványosított nemzetközi szabványok és ajánlások hazai adaptálása a hazai követelményekhez.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A metaadatséma, adatformátum szabványosításokhoz központilag menedzselt kutatási részterületi ontológiák, névterek, szótárak, szószedetek szabványosítását és közös, interoperábilis használatát is elősegítjük a metaadatséma és az adatformátum megosztások mellett. A központi metaadatséma-regiszter az ezekről az objektumokról szóló csoportos tudásfelhalmozást és tudáskezelést is támogatja. A metaadatséma-regiszter fontos társszolgáltatása a metaadatsémák egyértelmű dokumentálása a különféle szintű felhasználói csoportok (teljes vagy részdiszciplína, intézet, kutatócsoport, egyéni felhasználók) számára. Továbbá, újrafelhasználható, szabványos metaadatséma-leíró űrlap-definíciókat szolgáltat a potenciális gépi felhasználások számára.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Ez lehetővé teszi azt, hogy az országos rendszerbe kötött különféle repozitóriumokban azonos célra azonos vagy közel azonos (egyediesített) metaadatsémákat, alkalmazási profilokat használjanak az adatentitások metaadatolására. Ez a közös, (kvázi) szabványosított, permanens azonosítóval ellátott metaadatséma-használat biztosítja azt, hogy a teljes repozitóriumhálózatban legalább diszciplínánként kialakulhasson az adatentitás felhasználások átjárhatósága, az adatentitások megtalálhatósága és azok kompatibilis/azonos szemantikus értelmezése.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A metaadatséma-regiszter a tárolás mellett a séma kialakításához szükséges alapvető szerkesztési funkciókat is szolgáltatja, amelyekkel új sémák definiálhatók, avagy a konkrét felhasználási módokat (application profile, egyediesített séma) is meghatározhatóvá teszi.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A metaadatolás tekintetében tehát ez a központi metaadatséma-regiszter teszi lehetővé a szemantikus szintű hálózati föderáció létrejöttét. Ez azonban csak egy lehetőség, mert a központi metaadatséma-regiszter nem kényszeríti ki a regiszterben elhelyezett metaadatsémák kötelező használatát, ugyanakkor természetesen a föderált közös sémahasználatot a rendszer preferáltan támogatja.
 
2.2.3. Föderáció adatkapcsolati szinten
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A föderált hálózatba kötött kutatási adatrepozitóriumok között a rendszer biztosítja az adatentitások, metaadat-entitások alkalomszerű (ad hoc) és szervezett (előre tervezett és ütemezett) mozgatását egyedi operátori tevékenység révén, avagy előre programozott módokon.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A rendszer az adatmozgatásokat OAI-PMH3- és OAI-ORE4-protokollok segítségével végzi. Az adatmozgatás egyedi rekord szinten és/vagy nagyobb adatmennyiségeket egyben mozgatva is lehetséges, beleértve teljes, repozitóriumszintű adatmigrációs feladatokat is. Az adatmozgatás időbeli ismétlődése és periodicitása révén adatfolyamok jönnek/jöhetnek létre a föderált rendszerben.
 
2.2.4. Föderáció a működtetés tekintetében
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A hálózatba kötött repozitóriumok adatkapcsolati szintű föderációja az adatáramlások, aratási logikák, funkciók, aratási ütemezés stb. rendszerszintű konfigurálásával együttesen értelmezhető. Ezen a szinten a repozitóriumok gazdái, a repozitórumok üzemeltetését végző operátorok páros (P2P) megállapodásainak rendszere biztosítja az adatkapcsolatok megfelelő konfigurálását, a repozitóriumok közötti adatáramlások, adatfolyamok racionális megszervezését és azok folyamatos fenntartását, felügyeletét.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A föderált rendszerben értelmezett adatfolyamrendszer operátori áttekintését hálózati szintű központi adatfolyamrendszer-megjelenítés (dashboard) segíti.
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Jegyzet elhelyezéséhez, kérjük, lépj be.!

3. ábra. Az ELKH ARP-platform logikai architektúrája(a szerző saját szerkesztése)
 

2.3. ELKH ARP-platform logikai architektúra

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az ARP-rendszer részletes logikai architektúrájának ábráján (3. ábra) az adatkezelés, metaadat-kezelés és föderációkezelés funkcionális komponensei és azok fontosabb adatkapcsolatai láthatók.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az ARP-platfom közvetlen adatkapcsolatban áll az ELKH Cloud rendszerével, amely az adatok feldolgozását végzi felhőtechnológiákon alapuló szoftverrendszerek segítségével, megteremtve így a kutatási adatokra az adatfeldolgozás, az adattárolás és adatarchiválás szerves egységét, integrációját az ELKH-intézmények (és igény szerint akár egyéb hazai kutatóintézetek, egyetemek) számára.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az ARP-platform lehetővé teszi a nemzetközi kutatási infrastruktúrákhoz való közvetlen kapcsolódást adatkapcsolati, szemantikus és szervezeti szinteken egyaránt. Lehetőségeket biztosít a járatos nemzetközi hálózati szolgáltatások elérésére, kutatási adatok területén metaadatsémák, ontológiák, adatállományok, metaadat-állományok közvetlen importálására, exportálására.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A rendszer megkönnyíti a tudományos publikációk közzétételénél egyre inkább megkövetelt, a publikációkhoz tartozó repozitóriumi kutatási adatletéteket, adatpublikációkat és az adattársításokat, beleértve a folyóiratok review folyamatainak közvetlen, algoritmikusan integrált kiszolgálását (embargó, blind review stb.) is. A magyar tudományos szféra központi jelentőségű MTMT- (Magyar Tudományos Művek Tára) szolgáltatása felé kiépített kétirányú adatkapcsolati szint is ezeket segíti elő.
 

3. Összefoglalás

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az ELKH ARP-projekt keretében létrehozandó elosztott föderált hálózati rendszer a kutatási adattárolás és archiválás új minőségét (és új tárolókapacitását) teremti meg Magyarországon. Először készül egységes elvek, intézményhálózatra közös szabályok, szabványok, harmonizált technológiák alapján felépülő országos hálózati nagyrendszer egy olyan, mostanáig nagymértékben elhanyagolt területen, mint a kutatási adatok tárolása.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A kutatási adatok értékessége még az egyedi és/vagy de facto megismételhetetlen kutatások esetében sem tudatosult kellőképpen a múltban. A kutatási adatok tárolására, hosszú távú megőrzésére irányuló elvárások nem érvényesültek sem a kutatóintézet-hálózati, sem pedig az intézményi szinteken következetesen és rendszerszerűen.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A kutatási adatok egyéni és/vagy kiscsoportos birtoklása és hasznosítása nem teszi lehetővé a kutatási adatokban rejlő teljes pontenciál kiaknázását, a tudományos és persze más szférák (oktatás, gazdaság, ipar, kormányzat stb.) számára.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Különösen nehézkes a szemantikusan korrekt interdiszciplináris adatfelhasználás, az eltérő sémákkal rendelkező hibrid adatállományok összekapcsolása (linked data). Új adatfelhasználási lehetőségek, új tudományos eredményképzés végtelen tárháza nyílik meg az adatkezelés és -tárolás ezen új minőségi szintjének bevezetésével.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A kutatási adatok esetében az adatszuverenitás kérdése és koncepciója láthatóan világszerte mindenhol előtérbe került. Jól érzékelhető a nagy nemzetközi cégek versenyfutása a kutatási adatok mind nagyobb fizikai birtoklása érdekében.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A (kutatási) adatok direkt, gyors adatkapcsolati elérése lehetővé teszi az adatok gépi (akár mesterségesintelligencia-algoritmusokkal történő) (újra)feldolgozását.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A kutatási adatok másod-, harmad-, többedleges adathasznosításának gyakorlati lehetőségét csak úgy tudjuk biztosítani, ha a korábban kizárólag külhoni repozitóriumokban letárolt kutatási adatainkat – ami a nemzetközi tudományban való részvételünk érdekében elengedhetetlen továbbra is – a külhoni tárolással párhuzamosan hazai, az adatfeldolgozó rendszereink és szoftvereink számára közvetlen és elegendően nagy sávszélességű hálózati eléréssel ellátott saját adatrepozitóriumokban is letároljuk.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Ez az ún. kettős tárolási logika teszi lehetővé később a szabad adatfelhasználást, a teljes hazai adatszuverenitás megteremtését, akár a tudományon belüli, akár azon kívüli felhasználásra. E kettős tárolási logika követésének tényleges szakmai, műszaki és szervezeti lehetőségeit hozza létre, többek között, az ELKH ARP föderált adatrepozitórium-hálózat jelen projektben célzott megteremtése.
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Jegyzet elhelyezéséhez, kérjük, lépj be.!

1 RO-Crate – Research Object Crate, adatcsomagolási formátum
2 FAIR – Findable, Accessible, Interoperable, Reusable
3 OAI-PMH – Open Archives Initiative Protocol for Metadata Harvesting, Nyílt Archívumok Kezdeményezés metaadatgyűjtő protokollja
4 OAI-ORE – Open Archives Initiative Object Reuse and Exchange, Nyílt Archívumok Kezdeményezés objektumfelhasználás és -csere protokollja
Tartalomjegyzék navigate_next
Keresés a kiadványban navigate_next

A kereséshez, kérjük, lépj be!
Könyvjelzőim navigate_next
A könyvjelzők használatához
be kell jelentkezned.
Jegyzeteim navigate_next
Jegyzetek létrehozásához
be kell jelentkezned.
    Kiemeléseim navigate_next
    Mutasd a szövegben:
    Szűrés:

    Kiemelések létrehozásához
    MeRSZ+ előfizetés szükséges.
      Útmutató elindítása
      delete
      Kivonat
      fullscreenclose
      printsave