Open/FAIR data

 

Publikování a sdílení dat v režimu otevřeného přístupu, který umožňuje okamžitý, bezplatný, trvalý a neomezený přístup k vědeckým výsledkům, je celosvětově stále více podporováno jak vědeckými institucemi, tak poskytovateli finanční podpory. Zpřístupnění dat dle principů FAIR neznamená zpřístupnění dat bez jakýchkoliv omezení. Cílem je následovat princip, tj. data zpřístupňovat:

„…as open as possible, as closed as necessary“
„…tak otevřeně, jak jen to je možné, tak omezeně, jak je to nezbytně nutné“.

Výzkumná data by, v souladu s touto zásadou, měla být zveřejňována v takovém rozsahu, který maximálně umožní jejich opětovné užití. Na druhou stranu ale může být zveřejnění omezeno, a to právě v rozsahu, který je nezbytný pro ochranu práv a zájmů příjemce, poskytovatele a třetích osob. Mezi tato chráněná práva a zájmy patří typicky právo na ochranu osobních údajů, ochrana bezpečnosti státu, nebo třeba zájem na monetizaci a zužitkování výzkumu institucí, která jej provedla.

Výzkumná data

Výzkumnými daty se podle Zákona 130/2002 o podpoře výzkumu, experimentálního vývoje a inovací (§ 2 Vymezení pojmů, Odstavec 2 písmeno o) rozumí „informace v elektronické podobě, které jsou shromažďovány nebo vytvářeny v průběhu výzkumu, jsou používány jako důkazy nebo které jsou obecně akceptovány výzkumnou obcí jako nezbytné k validaci zjištění a výsledků.“

Evropská směrnice o otevřených datech definuje data následovně: “Výzkumná data (údaje z výzkumu) – zahrnují statistiky, výsledky pokusů, měření, pozorování vyplývající z práce v terénu, výsledky průzkumů, jakož i zvukové a obrazové záznamy z pohovorů. Zahrnují též metadata, specifikace a jiné digitální objekty. Výzkumná data se liší od vědeckých článků, které přinášejí zprávy o zjištěních, jež jsou výsledkem vědeckého výzkumu, a tato zjištění též komentují.”

FAIR principy:

Výzkumná data by měla naplňovat FAIR principy. Tyto principy popisují, jak by data měla být zpracována, aby byla dohledatelná (Findable), dostupná (Accessible), interoperabilní (Interoperable) a opětovně využitelná (Reusable). Data by měla disponovat standardními formáty, měla by být opatřena metadaty a perzistentními identifikátory (DOI, handle).

S FAIR principy není v rozporu, pokud je přístup k datům podmíněn splněním podmínek (např. podpisem smlouvy a dodržováním smluvních omezení atp. – pokud jde o omezení, která jsou nezbytně nutná a transparentně vysvětlená např. v DMP).

1. Vyhledatelnost (to be Findable)

Pokud mají být data opětovně využitelná, pak je třeba zajistit, že je jak lidé, tak stroje budou moci najít. Pro tento účel jsou klíčová strojově čitelná metadata.

F1. (meta)datům je přiřazen jedinečný a perzistentní identifikátor (např. DOI, handle)
F2. data jsou popsána dostatečnými metadaty
F3. (meta)data jsou registrována nebo indexována v prohledávatelných zdrojích
F4. (meta)data specifikují identifikátor

2. Dostupnost (to be Accessible)

K datům by měl být zajištěn otevřený přístup, ideálně prostřednictvím repozitáře. Není-li možné zajistit otevřený přístup k vědeckým datům, pak by měla být volně přístupná alespoň metadata.

A1. (meta)data lze získat pomocí jejich identifikátorů při využití standardních komunikačních protokolů (API)
A1.1 protokol je otevřený, zdarma k dispozici a univerzálně použitelný
A1.2 protokol umožňuje v případě potřeby autentizaci a autorizaci
A2. (meta)data jsou dostupná i v případě, že data samotná již nejsou k dispozici

3. Interoperabilita (to be Interoperable)

Pro integraci s jinými datasety je vhodné použít standardizované výrazy k popisu dat.

I1. (meta)data používají pro reprezentaci znalostí formální, dostupný, sdílený a široce aplikovatelný jazyk
I2. (meta)data používají slovníky, které se řídí zásadami FAIR
I3. (meta)data obsahují odkazy na další (meta)data

4. Opětovná využitelnost (to be Reusable)

Primárním cílem FAIR principů je zvýšit znovuvyužitelnost vědeckých dat.  K dosažení tohoto cíle je důležité, aby byla data dostatečně popsaná a sdílená pod otevřenou licencí (např. Creative Commons), aby uživatelé dat věděli, jak data vznikla, co popisují a jak s nimi mohou nakládat.

R1. (meta)data mají množství přesných a relevantních atributů
R1.1 (meta)data jsou zveřejněna pod jasnou a dostupnou licencí
R1.2 (meta)data jsou spojena se svým původem
R1.3 (meta)data splňují standardy vědecké komunity pro daný obor

Zpracováno na základě podkladů z Guides for Researchers – How to make your data FAIR – stránkách podpory OpenAIRE a materiálů iniciativy GO FAIR.