Pārlekt uz galveno saturu

Pētniecības datu pārvaldība ir neatņemama un nozīmīga pētniecības sastāvdaļa. Tā palīdz organizēt pētniecību un padara to caurspīdīgāku, kā arī palielina pētniecības rezultātu ietekmi. Pētniecības datu pārvaldība palīdz validēt un atkārtot pētījumus, ļauj atkārtoti izmantot datus jauniem pētījumiem.

Šeit jūs varat iepazīties ar FAIR principiem un izprast galvenos pētniecības datu pārvaldības posmus. Zemāk redzami skaidrojumi par FAIR principiem, to ieviešanu, RSU institucionālo pētniecības datu repozitoriju Dataverse, datu pārvaldības plāniem, kā arī praktiski padomi par pētniecības datu FAIRificēšanu, t. i., pētījumu datu sagatavošanu saskaņā ar FAIR principiem.

Kas ir FAIR principi

FAIR principi tika formulēti 2014. gadā, lai izgaismotu virzienu datu izstrādātājiem un izdevniecībām. Mērķis ir nodrošināt, ka pētniecības datus var izmantot pēc iespējas plašāk – paātrināt zinātniskos atklājumus un sniegt labumu sabiedrībai šajā procesā. FAIR principi ir principu kopums, lai padarītu datus atrodamus, pieejamus, sadarbspējīgus un atkārtoti izmantojamus.

Avots

Ievērojot FAIR principus datu pārvaldības procesā, varat palīdzēt uzlabot pētījumu ietekmi.

  • Palīdzēt kolēģiem un arī sev nākotnē izprast attiecīgo pētniecības projektu un datus
  • Veicināt datu apmaiņu un sadarbību
  • Palielināt pētījumu redzamību, kas pavairotu citēšanu
  • Uzlabot pētījumu caurspīdīgumu, uzticamību un reproducējamību
  • Novērst datu zudumu

Tādējādi

  • pavairot pašas datu kopas un savas pētniecības citējamību,
  • uzlabot pētījumu reproducējamību,
  • nodrošināt atbilstību pētniecības finansētāju un izdevniecību prasībām.

Nodrošinot datu atbilstību FAIR principiem, arī turpmāk varēsiet viegli atrast, piekļūt un atkārtoti izmantot savus datus. Jūs, iespējams, esat pirmais un svarīgākais labuma guvējs savu datu veidošanā atbilstīgi FAIR principiem.

Avots

Atrodami

Tas nozīmē, ka datus var atklāt gan cilvēki, gan mašīnas, piemēram, veidojot jēgpilnus metadatus un atslēgvārdus, kas pieejami meklētājprogrammām un pētniecības datu katalogiem. Dati ir atrodami ar unikāliem un pastāvīgiem identifikatoriem (piemēram, DOI vai rokturiem), un metadati ietver aprakstīto datu identifikatoru.

Pieejami

Tas nozīmē, ka dati tiek arhivēti ilgtermiņa glabāšanai un tos var darīt pieejamus, izmantojot standarta tehniskās procedūras. Tas nenozīmē, ka datiem jābūt pieejamiem visiem, bet ir jābūt pieejamai informācijai par to, kā datus var izgūt (vai nevar). Piemēram, dati var būt apzīmēti ar Piekļuve tikai ar autora tiešu atļauju un ietvert autora kontaktinformāciju. Tomēr ideālā gadījumā informāciju par datu pieejamību var lasīt arī ar mašīnām, piemēram, izmantojot mašīnlasāmas standarta licences.

Sadarbspējīgi

Tas nozīmē datu apmaiņu un izmantošanu dažādās lietojumprogrammās un sistēmās – arī nākotnē, piemēram, izmantojot atvērtos failu formātus. Tas nozīmē arī to, ka datus var integrēt ar citiem datiem no tās pašas vai no citām pētniecības jomām. Tas ir iespējams, izmantojot metadatu standartus, standarta ontoloģijas un kontrolētas vārdnīcas, kā arī saites starp datiem un citiem digitālās izpētes objektiem.

Atkārtoti izmantojami

Tas nozīmē, ka dati ir labi dokumentēti un sakārtoti un sniedz bagātīgu informāciju par datu izveides kontekstu. Datiem jāatbilst kopienas standartiem un par tiem sniegti skaidri nosacījumi, kā tiem var piekļūt un tos izmantot atkārtoti, vēlams, piemērojot mašīnlasāmas standarta licences. Tas ļauj citiem vai nu novērtēt un apstiprināt sākotnējā pētījuma rezultātus, tādējādi nodrošinot datu reproducējamību, vai izstrādāt jaunus projektus, pamatojoties uz sākotnējiem rezultātiem, citiem vārdiem sakot, datu atkārtotu izmantošanu. Atkārtoti izmantojami dati veicina sadarbību un ļauj izvairīties no dubultām pūlēm.

Kā sākt. Trīs viegli soļi

1. Sāc ar datu pārvaldības plānu (DMP)

DMP ir dzīvs dokuments, kurā jūs norādāt, kāda veida datus jūs izmantosiet savā pētniecības projektā un kā jūs tos apstrādāsiet, glabāsiet un arhivēsiet. Datu pārvaldības plāna sagatavošana ir pirmais solis, kas jāveic, lai dati atbilstu FAIR principiem. Tā ir arī prasība no finansēšanas institūcijām. RSU nodrošinās DMP veidni Argos (instrukcijas par piekļuvi RSU DMP veidni tiks nodrošinātas, tiklīdz tā tiks publicēta Argos).

2. Apraksti un dokumentē datus

Lai dati būtu atrodami, tie jāapraksta ar atbilstīgiem metadatiem. Metadatos var iekļaut atslēgvārdus, atsauces uz saistītiem dokumentiem, pētnieku ORCID identifikatoriem un pētniecības grantu numuriem.

Lai dati būtu atkārtoti izmantojami, tiem jāpievieno dokumentācija, kurā aprakstīts, kā dati tika izveidoti, strukturēti, apstrādāti utt.

Ja jums ir jautājumi par metadatiem un dokumentāciju, sazinieties pa e-pastu datukuratoriatrsu[pnkts]lv, un mēs labprāt jums palīdzēsim un sniegsim padomu.

Minimālo metadatu aptauja datu deponēšanai RSU Dataverse

3. Padari datus pieejamus uzticamā repozitorijā

Ja izvēlaties repozitoriju, kas piešķir pastāvīgu identifikatoru gan datiem, gan metadatiem, pievieno metadatus datiem saskaņā ar standarta metadatu shēmām, nodrošina datus ar licenci, nodrošina piekļuvi datiem un metadatiem, izmantojot atvērtu un standarta saziņas protokolu (piemēram, http vai XML), tad jūsu dati atbildīs daudziem, ja ne lielākajai daļai no FAIR principiem.

RSU nodrošina RSU Dataverse, kas atbilst visiem šiem nosacījumiem. RSU pētnieki var izmantot datu kopu Dataverse līdz 50 GB lielumā bez maksas (plašāka informācija tālāk tekstā).

Datu pārvaldības plāns

Tā kā pēdējos gados visās pētniecības finansēšanas programmās ir prasības par DMP izstrādi, tie būs nepieciešami arī projektiem, kuri finansēti no Latvijas valsts budžeta, kā arī finansējumam no Horizon Europe ietvarprogrammas. Projekta gadījumā nepieciešams pārskatīt finansējšās institūcijas konkrētas vadlīnijas datu pārvaldības plānošanai.

RSU projektiem, kā arī projektiem, kuros finansējuma aģentūra nepiedāvā savu veidni, RSU pētniekiem jāizmanto RSU DMP veidne, kas aptver visus galvenos pētniecības datu pārvaldības aspektus (instrukcijas par piekļuvi RSU DMP veidni tiks nodrošinātas, tiklīdz tā tiks publicēta Argos).

RSU DMP veidnes sadaļas

  • Datu kopsavilkums
  • FAIR dati
  • Resursi un drošība

Lai iegūtu vairāk informācijas, sazinieties pa e-pastu datukuratoriatrsu[pnkts]lv.

Metadati

"Dati par datiem"

Metadati ir strukturēts datnes satura apraksts, kas vienkāršo šo datnes atrašanu un izmantošanu.

Metadati ir nepieciešami, lai būtu iespējams atrast publicētās datu kopas, ņemot vērā nozarē pieņemtus rādītājus, kā arī rādītājus par datu izstrādes vietu, valodu, finansējuma avotu un citiem nozīmīgiem parametriem. Detalizēti un labi izstrādāti metadati palīdz izmantot un interpretēt datu kopu, kā arī atklāt sinerģijas ar citām datu kopām. 

Metadatus var iedalīt divos paveidos:

  • Metadati, kas sniedz pārskatu par datu kopu. Šādi metadati palīdz cilvēkiem atrast datus tīmekļa meklētājos, datu repozitorijos vai vietnēs, kur ir publicēti katalogi no repozitorijiem
  • Metadati, kas sniedz informāciju par specifiskām datu kopas detaļām. Šādi metadati palīdz izmantot datus efektīvi, palīdzot saprast dažādos elementus, kā arī izprast ierobežojumus.

Avots

RSU Dataverse

RSU Dataverse ir institucionālais pētniecības datu repozitorijs, kas izveidots, balstoties uz atklātā pirmkoda programmatūru, ko nodrošina Hārvarda Dataverse.

dataverse_r_project.png

Dataverse ir viens no populārākajiem akadēmiskās pētniecības datu repozitoriju veidiem pasaulē, to regulāri atjaunina, lai tas kļūtu pieejamāks pētniekiem un arī mašīnām. Dataverse ietver visus nepieciešamos protokolus, lai saglabātu datu kopas pēc iespējas atbilstošāk FAIR principiem. RSU Dataverse ir reģistrēta Pētniecības datu repozitoriju reģistrāOpenAIRE un EOSC kā resurss vai pakalpojums pētniecības datu deponēšanai. Tādējādi RSU Dataverse kļūs pieejamāks pētniekiem visā Eiropā, kā arī veicinās sadarbību, datu apmaiņu, monitoringu un mašīnlasāmību.

RSU Dataverse sadaļas

  • Medicīna
  • Sabiedrības veselība
  • Sociālās zinātnes

RSU Dataverse ir izveidota, lai RSU pētnieki varētu tur deponēt savus datus pēc pētniecības projektu vai pētnieciskās darbības noslēguma, it sevišķi gadījumos, kad nav atbilstoša un uzticama attiecīgās jomas repozitorija. Datu kopas, kas tiek glabātas RSU Dataverse, var būt brīvi pieejamas vai ar ierobežotu vai slēgtu piekļuvi. Lai sadarbotos un koplietotu datu kopas, vienmēr ir iespējams sazināties ar datu kopu autoriem.

Lai deponētu datus RSU Dataverse, rakstiet uz dataverseatrsu[pnkts]lv, īsi aprakstiet datu būtību un citus ar to saistītus būtiskus aspektus:

  • lai ievietotu datu kopas Dataverse, tās jāsūta uz dataverseatrsu[pnkts]lv, vai arī jānodrošina to droša pieejamība kādā no pieejamajiem pakalpojumiem;
  • lai ievietotu datu kopu Dataverse, jāaizpilda minimālā metadatu anketa (to iespējams vēlāk papildināt);
  • publicēt var dažādu veidu* datu kopas (gan tabulāros datus, gan audio un video ierakstus, gan interviju vai fokusgrupu diskusiju atšifrējumus);
  • nepieciešams sagatavot arī kodu grāmatu (codebook), lai aprakstītu datu kopā izmantotās pieejas datu standartizēšanai.

Maksimālais deponējamo datu apjoms ir 50 GB. Gadījumos, kad datu kopa pārsniedz šo apjomu, sazinieties pa e-pastu datukuratoriatrsu[pnkts]lv, lai atrastu piemērotāko iespēju datu uzglabāšanai.

Lai pieslēgtos RSU Dataverse, RSU darbinieki var izmantot RSU autentifikāciju. Ja esat autors vai līdzautors, jums tiks piešķirta pilna piekļuve savām datu kopām. Arī pētnieki ārpus RSU var reģistrēties, un RSU Dataverse administrators novērtēs jums doto piekļuves līmeni.

* Izņēmums ir genoma un sekvencēšanas jēldati.

Ko darīt, ja nevar dalīties ar saviem datiem

Datiem nav obligāti jābūt atklātiem, lai tie atbilstu FAIR principiem. FAIR principi pieļauj kontrolētu piekļuvi, kas var būt svarīga dažiem datu veidiem (piemēram, medicīniskajiem datiem). Pamatprincips vienmēr ir tāds, ka datiem jābūt tik atvērtiem, cik iespējams, un tik slēgtiem, cik nepieciešams. Ja datus nevar atvērti koplietot, jo tie ir pārāk sensitīvi, tad FAIR pieeja būtu padarīt publiski pieejamus tikai metadatus un sniegt informāciju par nosacījumiem, lai piekļūtu pašiem datiem.

Gadījumos, kad datus nevar koplietot, nepieciešams sīkāk paskaidrot iemeslu, un papildus var ievietot šifrēto failu, kura atslēga ir tikai pie pētnieka vai finansējošās institūcijas. RSU Dataverse ļauj iesniegt datus arī ar ierobežotu vai slēgtu piekļuvi, tādējādi nodrošinot datu drošību.

Tomēr labā pētniecības praksē ir procedūras datu anonimizēšanai, kā arī ir vairāki rīki un rokasgrāmatas (piemēram, Amnesia un R Anonymizer pakotne). Var apskatīt arī tādus kursus kā šis.

Eiropas atvērtās zinātnes mākonis

Eiropas atvērtās zinātnes mākonis (EOSC) ietver daudz pakalpojumu, tostarp pētniecības datu repozitorijus, lietojumprogrammatūras risinājumus un apmācību pasākumus. Nākotnē ir paredzēts, ka EOSC nodrošinās padziļinātu integrāciju starp tur reģistrētajiem pakalpojumiem, kā arī iespējas veidot kopienas, kas koplieto un sinhronizē savus pētniecības datus un citus pakalpojumus.

eosc_newlogo_website.png

Svarīgi atzīmēt, ka EOSC pašlaik ir izstrādes procesā, otrajā posmā, kam sekos trešais posms.

Lai izpētītu EOSC sniegtās iespējas, var apmeklēt šādas vietnes:

EOSC portāla katalogs un tirgus – sākuma punkts, lai redzētu piedāvātos pakalpojumus un resursus pētniekiem,

apmācību un video materiāli – video un apmācību materiāli par dažādiem līdzekļiem portāla lietotājiem,

praktiski piemēriEOSC praksē un labās prakses stāsti par to, kā atbalstīt pētnieku un inovatoru ikdienas darbu,

pasākumi – EOSC regulāri rīko pasākumus gan zinātniekiem, gan pakalpojumu nodrošinātājiem, pasākumi ir vai nu ar apmācību mērķi vai sadarbībai starp dažādām iesaistītajām pusēm.

Datu aizsardzība

Ja pētījumā tiek iegūti un apstrādāti personas dati, piemēram, dati par veselību, ģenētiku, dati no pacienta medicīniskās dokumentācijas, tad pētījuma īstenošanas laikā jāievēro sekojoši personas datu apstrādes drošības nosacījumi:

  • Pirms pētījuma uzsākšanas jāvelta pietiekams laiks pētījuma plānošanai – jāpārdomā visas pētījumā izmantotās apstrādes metodes, datu glabāšanas vieta, ilgums u.c. drošības pasākumi. Nepieciešamības gadījumā lūgums konsultēties ar RSU Datu drošības un pārvaldības nodaļas datu speciālistu A. M.Pilmani, +371 67409165, annamarija[pnkts]pilmaneatrsu[pnkts]lv (annamarija[dot]pilmane[at]rsu[dot]lv).

  • Pētījumam, kurā tiek apstrādāti personas dati, jānodrošina sekojoši dokumenti – pētījuma protokols, pētījuma dalībnieka informētā piekrišana, attiecīgam aprakstam datu pārvaldības plānā, atbilstošas pētījuma ētikas komitejas atļauja vai citas iestādes atļauja, ja nepieciešams. Papildu informāciju par dokumentiem un atļaujām var iegūt šeit.

Vairāk informācijas

Atvērtās zinātnes grāmata (Foster Open Science)

Skaidrojums FAIR principiem (Go-FAIR)

Atvērtās zinātnes resursi (Foster Open Science)

OpenAire

Latvijas atvērtās zinātnes stratēģija 2021.–2027. gadam

Eiropas Savienības Atvērtās zinātnes stratēģija

Atvērtās zinātnes materiāls datu izvērtēšanai atbilstoši FAIR principiem (Foster Open Science)