Pētniecības datu pārvaldība
Pētniecības datu pārvaldība ir nozīmīga pētniecības sastāvdaļa. Tā palīdz organizēt pētniecības procesu, nodrošina tā caurspīdīgumu un palielina pētniecības rezultātu ietekmi. Kvalitatīva pētniecības datu pārvaldība ļauj validēt un atkārtot pētījumus, kā arī veicina datu atkārtotu izmantošanu jaunos pētījumos.
Šeit atradīsiet biežāk uzdotos jautājumus par galvenajiem pētniecības datu pārvaldības aspektiem - datu dokumentēšanu un organizēšanu, personas datu un ētikas jautājumiem, pārvaldības plānu veidošanu, datu glabāšanu un koplietošanu.
Biežāk uzdotie jautājumi
- Pētniecības dati, to glabāšana un organizēšana
Kas ir pētniecības dati?
Pētniecības dati ir jebkura informācija, kas tiek ievākta, radīta, novērota vai ģenerēta pētniecības projekta gaitā un kalpo kā pamats pētniecības rezultātu iegūšanai un secinājumu izdarīšanai.
Par pētniecības datiem netiek uzskatīti tādi dati, kas nav tieši saistīti ar pētījuma zinātnisko saturu vai metodoloģiju, piemēram, administratīvie dokumenti, iekšējā vai ārējā saziņa, juridiskie dokumenti vai pētījuma publicitātes materiāli.
Kas ir datu kopa?
Datu kopa (dataset) ir strukturēts informācijas kopums, kas sastāv no savāktiem un analizējamiem datu elementiem, bieži vien sakārtotiem tabulās vai citos formātos. Datu kopu veids un forma atšķiras atkarībā no pētniecības nozares. Kvalitatīvi organizēta datu kopa ietver arī dokumentējošu un skaidrojošu informāciju, kas palīdz orientēties datu kopumā. Repozitoriju kontekstā datu kopu saprotam kā pētījuma datus un to pavadošo dokumentāciju, kas deponēti jeb pašarhivēti tiešsaistes glabātuvē.
Kas ir metadati, metadatu ieraksts un kāpēc tie ir svarīgi un kur tos apkopot?
Metadati ir dati par datiem, kas sniedz informāciju par datu kopas saturu, struktūru, izcelsmi, formātu un citiem būtiskiem aspektiem. Metadatus ieteicams apkopot ReadMe datnē vai repozitorijā izveidotā metadatu ierakstā.
Metadatu ieraksts ir strukturēts apraksts par datu kopu, kas palīdz to identificēt, saprast un atkārtoti izmantot. To izveido datu deponēšanas laikā, un tas ir paredzēts gan cilvēkiem, gan datorsistēmām saprotamā veidā (human and machine readable).
Kvalitatīvi metadati ir būtiski, lai citi pētnieki (un arī datorsistēmas) datu kopu varētu atrast, interpretēt un izmantot atkārtoti. Jo precīzāk un pilnīgāk metadati apraksta datu kopu, jo augstāka ir tās pārskatāmība, atkārtota izmantojamība un citējamība.
Kas ir ReadMe datne un kodu grāmata?
ReadMe datne ir vienkāršs teksta dokuments, kas pievienots datu kopai un sniedz pamatinformāciju par tās saturu, struktūru, izcelsmi, apstrādes soļiem un izmantošanas nosacījumiem, lai lietotāji varētu saprast un izmantot datus arī bez tieša kontakta ar autoriem. Savukārt kodu grāmata (codebook) ir detalizēts skaidrojošs dokuments, kurā aprakstīta katra datu kopas mainīgā nozīme, formāts, vērtību skaidrojums un iespējamie kodi vai klasifikācijas, kas izmantoti datu vākšanas vai apstrādes laikā.
Kāda ir labā prakse datņu un mapju nosaukumu veidošanā?
Datņu un mapju nosaukumiem jābūt īsiem, saprotamiem un konsekventiem, lai tie būtu viegli pārskatāmi un vienkārši lietojami arī ilgtermiņā. Detalizēta informācija jāiekļauj dokumentācijā vai metadatos, nevis pašā datnes nosaukumā. Mapju struktūrai jābūt loģiskai un kodolīgai, lai ceļš līdz konkrētai datnei būtu pēc iespējas īsāks – pārāk gari ceļi var radīt problēmas datņu atvēršanā, kopīgošanā vai arhivēšanā, jo dažas operētājsistēmas ierobežo kopējo ceļa garumu.
Nosaukumos ieteicams izmantot tikai latīņu alfabēta burtus (A–Z, a–z), ciparus (0–9), defises (-) un apakšsvītras (_), neizmantojot atstarpes. Datumiem vēlams lietot starptautiski atzītu formātu YYYY-MM-DD (piemēram, 2025-07-17), savukārt numerācijai izmantot divciparu kārtas skaitļus (01, 02, 03 utt.), lai datnes sakārtotos hronoloģiskā secībā arī automātiski. Nav ieteicams lietot latviešu diakritiskās zīmes (ā, ē, š utt.), citu valodu simbolus (æ, ø, å utt.) vai īpašās rakstzīmes (*, /, , ?, :, ", <, >, | u.c.), jo dažādās sistēmās tās var netikt korekti interpretētas. Datnes nosaukumā ieteicams izmantot tikai vienu punktu – tieši pirms paplašinājuma, piemēram, dati_2025-07-17.xlsx.
- Personas dati un ētika
Kas ir personas dati un īpašo kategoriju personas dati?
Personas dati ir jebkura informācija, kas tieši vai netieši identificē fizisku personu - vārds, uzvārds, e-pasta adrese, veselības dati vai IP adrese. Īpašo kategoriju personas dati (sensitīvie dati) ietver informāciju par personas rasi, etnisko izcelsmi, politiskajiem vai reliģiskajiem uzskatiem, veselību, seksuālo orientāciju, kā arī ģenētiskajiem un biometriskajiem datiem. Šādu datu apstrāde pētniecībā prasa stingrākus aizsardzības pasākumus, juridisku pamatojumu un skaidru piekrišanu.
Saskaņā ar VDAR prasībām pētniekiem jānodrošina šo datu privātuma aizsardzība visos pētniecības datu dzīves cikla posmos – no plānošanas līdz arhivēšanai. Tas ietver anonimizāciju vai pseidonimizāciju, šifrētu glabāšanu, piekļuves ierobežošanu un skaidru dalībnieku informēšanu par datu izmantošanu.
Ja pētījumā tiek apstrādāti personas dati, īpaši sensitīvi dati, vai paredzama iejaukšanās pētījuma dalībnieku privātumā, nepieciešams saņemt Pētījumu ētikas komitejas atzinumu. Atzinuma nepieciešamība jāizvērtē, ņemot vērā pētījuma specifiku un iestādes vai finansētāja noteikumus.
Kāda ir atšķirība starp datu anonimizāciju un pseidonimizāciju?
Anonimizācija ir process, kurā dati tiek pilnībā pārveidoti tā, lai vairs nebūtu iespējams identificēt konkrētu personu, pat izmantojot papildu informāciju. Savukārt pseidonimizācija ir process, kurā personas dati tiek aizvietoti ar izdomātiem identifikatoriem (pseidonīmiem), piemēram, ar unikāliem kodiem vai numuriem, saglabājot iespēju atjaunot sākotnējo informāciju, ja tas nepieciešams pētījuma mērķu sasniegšanai.
- Pētniecības datu pārvaldība
Kas ir pētniecības datu pārvaldība un kāpēc tā ir svarīga?
Pētniecības datu pārvaldība (PDP) ir sistemātiska pieeja datu plānošanai, organizēšanai un uzturēšanai visā to dzīves ciklā - no iegūšanas vai radīšanas līdz dokumentēšanai, apstrādei, īstermiņa un ilgtermiņa uzglabāšanai, kā arī koplietošanai. Laba datu pārvaldība palīdz nodrošināt datu kvalitāti, pieejamību un atkārtotu izmantojamību, kā arī atbilstību juridiskajām, ētiskajām un institucionālajām prasībām un finansētāju nosacījumiem.
Kas ir pētniecības datu pārvaldības plāns un kāpēc tas nepieciešams?
Pētniecības datu pārvaldības plāns (Research Data Management Plan) jeb DPP ir dokuments, kurā aprakstīts, kā pētniecības projekta gaitā tiks iegūta, organizēta, apstrādāta, uzglabāta, aizsargāta un kopīgota izmantotā informācija un dati. Tas palīdz nodrošināt datu kvalitāti, caurredzamību un atbilstību normatīvajiem regulējumiem, piemēram, Vispārīgajai datu aizsardzības regulai (VDAR) un ētikas prasībām, kā arī veicina efektīvu sadarbību ar kolēģiem un finansētājiem un atvieglo datu atkārtotu izmantošanu.
Kas ir FAIR principi?
FAIR principi ir vadlīnijas pētniecības datu pārvaldībai, kas nodrošina to maksimālu izmantojamību. Tie paredz, ka dati ir atrodami (Findable), pieejami (Accessible), savietojami (Interoperable) un atkārtoti izmantojami (Reusable). Tas nozīmē, ka dati tiek aprakstīti ar skaidriem un standartizētiem metadatiem, uzglabāti uzticamos repozitorijos ar skaidri noteiktiem piekļuves nosacījumiem, kā arī sagatavoti tā, lai tos varētu saprast, apstrādāt un izmantot gan cilvēki, gan datorsistēmas.
FAIR principi attiecas gan uz pašiem datiem, gan uz to metadatiem, un to mērķis ir veicināt datu izmantojamību, taču tas nenozīmē obligātu publiskošanu - piekļuve datiem var būt arī ierobežota, ja to nosaka juridiski, ētiski vai citi pamatoti apsvērumi.
Kas ir versiju kontrole?
Versiju kontrole nozīmē, ka visas izmaiņas datnēs, skriptos vai dokumentācijā tiek pārskatāmi saglabātas, lai jebkurā brīdī varētu atgriezties pie iepriekšējām versijām un saprast, kas, kad un kāpēc mainīts. Tas palīdz izvairīties no kļūdām, saglabā darba caurspīdīgumu un atvieglo sadarbību komandā, īpaši tad, ja vairāki cilvēki strādā ar vienām datnēm. Lai to īstenotu, var izmantot vienkāršus paņēmienus, piemēram, datņu versijas ar datumiem un komentāriem, vai arī rīkus kā git vai GitHub, kas automātiski seko līdzi visām izmaiņām.
- Datu glabāšana un koplietošana
Kā uzglabāt pētniecības datus droši?
Pētniecības datus ieteicams uzglabāt drošās un šifrētās vidēs, kas nodrošina piekļuves kontroli, piemēram, institūcijas uzturētos serveros vai autorizētos mākoņpakalpojumos (Nextcloud, SharePoint) īstermiņā un uzticamos datu repozitorijos (RSU Dataverse, DataverseLV) ilgtermiņā. Svarīgi arī regulāri veidot rezerves kopijas, lai novērstu datu zudumu, un ievērot piemērojamās datu aizsardzības prasības, tostarp VDAR.
Kas ir datu repozitoriji un kā tos izvēlēties?
Datu repozitoriji ir tiešsaistes glabātuves jeb digitālas platformas, kas paredzētas pētniecības datu drošai ilgtermiņa uzglabāšanai, organizēšanai, koplietošanai un atkārtotai izmantošanai. Tie nodrošina piekļuvi ne tikai pašiem datiem, bet arī pievienotajiem metadatiem, veicinot datu pārvaldības labās prakses ievērošanu.
Pētniecības datus iespējams deponēt institucionālajos repozitorijos, piemēram, ZDIS Pure, RSU Dataverse, nacionālajā repozitorijā DataverseLV, kā arī citos starptautiskos vai nozaru repozitorijos, piemēram, Zenodo, Figshare vai Dryad.
Izvēloties repozitoriju, ieteicams pārliecināties par tā uzticamību - vai tas ir reģistrēts re3data.org un sertificēts ar CoreTrustSeal. Uzticami repozitoriji nodrošina ilgtermiņa pieejamību, DOI piešķiršanu, metadatu standartus un atbalstu normatīvo, ētisko un finansētāju prasību ievērošanai.
Pirms datu deponēšanas tie jāsagatavo strukturētā formātā un jāpapildina ar kvalitatīviem metadatiem, ievērojot konkrētā repozitorija prasības attiecībā uz formātiem, aprakstiem un piekļuves nosacījumiem.
Kas ir DOI?
DOI (Digital Object Identifier) ir pastāvīga burtciparu virkne, ko izmanto digitālu objektu, piemēram, zinātnisku rakstu, datu kopu vai grāmatu, unikālai identificēšanai. Tas nodrošina ilgtermiņa un nemainīgu piekļuvi konkrētam objektam, pat ja mainās tā interneta adrese (URL). DOI sistēma atvieglo informācijas meklēšanu, piekļuvi un precīzu citēšanu pētniecības procesā.
Kā rīkoties, ja nevēlos dalīties ar saviem pētniecības datiem?
Labās prakses princips ir tāds - datiem jābūt tik atvērtiem, cik iespējams, un tik ierobežotiem, cik nepieciešams.
Datu koplietošana veicina pētniecības caurspīdīgumu un atkārtojamību, tomēr datu atvēršana nav obligāta visos gadījumos. Ja nevēlēšanās dalīties balstīta uz pamatotiem iemesliem, piemēram, sensitīva informācija, juridiski vai ētiski ierobežojumi, FAIR principi pieļauj ierobežotu piekļuvi, saglabājot metadatus publiski pieejamus un norādot piekļuves kārtību.
Nepamatota atteikšanās dalīties ar datiem neatbilst labajai pētniecības praksei, un daudzos gadījumā minimālu datu pārredzamību pieprasa arī finansētāji, institūcijas un žurnāli. Ja datu atvēršana tomēr nav iespējama, tos var deponēt ar ierobežotu piekļuvi, piemēram, RSU Dataverse, kā arī izmantot anonimizāciju vai šifrēšanu, nodrošinot datu drošību bez to pilnīgas publiskošanas.
Cik ilgi pētniecības dati jāsaglabā pēc projekta beigām?
Pētniecības datu uzglabāšanas ilgums ir atkarīgs no pētījuma veida, finansētāja prasībām, institūcijas noteikumiem un juridiskajām prasībām. Parasti ieteicams datus saglabāt vismaz trīs līdz piecus gadus pēc to pēdējās izmantošanas reizes, taču, ja tiem ir ilgtspējīga vērtība, piemēram, klīniskiem pētījumiem, glabāšanas laiks var būt desmit gadi vai vairāk.
Kontakti konsultācijām par pētniecības datu pārvaldību
- Pētniecības datu pārvaldība - RSU Datu kuratoru vienība, datukuratori
rsu[pnkts]lv (datukuratori[at]rsu[dot]lv) - Personas datu apstrāde un saistītie jautājumi - Datu drošības un pārvaldības nodaļa, personu[pnkts]dati
rsu[pnkts]lv (personu[dot]dati[at]rsu[dot]lv) - Kvantitatīvo datu apstrāde (R, STATA, IBM SPSS, REDCap), kvantitatīvo datu statistiskā apstrāde, kvalitatīvo datu apstrāde ar NVivo - Statistikas mācību laboratorija, statistika
rsu[pnkts]lv (statistika[at]rsu[dot]lv) - Ar psihometrisko instrumentu adaptāciju un izstrādi saistītie jautājumi - Psiholoģijas laboratorija, tar
rsu[pnkts]lv (tar[at]rsu[dot]lv) - Medicīnisko pētījumu ētisko aspektu izvērtēšana - Pētījumu ētikas komiteja, pek
rsu[pnkts]lv (pek[at]rsu[dot]lv) - Simulāciju tehnoloģijas - Medicīnas izglītības tehnoloģiju centrs, mitc
rsu[pnkts]lv (mitc[at]rsu[dot]lv ) - Citi RSU piedāvātie pētniecības pakalpojumi - https://www.rsu.lv/petnieciba/petniecibas-pakalpojumi
Saistītās ziņas
Noslēdzies sešu nedēļu ilgais Kultūras datu vizualizācijas hakatonsPētniecības datu pārvaldība, Pētniecība