Pārlekt uz galveno saturu

Šeit atradīsiet ieteikumus un noderīgus piemērus par to, kā datus padarīt atbilstošus FAIR principiem. To ievērošana sākas ar datņu sagatavošanu un pareizu organizēšanu, izmantojot vēlamos datņu formātus, kā arī raksturojot datu kopu tiek ar nepieciešamajiem metadatiem. Atkarībā no pētījuma drošības un ētikas apsvērumiem pētniekam ir jāizvērtē, kurus datus publicēt un kurus - nē. Pēc datu publicēšanas ir ieteicams tos saistīt ar zinātniskiem rakstiem un citiem pētījumu rezultātiem, tādējādi dati iegūst lielāku redzamību, bet raksti - ticamību. Tāpat šeit apkopotas noderīgas saites, lai uzlabotu pētniecības datu pārvaldības zināšanas un prasmes, kā arī atrastu labās prakses piemērus.

Pētniecības datu dzīves cikls

Pētniecības datu dzīves cikls ietver šādus posmus:

  • Pētījuma plānošana - pirms datu vākšanas tiek noteikti pētījuma mērķi, izvēlētas metodes un pārdomāti datu uzglabāšanas, koplietošanas un ētiskie apsvērumi, kā arī atbilstības finansētāja un institucionālajām prasībām.
  • Datu vākšana - dati tiek iegūti, piemēram, veicot eksperimentus, novērojumus, aptaujas vai simulācijas, balstoties uz iepriekš noteikto metodiku.
  • Datu apstrāde - neapstrādātie dati tiek tīrīti, formatēti un sakārtoti analīzei.
  • Datu analīze - izmantojot statistikas, skaitļošanas vai kvalitatīvās metodes, tiek iegūtas atziņas un secinājumi.
  • Datu glabāšana - dati tiek droši uzglabāti, piemērojot atbilstošus dublēšanas un piekļuves kontroles protokolus, lai nodrošinātu datu integritāti, kvalitāti un novērstu datu zudumus.
  • Datu kopīgošana - dati tiek padarīti pieejami citiem, publicējot tos digitālās krātuvēs vai kontrolētas piekļuves sistēmās (atkarībā no to sensitivitātes), sniedzot iespēju pārbaudīt, apstiprināt, izmantot vai atkārtot pētījuma rezultātus.
  • Atkārtota izmantošana un saglabāšana - dati tiek atkārtoti izmantoti jaunos pētījumos vai arhivēti ilgtermiņa saglabāšanai.
Datņu formāti

Datņu formāta izvēle ir ļoti svarīgs solis, lai nodrošinātu datu lasāmību un izmantojamību arī nākotnē. Daži formāti nodrošina labākas iespējas ilgtermiņa saglabāšanai nekā citi, ja tie:

  • nav komerciāli, tātad nav atkarīgi no konkrētas programmatūras licences, kas var mainīties vai pazust;
  • ir atvērti un balstīti uz labi dokumentētiem starptautiskiem standartiem, kas nodrošina labi saprotamu datu struktūru un nozīmei arī pēc gadiem;
  • izmanto universālu rakstzīmju kodējumu, piemēram, Unicode - UTF-8, lai izvairītos no problēmām ar speciālām zīmēm vai valodām;
  • nav saspiesti vai izmanto vienkāršu un atgriežamu saspiešanas metodi, kas ļauj nezaudēt datus un tos pilnībā atjaunot.

Vairāk par datu sagatavošanu un formātiem (angļu valodā) iespējams uzzināt šeit.

Datu sagatavošana

Izklājlapas ir viens no biežāk izmantotajiem rīkiem datu apkopošanai un apstrādei, tomēr, ja šādi faili nav pārdomāti, tie var kļūt grūti lasāmi gan cilvēkiem, gan datorprogrammām. Lai palielinātu šādu datu pieejamību un atkārtotu izmantojamību, nepieciešams ievērot sevišķus labās prakses soļus.
Ieteicams:

  • piešķirt katrai kolonnai īsu, aprakstošu virsrakstu, kas raksturo tajā esošos datus;
  • izmantot vienu galvenes rindu un pārliecināties, ka tabula sākas jau no pirmās šūnas - “A1”;
  • iekļaut virsrakstu un apzīmējumu skaidrojumu, lai aprakstītu katru izklājlapu;
  • saglabāt katru datni ar nosaukumu, kas atbilstoši atspoguļo tās saturu;
  • ja datu kopa sastāv no vairākām tabulām vai darblapām, deponēt katru no tām kā atsevišķu datni.

Nav ieteicams:

  • iekļaut izklājlapā diagrammas, komentārus vai vairākas tabulas vienlaicīgi;
  • izmantot krāsu kodēšanu, jo datorsistēmas to nespēj interpretēt;
  • lietot speciālus (ne burtciparu) simbolus, tostarp komatus;
  • veikt šūnu sapludināšanu, jo tas var radīt sarežģījumus konvertēšanas brīdī;
  • deponēt vairākas darblapas vienā datnē, piemēram, programmā Microsoft Excel, jo CSV un TAB formāti to neatbalsta.

Open Research Europe Open Data, Software and Code Guidelines

Visdrošāk datus saglabāt un deponēt CSV vai TAB formātā, jo tie ir vienkārši, atvērti un plaši atbalstīti. Ja izklājlapā ir mainīgo apzīmējumi, kodu apzīmējumi vai definētas trūkstošas vērtības, piemērotāk būs izmantot SAV, SAS vai POR formātus, definējot mainīgo nosaukumus angļu valodā.

Vairāk par datu organizēšanu izklājlapās (angļu valodā) iespējams uzzināt šeit.

Datu tīrīšanas skripts izmantošanai programmatūrā R

Datu aprakstīšana un dokumentēšana

Lai pētniecības rezultāti būt uzticami un atkārtojami, datus nepieciešams dokumentēt un rūpīgi aprakstīt. Sagatavoto dokumentāciju nepieciešams deponēt līdzās datiem. Tajā jābūt iekļautai informācijai, kas paskaidro, kā dati radīti, strukturēti un interpretējami.

Dati jākodē, izmantojot mainīgos, piemēram, skaitliskos apzīmējumus. Tam palīdz starptautiski atzītas klasifikācijas, ko parasti izmanto konkrētās nozares pētnieki. Izmantojot šādus standartus, dati kļūst vieglāk pieejami, saprotami un izmantojami arī ārpus institūcijas vai valsts. Tomēr jāņem vērā, ka ne vienmēr jau esošās klasifikācijas būs piemērotas konkrētam pētījumam - šādā gadījumā nepieciešams sniegt detalizētu savas pieejas aprakstu. Arī to nepieciešams pievienot deponēt kopā ar datu kopu, lai izvairītos no neprecīzas datu interpretācijas.

Visbiežāk kopā ar datiem tiek publicēti šādi dokumentu veidi (bet ne tikai):

  • metodoloģijas apraksti - pētījuma dizains, izmantotās metodes, datu vākšanas vai ģenerēšanas process;
  • kodu grāmatas (codebooks) - datu tehniskais apraksts, izmantotie mainīgie un skaitļi, to vērtību skaidrojums, datu struktūra un cita kontekstuāla informācija atkarībā no pētniecības nozares;
  • anketas - īpaši aptaujas datu gadījumā ir svarīgi pievienot anketu datnes, lai redzētu formulētos jautājumus;
  • laboratorijas piezīmes un eksperimentālie protokoli – detalizēti ieraksti par eksperimentu norisi;
  • ar programmatūru saistīta dokumentācija - ja dati apstrādāti ar mazāk zināmu vai atvērta pirmkoda programmatūru, ieteicams pievienot aprakstu un kodu;
  • ReadMe datne - vienkāršs teksts ar norādījumiem, kā izmantot datus un reproducēt pētījumā pielietoto datu analīzi (ReadMe datnes piemērs).

Lielu projektu gadījumā pētnieki var publicēt arī informāciju par izmantotajām taksonomijām/ontoloģijām (ja tās vēl nav publiski pieejamas), dažāda veida kartējumiem (gadījumos, kad ir daudz datņu), kontekstuālo informāciju, kas apraksta projektu un politikas, kas saistītas ar pētniecības tēmu utt. Jāņem vērā, ka dažādās pētniecības nozarēs pastāv atšķirīga prakse attiecībā uz dokumentāciju un nepieciešamajiem papildu materiāliem.

Datņu nosaukšana un organizēšana

Pareizi izstrādāta datņu nosaukšanas un organizēšanas sistēma ir viens no pamatiem, lai pētījuma dati būtu pārredzami, viegli pārvaldāmi un atkārtoti izmantojami. Īpaši būtiski tas ir strādājot ar vairākiem projektiem vienlaikus un/vai apstrādājot lielu datu apjoms.

Datņu struktūrai un nosaukumiem jābūt:

  • atšķiramiem, cilvēkam lasāmiem un saprotamiem - tādiem, kas atspoguļo saturu;
  • konsekventiem, vēlams, datorsistēmām saprotamiem;
  • sistemātiskiem, ar pārdomātu pieeju datņu organizēšanai mapēs;
  • datorlasāmiem, izvairoties no semantisku elementu atkārtošanās;
  • atbilstošiem formātam, t.i., ar paplašinājumiem, kas precīzi norāda datnes tipu.

Katrai datnei un datu kopai ieteicams norādīt:

  • vienu īsu un kodolīgu virsrakstu, kas apraksta datnes saturu;
  • detalizētāku apzīmējumu aprakstu, tostarp izmantoto akronīmu un apzīmējumu skaidrojumus, lai datnes būtu viegli atšķiramas;
  • numerāciju, sākot ar “01”, piemēram, “01_ReadMe”.

Šāda pieeja atvieglo orientēšanos datu kopā ne tikai konkrētajā pētījumā iesaistītajiem pētniekiem, bet arī sadarbības partneriem un vēlāk citiem pētniekiem, kuri vēlēsies atkārtoti izmantot pētījuma datus.

Lai nosaukumi būtu vienkārši un stabili ilgtermiņā, ieteicams:

  • neizmantot atstarpes, aizstājot tās ar pasvītrojuma zīmēm (kodu_gramata), defisēm (kodu-gramata) vai lielajiem sākuma burtiem (KoduGramata);
  • izmantot tikai latīņu alfabēta burtus (A–Z, a–z), izvairotiess no diakritiskajām zīmēm (Āā, Čč, Ēē, Ģģ utt.), citu valodu simboliem (Ææ, Øø, Åå, Öö, Ää utt.) vai īpašajām rakstzīmēm (*, /, ?, :, ", <, |, %, #, [, { u.c.);
  • norādīt datumus pēc starptautiskas konvencijas - YYYY-MM-DD (2017-10-25);
  • pārliecinieties, ka datnes nosaukums oriģinālajā formātā sakrīt ar deponēšanai vēlamā formāta datni.

Veids, kādā organizējamas datnes, ir atkarīgs no to tipa un pētniecības nozares, kā arī tajā ievērojamajiem labās prakses piemēriem.

Metadati

Metadati ir strukturēta informācija par datu kopu, kas ļauj saprast, kas tajā iekļauts, kā tā radusies un kā to izmantot. Bez metadatiem nebūtu iespējamas publiskās datu bāzes.

Daudzos atvērtajos datu portālos ir iekļauti rīki, kas palīdz izveidot un uzturēt metadatus, publicējot jaunus datus. Turklāt daļa atvērto datu portālu, rediģējot datu kopas, metadatus atjaunina automātiski. Arī RSU Dataverse ir noteiktas minimālās prasības metadatiem, kas pētniekiem jānorāda (skatīt šeit).

Pamata metadatu elementi sniedz galveno informāciju par datiem un palīdz lietotājiem atrast datus un izvērtēt to atbilstību savām vajadzībām. Šie elementi bieži tiek parādīti tiešu datu katalogos vai meklēšanas rīkos, tāpēc to kvalitāte un precizitāte ir īpaši nozīmīga.

Būtiskie

Pastāvīgais identifikators (PID) - unikāla atsauce uz datu kopu, kas nodrošina tās atpazīstamību neatkarīgi no pārvietošanas. (RSU Dataverse automātiski piešķir datu kopai DOI, līdz ko tā tiek publicēta).

Nosaukums - datu kopas nosaukums angļu valodā (nereti arī pētījuma nosaukums), kas īsi un skaidri atspoguļo tās saturu.

Publicētājs - organizācija vai institūcija, kas nodrošina datu kopas publicēšanu, piemēram, Rīga Stradiņš University.

Autors/-i - datu kopas autors vai autori (ieteicams norādīt gan galveno autoru, gan līdzautorus, kā arī viņu institucionālo piederību un ORCID identifikatoru).

Kontaktpersona - viena vai divas personas, ar kurām iespējams sazināties par datu kopu.

Apraksts - īss datu kopas kopsavilkums, kas sniedz pietiekami daudz detaļu, lai potenciālais lietotājās spētu laicīgi saprast, vai konkrētie dati viņam ir noderīgi.

Zinātnes nozare - galvenā zinātnes nozare, kurai datu kopa attiecināma atbilstoši klasifikācijai.

Atslēgas vārdi - etiķetes jeb termini, kas palīdz lietotājiem atrast datu kopu (ieteicams iekļaut vārdus un frāzes, ko izmantotu ne tikai speciālisti, bet arī plašāka sabidrība; var norādīt arī atslēgavārdu sarakstus (vocabularies)).

Valoda - datu kopā lietotā valoda.

Izstrādes datums un vieta - datums (formātā YYYY-MM-DD) kad un vieta kur datu kopa izveidots (nevis publicēta).

Ievākšanas datums - laika posms (formātā YYYY-MM-DD - YYYY-MM-DD), kurā dati tika ievākti/ģenerēti.

Datu tips - viens vai vairāki datu kopā iekļauto datu veidi, piemēram, anketēšanas dati vai klīniskie dati u.c.

Licence - datu kopai piemērojamā licence, kas nosaka tās lietošanas noteikumus (RSU Dataverse gadījumā datiem automātiski tiek piešķirts publiskā domēna statuss).

Publiskais piekļūstamības līmenis - datu kopai piešķirtā piekļuves pakāpe, kas jānosaka arī tad, ja dati netiek publiskoti vai tiem noteikts embargo periods (tas jānorāda un jāpamato); RSU Dataverse pieejami šādi piekļuves varianti:

  • atvērta (jebkurš var piekļūt datiem bez ierobežojumiem);
  • ierobežota, pieprasīt piekļuvi (piekļuve ir ierobežota, bet pieprasījums ar sadarbības priekšlikumu var tikt iesniegts autoriem);
  • ierobežota, bez piekļuves (piekļuve liegta, datnes tiks atvērtas tikai caur autoru kontaktpersonu);
  • embargo periods.

Versijas numurs - informācija par datu kopas jaunāko versiju (datums, kad tā pēdējo reizi tika mainīta, papildināta vai modificēta, kā arī galveno izmaiņu apraksts).

Izvēles

Granta informācija - projekta/pētījuma finansējuma avots, tostarp finansējošās institūcijas nosaukums, projekta numurs vai ID, kā arī pilns projekta nosaukums.

Aptvertais laika periods - laika posms (formātā YYYY-MM-DD - YYYY-MM-DD), uz kuru attiecas datu kopa (īpaši nozīmīgs vēsturisku vai garāku pētījumu gadījumā).

Programmatūra - norādes par lietojumprogrammatūru, kas nepieciešama datņu atvēršanai, lasīšanai un izmantošanai.

Saistītie materiāli un datu kopas - atsauces uz citām datu kopām, pētījuma rezultātiem vai zinātniskajām publikācijām, kas tieši saistītas ar konkrēto datu kopu (ieteicams pievienot tiešo saiti vai DOI).

Embargo periods - informācija par to, vai datu kopai noteikts embargo periods, kāds ir tā ilgums un kādi ir šī ierobežojuma iemesli.

Citi

Papildu būtiskajiem un izvēles elementiem metadatos iespējams iekļaut arī virkni citas informācijas, kas var būt noderīga konkrētā pētījuma kontekstā, piemēram, klasifikācijas, kontrolētās vārdnīcas, taksonomijas un ontoloģijas, ko pielietojat, ģeogrāfiskos datus u.c., pamatojoties uz zinātnes nozares prasībām un noteiktajiem metadatu standartiem. Šādi elementi palīdz datu kopu padarīt vieglāk atrodamu, saprotamu un atkārtoti izmantojamu.

Dati, ar kuriem nevar dalīties

Ne vienmēr ir iespējams publicēt visus pētījumā iegūtos datus. Īpaši gadījumos, kad pētījuma dati ietver personas datus vai sensitīvu informāciju. Šādās situācijās ir svarīgi laikus konsultēties ar pieredzējušākiem kolēģiem, datu aizsardzības speciālistu vai datu kuratoriem, lai izvērtētu iespējamus riskus un atrastu drošāku risinājumu.

Tāpat publicēšanās nosacījumi ir atkarīgi no izpētes tēmām, projekta līguma vai līgumiem ar industrijas pārstāvjiem.

Ar datiem nevar dalīties, ja tie ir satur:

  • personas datus, kas ļauj tieši vai netieši identificēt indivīdu;
  • konfidenciālu komercinformāciju;
  • informāciju par sistēmu drošības nosacījumiem, kuru publiskošana var radīt riskus vai apdraudējumu;
  • saturu, kura publiskošana var izraisīt pie intelektuālā īpašuma tiesību aizsardzības zaudēšanas;
  • ļoti lielus datu apjomus, piemēram, >50 GB, kuru deponēšana var būt tehniski sarežģīta.

Šādos gadījumos pētniekiem ieteicams nodrošināt:

  • detalizētus metadatus (izslēdzot jebkādu konfidenciālu informāciju);
  • pamatojumu piekļuves ierobežojumiem;
  • skaidrus nosacījumus, kurus ievērojot tomēr varētu piekļūt datiem.

Open Research Europe Open Data, Software and Code Guidelines

Ja dati ietver personas informāciju, tiem jābūr pienācīgi anonimizētiem vai pseidonimizētiem. Šim nolūkam iesakām izmantot R anonymizer pakotni. Sensitīvus datus var kodēt un grupēt, lai samazinātu personu identificēšanas risku.

Ja nevarat kopīgot datus kādu iemeslu dēļ, kas šeit nav minēti, vai rodas papildu jautājumi par datu koplietošanu, aicinām sazināties ar RSU datu kuratoriem, rakstot uz datukuratoriatrsu[pnkts]lv.

Zinātniskā raksta savienošana ar datu kopu

Dalīšanās ar informāciju par izmantotajiem datiem nodrošina zinātnisko rakstu un to satura pārredzamību, pārbaudāmību un ticamību, kā arī var veicina jaunas sadarbības iespējas.

Iesniedzot rakstu žurnālam, ir ieteicams norādīt saistīto ar datu kopām. Atkarībā no žurnāla, lielākoties tas ir iespējams, norādot datu kopas unikālo identifikatoru, piemēram, DOI, vai citu pieejas informāciju. Šādu praksi atbalsta lielākā daļa zinātnisko žurnālu un datubāzu. Gadījumos, kad dati nevar būt publiski pieejami, tos joprojām iespējams sasaistīt ar publikāciju, norādot identifikatoru un skaidrojumu par ierobežotas piekļuves iemesliem.

Kad raksts ir publicēts, ieteicams pievienot atsauci arī pretējā virzienā – sasaistīt datu kopu ar publikāciju, izmantojot raksta DOI, kas tiek nosūtīts e-pastā pēc tā publicēšanas. Tādā veidā tiek stiprināta raksta ticamība un dati padarīti atrodamāki, kā arī pētnieka zinātniskā darbība uzskatāmāka.

RSU pētnieki tiek aicināti informēt RSU Dataverse (dataverseatrsu[pnkts]lv) par jaunām publikācijām vai datu kopām, kas saistītas ar jau deponētajām datu kopām arī pēc to publicēšanas. Tas attiecas arī uz RSU zinātniskās darbības informācijas sistēmu Pure, kur pie reģistrētām datu kopām iespējams pievienot jaunas saites uz zinātniskiem rakstiem.

Datu kopu licencēšana

Datu kopu autoriem jāizvēlas atbilstoša datu izmantošanas licence, kas kalpo par instrumentu, lai informētu interesentus par nosacījumiem atkārtotai izmantošanai. 
Licence ir līgums, ar kuru radošā darba autors dod atļauju to izmantot plašākai sabiedrībai, norādot tā izplatīšanas un izmantošanas ierobežojumus. Ar licences palīdzību materiālam tiek nodrošinātas plašākas tiesības, saglabājot autorību. 
Datu kopām, kas tiek deponētas RSU Dataverse, iespējams piemērot kādu no Creative Commons licencēm.

CC BY

CC BY

Licence ļauj pārveidot radošo veikumu. Radošā veikuma komerciāla izmantošana ir atļauta. Saglabāta prasība atsaukties uz autoru. Šis ir visbiežāk izmantotais CC licences veids.

Licences URI: http://creativecommons.org/licenses/by/4.0/

CC BY SA

CC BY SA

Licence ļauj pārveidot radošo veikumu. Radošā veikuma komerciāla izmantošana ir atļauta. Radošo veikumu pārveidojot, nepieciešams saglabāt sākotnējā radošā darba licenci. Saglabāta prasība atsaukties uz autoru.

Licences URI: https://creativecommons.org/licenses/by-nc-sa/4.0/

CC BY ND

CC BY ND

Licence liedz pārveidot radošo veikumu, taču ļauj izplatīt to komerciālos un nekomerciālos nolūkos. Saglabāta prasība atsaukties uz autoru.

Licences URI: https://creativecommons.org/licenses/by-nc-nd/4.0/

CC BY NC

CC BY NC

Licence liedz radošo veikumu izmantot komerciālos nolūkos. Ir atļauts to pārveidot, taču atvasinātiem darbiem nav nepieciešams piešķirt tādas pašas izmantošanas tiesības, kādas ir sākotnējam darbam. Saglabāta prasība atsaukties uz autoru.

Licences URI: http://creativecommons.org/licenses/by-nc/4.0/

CC BY NC SA

CC BY NC SA

Licence ļauj pārveidot radošo darbu un izmantot to nekomerciālos nolūkos. To darot, nepieciešams saglabāt sākotnējā radošā darba licenci un atsaukties uz autoru.

Licences URI: http://creativecommons.org/licenses/by-nc-sa/4.0/

CC BY NC ND

CC BY NC ND

Visstingrākais no visiem CC licenču veidiem. Licence liedz pārveidot radošo veikumu un izmantot to komerciālos nolūkos. To iespējams tikai lejupielādēt un dalīties ar to, obligāti atsaucoties uz autoru.

Licences URI: http://creativecommons.org/licenses/by-nc-nd/4.0/

Ja datu kopu ilgtermiņa glabāšanai paredzēts deponēt citviet, rīks licences izvēlei pieejams šeit: https://choosealicense.com/

RSU Dataverse

RSU Dataverse ir institucionālais pētniecības datu repozitorijs, kas izveidots, balstoties uz atklātā pirmkoda programmatūru, ko nodrošina Hārvarda Dataverse.

Dataverse ir viens no populārākajiem akadēmiskās pētniecības datu repozitoriju veidiem pasaulē, to regulāri atjaunina, lai uzlabotu tā pieejamību pētniekiem un datorlasāmību. Dataverse ietver visus nepieciešamos protokolus, lai saglabātu datu kopas pēc iespējas atbilstošāk FAIR principiem.

RSU Dataverse ir reģistrēta Pētniecības datu repozitoriju reģistrā, OpenAIRE un EOSC kā resurss un pakalpojums pētniecības datu deponēšanai. Tādējādi RSU Dataverse ir pieejams pētniekiem visā Eiropā, kā arī veicina sadarbību, datu apmaiņu, monitoringu un datorlasāmību.

Pašlaik sākts CoreTrustSeal sertifikācijas process, kas apstiprina, ka repozitorijs atbilst starptautiski atzītiem uzticamas pētniecības datu pārvaldības un ilgtermiņa saglabāšanas standartiem, tādējādi nodrošinot datu pieejamību, saprotamību un atkārtotu izmantojamību, kā arī veicinot pētniecības caurspīdīgumu, reproducējamību un atbilstību FAIR principiem.

RSU Dataverse iedalīts četrās nozarēs:

  • Medicīna;
  • Sabiedrības veselība;
  • Sociālās zinātnes.

RSU Dataverse izveidots, lai RSU pētnieki varētu tur deponēt savus datus pēc pētniecības projektu vai pētnieciskās darbības noslēguma, it sevišķi gadījumos, kad nav atbilstoša un uzticama attiecīgās nozares repozitorija. Datu kopas, kas tiek glabātas RSU Dataverse, var būt brīvi pieejamas vai ar ierobežotu vai slēgtu piekļuvi. Lai sadarbotos un koplietotu datu kopas, vienmēr ir iespējams sazināties ar datu kopu autoriem.

Lai deponētu datus RSU Dataverse, rakstiet uz dataverseatrsu[pnkts]lv, īsi aprakstiet datu būtību un citus ar to saistītus būtiskus aspektus:

  • datu kopu ievietošanai repozitorijā tās iespējams sūtīt uz dataverseatrsu[pnkts]lv vai koplietot izveidojot saitei Nextcloud vai SharePoint, atkarībā no datu jutīguma;
  • pirms datu kopu deponēšanas nepieciešams aizpildīt minimālo metadatu anketu (to iespējams vēlāk papildināt);
  • publicēt var dažādu veidu* datu kopas (tabulāros datus, audio un video ierakstus, interviju vai fokusgrupu diskusiju atšifrējumus u.c.);
  • nepieciešams sagatavot arī kodu grāmatu (codebook), lai aprakstītu datu kopā izmantotās pieejas datu standartizēšanai.

Maksimālais deponējamo datu apjoms ir 50 GB. Gadījumos, kad datu kopa pārsniedz šo apjomu, sazinieties pa e-pastu datukuratoriatrsu[pnkts]lv, lai atrastu piemērotāko iespēju datu uzglabāšanai.

Lai piekļūtu RSU Dataverse, RSU darbinieki var izmantot RSU autentifikāciju. Autoriem vai līdzautoriem tiek piešķirta pilna piekļuve savām datu kopām. Arī pētnieki ārpus RSU var reģistrēties un piekļūt RSU Dataverse - datu kopu līdzautoriem RSU Dataverse administrators piešķirs atbilstošu piekļuves līmeni.

* Izņēmums ir genoma un sekvencēšanas neapstrādātie dati.

ZDIS Pure

RSU zinātnes portāls ir daļa no Latvijas Zinātniskās darbības informācijas sistēmas (ZDIS), kas balstīta uz Elsevier Pure platformas. Tajā tiek apkopota informāciju par RSU akadēmiskā personāla zinātniskās darbības rezultātiem - publikācijām, projektiem, apbalvojumiem, pētniecības aktivitātēm, datu kopām, uzstāšanos, komunikāciju presē un medijos u.c. sasniegumiem.

Pure nodrošina:

  • pētniecības informācijas centralizētu uzglabāšanu, publikāciju, projektu, konferenču un citu ar zinātnisko darbību saistītu metadatu apkopošanu;
  • integrāciju ar starptautiskajiem reģistriem un sistēmām - ORCID, SCOPUS u.c.;
  • atvērtās zinātnes principu ieviešanu, palīdzot uzturēt atvērtus repozitorijus un nodrošinot datu pārvaldības plānus;
  • iespēju sekot zinātniskās darbības un publikāciju ietekmei (citējamības, metrikas un citiem statistikas rādītājiem).
Noderīgas saites

Vispārīgas vadlīnijas un apmācības

Datu sagatavošana

Metadati