Datu priekšapstrāde (FK_083)
Īsumā par studiju kursu
Mērķis
Datu priekšapstrādes studiju kursa mērķis ir nodrošināt studentus ar būtiskām prasmēm, sagatavot neapstrādātus datus analīzei. Galvenie mērķi ietver: Izpratne par datu pirmapstrādi: izprast datu pirmapstrādes nozīmi un pamatus datu analīzes darba plūsmā. Datu tīrīšana: apgūt metodes, kā apstrādāt trūkstošās vērtības, noņemt dublikātus un labot kļūdas, lai nodrošinātu datu precizitāti un konsekvenci. Datu transformācija: pārveidot datus piemērotos formātos analīzei, tostarp normalizēšanu, mērogošanu un kategorisko mainīgo kodēšanu. Iezīmju inženierija: izveidot jaunas funkcijas no esošajiem datiem, lai uzlabotu modeļa veiktspēju. Nederīgu datu apstrāde: noteikt un pārvaldīt nederīgus datus, lai novērstu novirzes analīzes gaitā. Datu integrācija un samazināšana: apvienot datus no dažādiem avotiem un samazāt izmērus efektīvai analīzei. Praktiskā pieredze: iegūt praktisku pieredzi ar reālās pasaules datu kopām, izmantojot nozares standarta rīkus un programmatūru. Paraugprakse un rīki: apgūt paraugpraksi un iepazīties ar rīkiem un bibliotēkām, piemēram, Python's Pandas, R un SQL. Sagatavošanās uzlabotai analīzei: nodrošināt gatavību veikt papildu datu analīzes uzdevumus, piemēram, mašīnmācīšanos un statistisko analīzi. Ētiskie apsvērumi: pārrunāt ētiskos aspektus, tostarp datu privātumu un drošību pirmapstrādes laikā. Kursa beigās studējošie spēs pārliecinoši sagatavot neapstrādātus datus dažādām analītiskām lietojumprogrammām, nodrošinot, ka tie ir tīri, labi strukturēti un gatavi lietošanai.
Priekšzināšanas
Zināšanas informātikā vidusskolas līmenī.
Rezultāti
1.Pēc studiju kursa "Datu priekšapstrāde" apguves studenti iegūs padziļinātas zināšanas par datu priekšapstrādes metodēm un tehnikām dažādos datu formātos un nesējos, izpratīs datu kvalitātes nozīmi un to ietekmi uz datu analīzi.
1.Studiju kursa laikā studējošie attīstīs praktiskas prasmes datu importēšanā, tīrīšanā, transformācijā un iezīmju ekstrakcijā no dažādiem datu avotiem un formātiem. Spēs veikt trūkstošo vērtību apstrādi, anomāliju noteikšanu un risināt datu nesabalansētības problēmas.
1.Pabeidzot studiju kursu, studējosie būs kompetenti veikt pilnu datu priekšapstrādes ciklu dažādos projektos, efektīvi risinot reālās pasaules problēmas, spēs pielāgoties dažādiem datu tipiem un apstrādes izaicinājumiem, izstrādāt automatizētus risinājumus un sagatavot datus tālākai analīzei un modelēšanai. Studējošie būs gatavi strādāt datu zinātnes un analītikas jomās, pielietojot iegūtās zināšanas un prasmes profesionālajā vidē.
Plānojums
| Studiju programma | Studiju semestris | Programmas līmenis | Studiju kursa kategorija | Docētāji | Grafiks |
|---|---|---|---|---|---|
| Digitālā transformācija veselības nozarē | 1 | 2. cikla (Maģistra) | Obligāts | Jevgenijs Proskurins, Patrīcija Tamane | |
| Digitālā transformācija veselības nozarē | 1 | 2. cikla (Maģistra) | Obligāts | Jevgenijs Proskurins, Patrīcija Tamane |