Pārlekt uz galveno saturu

Neparametriskās un robustās statistikas metodes

Studiju kursa apraksts

Kursa apraksta statuss:Apstiprināts
Kursa apraksta versija:3.00
Kursa apraksta apstiprināšanas datums:26.01.2021 12:28:27
Par studiju kursu
Kursa kods:SL_116LKI līmenis:7. līmenis
Kredītpunkti:4.00ECTS:6.00
Zinātnes nozare:Matemātika; Varbūtību teorija un matemātiskā statistikaMērķauditorija:Dzīvās dabas zinātnes
Studiju kursa vadītājs
Kursa vadītājs:Jānis Valeinis
Studiju kursa īstenotājs
Struktūrvienība:Statistikas mācību laboratorija
Struktūrvienības vadītājs:
Kontaktinformācija:Kapseļu iela 23, 2.stāvs, Rīga, statistikaatrsu[pnkts]lv, +371 67060897
Studiju kursa plānojums
Pilns laiks - 1. semestris
Lekcijas (skaits)14Lekciju ilgums (akadēmiskās stundas)2Kopā lekciju kontaktstundas28
Nodarbības (skaits)14Nodarbību ilgums (akadēmiskās stundas)2Kopā nodarbību kontaktstundas28
Kopā kontaktstundas56
Nepilns laiks - 1. semestris
Lekcijas (skaits)14Lekciju ilgums (akadēmiskās stundas)1Kopā lekciju kontaktstundas14
Nodarbības (skaits)14Nodarbību ilgums (akadēmiskās stundas)2Kopā nodarbību kontaktstundas28
Kopā kontaktstundas42
Studiju kursa apraksts
Priekšzināšanas:
• Pārzina varbūtību teoriju un matemātisko statistiku. • Nepieciešamas pamatzināšanas „R”.
Mērķis:
Kursa mērķis ir sniegt studējošajiem padziļinātas zināšanas par matemātiskās statistikas neparametriskajām un robustajām metodēm. Biostatistikā ir ierasts, ka izlases ir mazas un datu normalitāte ir apšaubāma. Turklāt klasiskajā t-testā un dispersijas analīzē papildus ir nepieciešami homogenitātes nosacījums, kas bieži netiek ievērots. Šajās situācijās bieži izmanto neparametriskas un robustas procedūras. Arī klasiskajai lineārajai regresijai ir nepieciešams pieņēmums par normalitāti, un tā aprobežojas tikai ar lineārās atkarības aprakstīšanu. Neparametriski izlīdzināšanas paņēmieni ļauj ļoti vispārīgi novērtēt regresijas funkciju. Atlases atkārtošanas metodes ir populāras, jo īpaši ticamības intervālu noteikšanai. Aprēķiniem un gadījumu izpētei tiks izmantota „R” programmatūras pakotne.
Tēmu saraksts (pilna laika studijas)
Nr.TēmaĪstenošanas formaSkaitsNorises vieta
1Neparametriskās statistikas pamatjēdzieni: definīcijas un piemēri. Normalitātes un citu pieņēmumu pārbaude klasiskajām parametriskajām procedūrām. Datu transformācijas.Lekcijas1.00auditorija
2Normalitātes, homogenitātes un citu pieņēmumu pārbaude klasiskās statistikas procedūrās, izmantojot simulētas un reālas datu kopas „R”.Nodarbības1.00datorklase
3Klasiskie neparametriskie testi: pamatjēdzieni. Zīmju tests un Vilkoksona tests vienas izlases gadījumam.Lekcijas1.00auditorija
4T-testa, zīmju testa un Vilkoksona testa salīdzinājums vienas izlases gadījumam „R”. Ticamības procedūras un jaudas modelēšana.Nodarbības1.00datorklase
5Vilkoksona rangu summas tests un Vilkoksona rangu zīmju tests divu izlašu gadījumā.Lekcijas1.00auditorija
6Vilkoksona rangu summas tests un Vilkoksona rangu zīmju testi „R”.Nodarbības1.00datorklase
7Neparametriskas vienfaktoa un divfaktoru dispersijas analīzes. Frīdmana un Kruskala–Volisa testi. Aposteriorās procedūras.Lekcijas1.00auditorija
8Datu kopas analīze „R” programmā, izmantojot gan parametriskas, gan neparametriskas dispersijas analīzes procedūras.Nodarbības1.00datorklase
9Vispārīgi gludināšanas jēdzieni. Histogrammas un intervāla platuma parametru izvēle.Lekcijas1.00auditorija
10Histogrammas un intervāla platuma parametru izvēle „R”.Nodarbības1.00datorklase
11Neparametriskais blīvuma funkcijas novērtējums. Joslas platuma parametru izvēle, izmantojot savstarpēju validāciju.Lekcijas1.00auditorija
12Neparametriskais blīvuma funkcijas novērtējums „R”.Nodarbības1.00datorklase
13Neparametriskā regresija: Nadaraja-Vatsona kodola regresija, lokālā polinomu regresija.Lekcijas1.00auditorija
14Neparametriska regresija „R”.Nodarbības1.00datorklase
15Vispārinātie aditīvie modeļi (GAM).Lekcijas1.00auditorija
16Vispārinātie aditīvie modeļi „R”.Nodarbības1.00datorklase
17Ievads atlases atkārtošanas metodēs: Džeknaifa un būtstrepa metodes. Būtstrepa metode ticamības intervāliem. Permutācijas testi.Lekcijas1.00auditorija
18Atlases atkārtošanas metodes „R”. Būtstrepa metode ticamības intervāliem un permutācijas testu piemēri „R”.Nodarbības1.00datorklase
19Robusti secinājumi. Pamatdefinīcija un piemēri. M novērtējumi. Robusts lokācijas un mēroga novērtējums.Lekcijas1.00auditorija
20Robusts lokācijas un mēroga novērtējums „R”.Nodarbības1.00datorklase
21Robusti ticamības intervāli un statistiskā testēšana.Lekcijas1.00auditorija
22Robusti ticamības intervāli un testi „R”. Salīdzinājums ar klasiskajām metodēm.Nodarbības1.00datorklase
23Robustas dispersijas analīzes metodes vienkāršā vienvirziena un divvirzienu modelēšanā.Lekcijas1.00auditorija
24Robustas dispersijas analīzes metodes „R”. Salīdzinājums ar parametriskām procedūrām.Nodarbības1.00datorklase
25Robusta regresija.Lekcijas1.00auditorija
26Robusta regresija „R”. Salīdzinājums ar lineārajām un neparametriskajām regresijām.Nodarbības1.00datorklase
27Ieskats neparametriskās un robustās procedūrās dažādās statistikas lietojumu jomās.Lekcijas1.00auditorija
28Dažādas „R” pakotnes citām neparametriskām un robustām metodēm.Nodarbības1.00datorklase
Tēmu saraksts (nepilna laika studijas)
Nr.TēmaĪstenošanas formaSkaitsNorises vieta
1Neparametriskās statistikas pamatjēdzieni: definīcijas un piemēri. Normalitātes un citu pieņēmumu pārbaude klasiskajām parametriskajām procedūrām. Datu transformācijas.Lekcijas1.00auditorija
2Normalitātes, homogenitātes un citu pieņēmumu pārbaude klasiskās statistikas procedūrās, izmantojot simulētas un reālas datu kopas „R”.Nodarbības1.00datorklase
3Klasiskie neparametriskie testi: pamatjēdzieni. Zīmju tests un Vilkoksona tests vienas izlases gadījumam.Lekcijas1.00auditorija
4T-testa, zīmju testa un Vilkoksona testa salīdzinājums vienas izlases gadījumam „R”. Ticamības procedūras un jaudas modelēšana.Nodarbības1.00datorklase
5Vilkoksona rangu summas tests un Vilkoksona rangu zīmju tests divu izlašu gadījumā.Lekcijas1.00auditorija
6Vilkoksona rangu summas tests un Vilkoksona rangu zīmju testi „R”.Nodarbības1.00datorklase
7Neparametriskas vienfaktoa un divfaktoru dispersijas analīzes. Frīdmana un Kruskala–Volisa testi. Aposteriorās procedūras.Lekcijas1.00auditorija
8Datu kopas analīze „R” programmā, izmantojot gan parametriskas, gan neparametriskas dispersijas analīzes procedūras.Nodarbības1.00datorklase
9Vispārīgi gludināšanas jēdzieni. Histogrammas un intervāla platuma parametru izvēle.Lekcijas1.00auditorija
10Histogrammas un intervāla platuma parametru izvēle „R”.Nodarbības1.00datorklase
11Neparametriskais blīvuma funkcijas novērtējums. Joslas platuma parametru izvēle, izmantojot savstarpēju validāciju.Lekcijas1.00auditorija
12Neparametriskais blīvuma funkcijas novērtējums „R”.Nodarbības1.00datorklase
13Neparametriskā regresija: Nadaraja-Vatsona kodola regresija, lokālā polinomu regresija.Lekcijas1.00auditorija
14Neparametriska regresija „R”.Nodarbības1.00datorklase
15Vispārinātie aditīvie modeļi (GAM).Lekcijas1.00auditorija
16Vispārinātie aditīvie modeļi „R”.Nodarbības1.00datorklase
17Ievads atlases atkārtošanas metodēs: Džeknaifa un būtstrepa metodes. Būtstrepa metode ticamības intervāliem. Permutācijas testi.Lekcijas1.00auditorija
18Atlases atkārtošanas metodes „R”. Būtstrepa metode ticamības intervāliem un permutācijas testu piemēri „R”.Nodarbības1.00datorklase
19Robusti secinājumi. Pamatdefinīcija un piemēri. M novērtējumi. Robusts lokācijas un mēroga novērtējums.Lekcijas1.00auditorija
20Robusts lokācijas un mēroga novērtējums „R”.Nodarbības1.00datorklase
21Robusti ticamības intervāli un statistiskā testēšana.Lekcijas1.00auditorija
22Robusti ticamības intervāli un testi „R”. Salīdzinājums ar klasiskajām metodēm.Nodarbības1.00datorklase
23Robustas dispersijas analīzes metodes vienkāršā vienvirziena un divvirzienu modelēšanā.Lekcijas1.00auditorija
24Robustas dispersijas analīzes metodes „R”. Salīdzinājums ar parametriskām procedūrām.Nodarbības1.00datorklase
25Robusta regresija.Lekcijas1.00auditorija
26Robusta regresija „R”. Salīdzinājums ar lineārajām un neparametriskajām regresijām.Nodarbības1.00datorklase
27Ieskats neparametriskās un robustās procedūrās dažādās statistikas lietojumu jomās.Lekcijas1.00auditorija
28Dažādas „R” pakotnes citām neparametriskām un robustām metodēm.Nodarbības1.00datorklase
Vērtēšana
Patstāvīgais darbs:
1. Literatūras izpēte atbilstoši katras lekcijas tēmai pēc kursa plāna. 2. Patstāvīgi izpildīt mājasdarbus pēc katras nodarbības, praktizējot kursā apgūtās koncepcijas.
Vērtēšanas kritēriji:
Novērtējums 10 ballu skalā saskaņā ar RSU Studiju reglamentu: • Praktisko nodarbību mājasdarbi – 50%. • Rakstisks gala eksāmens – 50%.
Gala pārbaudījums (pilna laika studijas):Eksāmens (Rakstisks)
Gala pārbaudījums (nepilna laika studijas):Eksāmens (Rakstisks)
Studiju rezultāti
Zināšanas:• izprot neparametrisku un robustu statistiskas procedūru jēdzienus un procedūras un spēj tās definēt; • pārzina un prot „R” programmā izvēlēties neparametriskas un robustas statistiskas procedūras.
Prasmes:• veic neparametrisku testēšanu „R” un interpretē rezultātus; • izmanto un pielieto gludināšānas paņēmienus blīvuma un regresijas funkcijas novērtēšanai; • prot pielietot atkārtotas izlases veidošanas metodes; • izmanto robustas procedūras dažādu statistikas datu problēmu risināšanai.
Kompetences:• izprot un atbalsta standarta statistikas metodēs izdarīto pieņēmumu nozīmi; • spēj pamatoti izvēlēties parametriskas, neparametriskas un robustas procedūras praktiskai datu analīzei, parādīt izpratni un ētisko atbildību par zinātnes rezultātu iespējamo ietekmi uz vidi un sabiedrību; • patstāvīgi izstrādā pareizu statistisko modeli, kritiski interpretē un prezentē iegūtos rezultātus, ja nepiecešams, veic papildu analīzi.
Bibliogrāfija
Nr.Atsauce
Obligātā literatūra
1Lehmann, Erich Leo, and Howard J. D'Abrera. Nonparametrics: statistical methods based on ranks. Holden-Day. 1975.
2Wasserman, Larry. All of nonparametric statistics. Springer Science & Business Media. 2006.
3Maronna, R. A., Martin, R. D., Yohai, V. J., & Salibián-Barrera, M. Robust statistics: theory and methods (with R). John Wiley & Sons. 2019.
Papildu literatūra
1Agresti, A., Franklin, C. A. Statistics: The Art and Science of Learning from Data (3rd ed.), Pearson Education. 2013
2Chan, Bertram KC. Biostatistics for epidemiology and public health using R. Springer Publishing Company. 2015.
3DasGupta, Anirban. Asymptotic theory of statistics and probability. Springer Science & Business Media. 2008.