Popis předmětu - B4M36SAN

Přehled studia | Přehled oborů | Všechny skupiny předmětů | Všechny předměty | Seznam rolí | Vysvětlivky               Návod
B4M36SAN Statistická analýza dat Rozsah výuky:2P+2C
Garanti:Kléma J. Role:PO,P Jazyk výuky:CS
Vyučující:Kléma J. Zakončení:Z,ZK
Zodpovědná katedra:13136 Kreditů:6 Semestr:Z

Anotace:

Cílem předmětu je seznámit se se statistckými přístupy k analýze dat nad rámec tradiční výuky statistiky a pravděpodobnosti. Kurz se soustředí na vícepříznakovou explorativní statistickou analýzu, prohloubí ale i znalosti konfirmačních přístupů.

Osnovy přednášek:

1. Základy datové analýzy. Sumarizace dat a statistické testy.
2. Analýza variance, faktorová analýza, analýzy přežití.
3. Mnoharozměrná statistická analýza, MANOVA a MANCOVA.
4. Redukce dimenze, MDS, kernel PCA, SOM.
5. Pokročilé metody shlukování (spektrální, dvojshlukování).
6 Lineární a logistická regrese, LDA, GLM.
7. Hodnocení prediktivních modelů, ROC analýza
8. Převzorkování, permutační testy, korekce pro opakované testy
9. Detekce anomálií a robustní statistika
10. Vyhledávání informací v textu a hypertextu
11. Analýza časových řad, spektrum, periodogram, metody AR, MA a ARIMA.
12. Návrh a vyhodnocení empirické studie, power analysis.
13. Vyhledávání častých podmnožin a podsekvencí
14. Rezerva

Osnovy cvičení:

1. Úvod do programování v R.
2. Knihovny R, statistické knihovny, learning package Swirl.
3. Vizualizaci dat v R.
4. Redukce dimenze - samostatná úloha.
5. Shlukování - samostatná úloha.
6. Mnoharozměrná konfirmační analýza -- samostatná úloha.
7. Diskriminační analýza -- samostatná úloha.
8. Průběžný test znalostí.
9. Mnoharozměrná lineání regrese -- samostatná úloha.
10. Mnoharozměrná nelineání regrese -- samostatná úloha.
11. Detekce anomálíí -- samostatná úloha.
12. Návrh emprické studie -- samostatná úloha.
13. Power analysis -- samostatná úloha.
14. Rezerva, zápočty.

Literatura:

1. Hair, J. F., et al.: Multivariate Data Analysis: A Global Perspective. 7th ed., Prentice Hall, 2009.
2. James, G. et al.: An Introduction to Statistical Learning with Applications in R., Springer, 2013.

Požadavky:

Znalost základů statistiky v rozsahu předmětu B0B01PST. Znalosti lineární klasifikace, shlukování a redukce dimenze v rozsahu B4B33RPZ.

Webová stránka:

https://cw.fel.cvut.cz/wiki/courses/b4m36san/start

Klíčová slova:

mnoharozměrná datová analýza mnoharozměrná regrese shlukování redukce dimenze detekce anomálíí power analysis

Předmět je zahrnut do těchto studijních plánů:

Plán Obor Role Dop. semestr
MPOI1_2016 Interakce člověka s počítačem PO 3
MPOI2_2016 Kybernetická bezpečnost PO 1
MPOI8_2018 Bioinformatika PO 1
MPOI9_2016 Datové vědy PO 1
MPOI2_2018 Kybernetická bezpečnost PO 1
MPOI9_2018 Datové vědy PO 1
MPOI8_2016 Bioinformatika PO 1
MPBIO1_2018 Před zařazením do oboru P 1
MPBIO4_2018 Před zařazením do oboru P 1
MPBIO3_2018 Před zařazením do oboru P 1
MPBIO2_2018 Před zařazením do oboru P 1
MPOI1_2018 Interakce člověka s počítačem PO 3


Stránka vytvořena 16.9.2019 14:51:34, semestry: Z,L/2020-1, L/2018-9, Z,L/2019-20, připomínky k informační náplni zasílejte správci studijních plánů Návrh a realizace: I. Halaška (K336), J. Novák (K336)
Za obsah odpovídá: doc. Ing. Ivan Jelínek, CSc.