Popis předmětu - XP13SAV

Přehled studia | Přehled oborů | Všechny skupiny předmětů | Všechny předměty | Seznam rolí | Vysvětlivky               Návod
XP13SAV Statistická analýza a vyhodnocení technologických dat
Role:S Rozsah výuky:2P+2S
Katedra:13113 Jazyk výuky:CS
Garanti:Molhanec M. Zakončení:Z,ZK
Přednášející:Molhanec M. Kreditů:4
Cvičící:Molhanec M. Semestr:L

Anotace:

Studenti se seznámí na úrovni odpovídající doktorskému studiu s formáty používaných při měření a zpracování dat v průmyslu. S jejich předzpracováním (filtrování a transformace), přenosem a jejich ukládáním. Dále získají hlubší znalosti v oblasti statistická analýzy naměřených dat (testování hypotéz, DOE, regrese, korelace, spojité a nespojité distribuce). Také získají znalosti o vytváření simulačních modelů (spojitých a nespojitých). Nakonec získají znalosti o vhodné vizualizaci takto zpracovaných dat.

Osnovy přednášek:

1) Formáty měřených dat: csv, fixní data. Další formáty používané pro zpracování a archivaci: xml, json. Strukturovaná a nestrukturovaná data. Data na Internetu a v databázi. Textová data.
2) Nástroje na zpracování csv a dalších typů dat. Dávkové zpracování dat ve Windows a Linuxu. Vhodné skriptovací jazyky ve Windows a Linuxu. Příkazová řádka. Použití pipe a přesměrování ve Windows nebo Linuxu.
3) Manipulace s daty, vyhledávání v datech, změna dat a jejich filtrování. Jazyk SQL (základ). Xpath (základ). Správnost dat. Čištění dat.
4) Statistické zpracovaní dat. Mean, průměr, rozptyl, standardní odchylka a další charakteristické hodnoty. Populace a výběr. Korelace a kovariace. Testování hypotéz. Testy normality. Anova. Výpočet modelu.
5) Vizualizace dat a jejich interpretace. Scatter diagram, boxplot, sloupcový diagram. Histogram. Koláčový diagram. Další 2D a 3D diagramy. Zásady tvorby diagramů pro znázornění technologických dat. Popisy os. Volba barev.
6) Excel a jeho využití pro zpracování dat. Pojmenované oblasti. Array funkce a konstanty. Tabulky. Matice. Kontingenční tabulky. Grafy s ohledem na statistické výstupy. Add-Ins. VBA (zaklad).
7) Matlab pro zpracování naměřených hodnot. Zpracovaní csv dat. Statistický toolbox. Spojení s databází. Vizualizace s ohledem na statistické výstupy.
8) Mathematica pro zpracování naměřených hodnot. Zpracovaní csv dat. Statistické funkce. Spojení s databází. Vizualizace s ohledem na statistické výstupy.
9) Python. Základy Jazyka. Knihovny pro zpracování dat. Použití pro zpracování dat. Data z Internetu a přístup do databáze.
10) Python. Náročnější konstrukce. Práce s maticemi. Funkcionální přístup. Pandoc knihovna. Statistika a grafické výstupy. Knihovna Matplotlib.
11) R systém. Základy jazyka. Práce s daty. Statistika. Grafický výstup.
12) Statistické vyhodnocení dat. Regrese, korelace, optimalizace, predikce. Časové řady. Bayes.
13) Tvorba simulačního modelu. Analogová a diskrétní simulace. Modelovací systém AnyLogic.
14) Prezentace dat. Publikování dat. Open access. Autorská práva.

Osnovy cvičení:

Literatura:

[1] Milan Meloun, Jiří Militký.: Statistické zpracování experimentálních dat, ars magna, 1998, Praha
[2] Václav Dupač a Marie Hušková, Pravděpodobnost a matematická statistika, Karolinum, 2009
[3] M. Navara.: Pravděpodobnost a matematická statistika. Skripta FEL ČVUT, 2007

Požadavky:

Předmět je zahrnut do těchto studijních plánů:

Plán Obor Role Dop. semestr
DOKP Před zařazením do oboru S
DOKK Před zařazením do oboru S


Stránka vytvořena 30.11.2020 17:50:52, semestry: L/2021-2, Z,L/2020-1, L/2019-20, Z/2021-2, připomínky k informační náplni zasílejte správci studijních plánů Návrh a realizace: I. Halaška (K336), J. Novák (K336)
Za obsah odpovídá: doc. Ing. Ivan Jelínek, CSc.