Popis předmětu - AD4M33SAD

Přehled studia | Přehled oborů | Všechny skupiny předmětů | Všechny předměty | Seznam rolí | Vysvětlivky               Návod
AD4M33SAD Strojové učení a analýza dat Rozsah výuky:14+6c
Garanti:  Role:PO,V Jazyk výuky:CS
Vyučující:  Zakončení:Z,ZK
Zodpovědná katedra:13133 Kreditů:6 Semestr:Z

Anotace:

Předmět vysvětlí metody strojového učení, které jsou užitečné pro analýzu dat tím, že automaticky objevují srozumitelné datové modely např ve formě grafů či pravidel. V kursu bude též studován teoretický rámec vysvětlující, za jakých podmínek vyložené algoritmy obecně fungují. Přednáší se v angličtině.

Výsledek studentské ankety předmětu je zde: A4M33SAD

Cíle studia:

Seznámit se s pricipy vybraných metod datové analýzy a učení klasifikačních modelů a se základy teorie učení.

Osnovy přednášek:

1. Course introduction. Cluster analysis -- foundations (k-means, hierarchical and EM clustering).
2. Cluster analysis -- advanced methods (spectral clustering).
3. Cluster analysis -- special methods (conceptual and semi-supervised clustering, co-clustering).
4. Frequent itemset mining. the Apriori algorithm, association rules.
5. Frequent sequence mining. Episode rules. Sequence models.
6. Frequent subtrees and subgraphs.
7. Dimensionality reduction.
8. Computational learning theory - intro, PAC learning.
9. Computational learning theory (cont'd).
10. PAC-learning logic forms.
11. Learning in predicate logic.
12. Infinite Concept Spaces.
13. Empirical testing of hypotheses.
14. Wrapping up (if 14 lectures).

Osnovy cvičení:

1. Úvod, program, požadavky, SW nástroje. Vstupní test (prerekvizita RPZ).
2. Předzpracování dat, chybějící a odlehlé hodnoty. Shlukování.
3. Hierarchické shlukování, analýza hlavních komponent.
4. Spektrální shlukování.
5. Hledání častých množin položek a asociačních pravidel.
6. Hledání častých sekvencí a podgrafů.
7. Test z první poloviny kurzu. Křivka učení.
8. Nedoučené a přeučené klasifikátory, kombinace klasifikátorů, odhady chyby, křížová validace.
9. Výběr a hodnocení modelu, ROC analýza.
10. Práce na projektu.
11. Práce na projektu.
12. Induktivní logické programování: systém Aleph.
13. Statistické relační učení: systém Alchemy.
14. Udělování zápočtů, rezerva.

Literatura:

T. Mitchell: Machine Learning, McGraw Hill, 1997
P. Langley: Elements of Machine Learning, Morgan Kaufman 1996
T. Hastie et al: The elements of Statistical Learning, Springer 2001

Požadavky:

Znalosti z předmětu A4B33RPZ. URL: http://cw.felk.cvut.cz/doku.php/courses/m33sad/start

Poznámka:

Rozsah výuky v kombinované formě studia: 14p+6c

Klíčová slova:

hlukování, časté vzory, klasifikátor, PAC-učení

Předmět je zahrnut do těchto studijních plánů:

Plán Obor Role Dop. semestr
MKOI1 Umělá inteligence PO 3
MKEEM1 Technologické systémy V 3
MKEEM5 Ekonomika a řízení elektrotechniky V 3
MKEEM4 Ekonomika a řízení energetiky V 3
MKEEM3 Elektroenergetika V 3
MKEEM2 Elektrické stroje, přístroje a pohony V 3
MKKME1 Bezdrátové komunikace V 3
MKKME5 Komunikační systémy V 3
MKKME4 Sítě elektronických komunikací V 3
MKKME3 Elektronika V 3
MKKME2 Multimediální technika V 3
MKOI3 Počítačové vidění a digitální obraz PO 3
MKKYR4 Letecké a kosmické systémy V 3
MKKYR1 Robotika V 3
MKKYR3 Systémy a řízení V 3
MKKYR2 Senzory a přístrojová technika V 3


Stránka vytvořena 19.7.2019 17:51:25, semestry: Z,L/2020-1, L/2018-9, Z,L/2019-20, připomínky k informační náplni zasílejte správci studijních plánů Návrh a realizace: I. Halaška (K336), J. Novák (K336)
Za obsah odpovídá: doc. Ing. Ivan Jelínek, CSc.