ČeskyEnglish

Popis předmětu - A4M33SAD

Přehled studia | Přehled oborů | Všechny skupiny předmětů | Všechny předměty | Seznam rolí | Vysvětlivky               Návod
A4M33SAD Strojové učení a analýza dat Rozsah výuky:2+2c
Garanti:Železný F. Role:PO,V Zakončení:Z,ZK
Vyučující:Černoch R., Železný F.
Zodpovědná katedra:13136 Kreditů:6 Semestr:Z

Anotace:

Předmět vysvětlí metody strojového učení, které jsou užitečné pro analýzu dat tím, že automaticky objevují srozumitelné datové modely např ve formě grafů či pravidel. V kursu bude též studován teoretický rámec vysvětlující, za jakých podmínek vyložené algoritmy obecně fungují. Přednáší se v angličtině.

Výsledek studentské ankety předmětu je zde: A4M33SAD

Cíle studia:

Seznámit se s pricipy vybraných metod datové analýzy a učení klasifikačních modelů a se základy teorie učení.

Osnovy přednášek:

1. Course introduction. Cluster analysis -- foundations (k-means, hierarchical and EM clustering).
2. Cluster analysis -- advanced methods (spectral clustering).
3. Cluster analysis -- special methods (conceptual and semi-supervised clustering, co-clustering).
4. Frequent itemset mining. the Apriori algorithm, association rules.
5. Frequent sequence mining. Episode rules. Sequence models.
6. Frequent subtrees and subgraphs.
7. Dimensionality reduction.
8. Computational learning theory - intro, PAC learning.
9. Computational learning theory (cont'd).
10. PAC-learning logic forms.
11. Learning in predicate logic.
12. Infinite Concept Spaces.
13. Empirical testing of hypotheses.
14. Wrapping up (if 14 lectures).

Osnovy cvičení:

1. Úvod, program, požadavky, SW nástroje. Vstupní test (prerekvizita RPZ).
2. Předzpracování dat, chybějící a odlehlé hodnoty. Shlukování.
3. Hierarchické shlukování, analýza hlavních komponent.
4. Spektrální shlukování.
5. Hledání častých množin položek a asociačních pravidel.
6. Hledání častých sekvencí a podgrafů.
7. Test z první poloviny kurzu. Křivka učení.
8. Nedoučené a přeučené klasifikátory, kombinace klasifikátorů, odhady chyby, křížová validace.
9. Výběr a hodnocení modelu, ROC analýza.
10. Práce na projektu.
11. Práce na projektu.
12. Induktivní logické programování: systém Aleph.
13. Statistické relační učení: systém Alchemy.
14. Udělování zápočtů, rezerva.

Literatura:

T. Mitchell: Machine Learning, McGraw Hill, 1997
P. Langley: Elements of Machine Learning, Morgan Kaufman 1996
T. Hastie et al: The elements of Statistical Learning, Springer 2001

Požadavky:

Znalosti z předmětu A4B33RPZ. URL: http://cw.felk.cvut.cz/doku.php/courses/m33sad/start

Poznámka:

Rozsah výuky v kombinované formě studia: 14p+6c

Webová stránka:

http://cw.felk.cvut.cz/doku.php/courses/a4m33sad/start

Klíčová slova:

shlukování, časté vzory, klasifikátor, PAC-učení

Předmět je zahrnut do těchto studijních plánů:

Plán Obor Role Dop. semestr
MPOI3 Počítačové vidění a digitální obraz PO 3
MPKME2 Multimediální technika V 3
MPKME4 Sítě elektronických komunikací V 3
MPKME1 Bezdrátové komunikace V 3
MPKME3 Elektronika V 3
MPKME5 Komunikační systémy V 3
MPOI1 Umělá inteligence PO 3
MPEEM5 Ekonomika a řízení elektrotechniky V 3
MPEEM4 Ekonomika a řízení energetiky V 3
MPEEM2 Elektrické stroje, přístroje a pohony V 3
MPEEM1 Technologické systémy V 3
MPEEM3 Elektroenergetika V 3
MPKYR4 Letecké a kosmické systémy V 3
MPBIO1 Biomedicínská informatika PO 3
MPKYR1 Robotika V 3
MPKYR2 Senzory a přístrojová technika V 3
MPKYR3 Systémy a řízení V 3


Stránka vytvořena 22.9.2017 17:47:52, semestry: L/2016-7, Z,L/2017-8, Z/2018-9, připomínky k informační náplni zasílejte správci studijních plánů Návrh a realizace: I. Halaška (K336), J. Novák (K336)
Za obsah odpovídá: doc. Ing. Ivan Jelínek, CSc.