Subject description - AD7B36VYD
Summary of Study |
Summary of Branches |
All Subject Groups |
All Subjects |
List of Roles |
Explanatory Notes
Instructions
AD7B36VYD |
Data Mining |
Roles: | |
Extent of teaching: | 14KP+6KC |
Department: | 13136 |
Language of teaching: | CS |
Guarantors: | |
Completion: | Z,ZK |
Lecturers: | |
Credits: | 5 |
Tutors: | |
Semester: | Z |
Web page:
http://cw.felk.cvut.cz/doku.php/courses/a7b36vyd/start
Anotation:
Cílem předmětu je seznámit studenty se základy vytěžování dat (data miningu). Studenti se postupně seznámí se základními úlohami vytěžování dat, odhady parametrů pomocí pravděpodobnosti. Dále se základními metodami shlukové analýzy a metodami vyhodnocení úspěšnosti shlukování, vyhledávání častých množin a sekvencí. Poté se studenti seznámí se základy klasifikace (Bayesovský klasifikátor), následovat budou složitější klasifikační metody - rozhodovací stromy, lineární klasifikace, perceptron a dopředné neuronové sítě. Posledními tématy bude testování vytvořených modelů a kombinování modelů.
Výsledek studentské ankety předmětu je zde:
AD7B36VYD
Study targets:
Cílem studia je seznámit studenty se základními principy a technikami vytěžování dat. V rámci předmětu si také prakticky vyzkouší všechny probírané techniky.
Course outlines:
Osnova a obsah přednášek:
1) | | Úvod. Vytěžování s učitelem a bez učitele, příznaková reprezentace |
2) | | Odhady parametrů pravděpodobnostního rozdělení, maximální věrohodnost, Gaussovská směs |
3) | | Grafické pravděpodobnostní modely, odhady parametrů |
4) | | Shluková analýza a analýza hlavních komponent |
5) | | Samoorganizující se mapy |
6) | | Časté množiny, sekvence a grafy |
7) | | Klasifikační úloha, riziko, Bayesovský klasifikátor, klasifikace dle podobnosti |
8) | | Rozhodovací stromy a pravidla |
9) | | Lineární klasifikátor, rozšíření báze, LDA, logistická regrese |
10) | | Perceptron a neuronové sítě s dopřednou strukturou |
11) | | Testování modelů: křížová validace, ROC analýza |
12) | | Kombinování modelů a výběr příznaků |
13) | | Ukázky aplikací / Industrial show |
Více podrobností viz:
http://cw.felk.cvut.cz/doku.php/courses/a7b36vyd/prednasky/start
Exercises outline:
1) | | Ukázka práce v Matlabu |
2) | | Práce v prostředí RapidMiner |
3) | | Částečná implementace EM |
4) | | Ruční návrh struktury BN v dodaném nástroji |
5) | | Clustering |
6) | | SOM: clustering textu (termín výjimečně až za 2 týdny) |
7) | | Konzultace text mining |
8) | | Transakční data |
9) | | Klasifikace |
10) | | Rozhodovací stromy |
11) | | Lineární klasifikátor |
12) | | Testovaní a ROC |
13) | | Odevzdani poslední úlohy, ukazka NN, zápočty |
Více podrobností viz:
http://cw.felk.cvut.cz/doku.php/courses/a7b36vyd/cviceni/start
Literature:
See course web
Viz web predmetu:
http://cw.felk.cvut.cz/doku.php/courses/y336vd/start
Requirements:
Viz web predmetu:
http://cw.felk.cvut.cz/doku.php/courses/a7b36vyd/start
Subject is included into these academic programs:
Program |
Branch |
Role |
Recommended semester |
Page updated 20.4.2024 15:51:33, semester: Z,L/2023-4, Z/2024-5, Send comments about the content to the Administrators of the Academic Programs |
Proposal and Realization: I. Halaška (K336), J. Novák (K336) |