Subject description - AD7B36VYD

Summary of Study | Summary of Branches | All Subject Groups | All Subjects | List of Roles | Explanatory Notes               Instructions
AD7B36VYD Data Mining
Roles:  Extent of teaching:14KP+6KC
Department:13136 Language of teaching:CS
Guarantors:  Completion:Z,ZK
Lecturers:  Credits:5
Tutors:  Semester:Z

Web page:

http://cw.felk.cvut.cz/doku.php/courses/a7b36vyd/start

Anotation:

Cílem předmětu je seznámit studenty se základy vytěžování dat (data miningu). Studenti se postupně seznámí se základními úlohami vytěžování dat, odhady parametrů pomocí pravděpodobnosti. Dále se základními metodami shlukové analýzy a metodami vyhodnocení úspěšnosti shlukování, vyhledávání častých množin a sekvencí. Poté se studenti seznámí se základy klasifikace (Bayesovský klasifikátor), následovat budou složitější klasifikační metody - rozhodovací stromy, lineární klasifikace, perceptron a dopředné neuronové sítě. Posledními tématy bude testování vytvořených modelů a kombinování modelů.

Výsledek studentské ankety předmětu je zde: AD7B36VYD

Study targets:

Cílem studia je seznámit studenty se základními principy a technikami vytěžování dat. V rámci předmětu si také prakticky vyzkouší všechny probírané techniky.

Course outlines:

Osnova a obsah přednášek:
1) Úvod. Vytěžování s učitelem a bez učitele, příznaková reprezentace
2) Odhady parametrů pravděpodobnostního rozdělení, maximální věrohodnost, Gaussovská směs
3) Grafické pravděpodobnostní modely, odhady parametrů
4) Shluková analýza a analýza hlavních komponent
5) Samoorganizující se mapy
6) Časté množiny, sekvence a grafy
7) Klasifikační úloha, riziko, Bayesovský klasifikátor, klasifikace dle podobnosti
8) Rozhodovací stromy a pravidla
9) Lineární klasifikátor, rozšíření báze, LDA, logistická regrese
10) Perceptron a neuronové sítě s dopřednou strukturou
11) Testování modelů: křížová validace, ROC analýza
12) Kombinování modelů a výběr příznaků
13) Ukázky aplikací / Industrial show
Více podrobností viz: http://cw.felk.cvut.cz/doku.php/courses/a7b36vyd/prednasky/start

Exercises outline:

1) Ukázka práce v Matlabu
2) Práce v prostředí RapidMiner
3) Částečná implementace EM
4) Ruční návrh struktury BN v dodaném nástroji
5) Clustering
6) SOM: clustering textu (termín výjimečně až za 2 týdny)
7) Konzultace text mining
8) Transakční data
9) Klasifikace
10) Rozhodovací stromy
11) Lineární klasifikátor
12) Testovaní a ROC
13) Odevzdani poslední úlohy, ukazka NN, zápočty
Více podrobností viz: http://cw.felk.cvut.cz/doku.php/courses/a7b36vyd/cviceni/start

Literature:

See course web Viz web predmetu: http://cw.felk.cvut.cz/doku.php/courses/y336vd/start

Requirements:

Viz web predmetu: http://cw.felk.cvut.cz/doku.php/courses/a7b36vyd/start

Subject is included into these academic programs:

Program Branch Role Recommended semester


Page updated 19.4.2024 11:51:28, semester: Z/2023-4, Z/2024-5, L/2023-4, Send comments about the content to the Administrators of the Academic Programs Proposal and Realization: I. Halaška (K336), J. Novák (K336)