Popis předmětu - A2M31RAT

Přehled studia | Přehled oborů | Všechny skupiny předmětů | Všechny předměty | Seznam rolí | Vysvětlivky               Návod
A2M31RAT Řečové aplikace v telekomunikacích Rozsah výuky:2P+2C
Garanti:  Role:PO,V Jazyk výuky:CS
Vyučující:  Zakončení:Z,ZK
Zodpovědná katedra:13131 Kreditů:6 Semestr:L

Anotace:

Předmět je zaměřen na seznámení studentů magisterského studia s problematikou zpracování řečových signálů s užším zaměřením na komunikační aplikace. Tato problematika má široký aplikační záběr v komunikačních systémech. Další informace lze nalézt na http://noel.feld.cvut.cz/vyu/a2m31rat . Pro zapsané studenty jsou detailní informace na výukovém portálu http://moodle.kme.feld.cvut.cz .

Výsledek studentské ankety předmětu je zde: A2M31RAT

Cíle studia:

Cílem studia je podat studentům úvodní přehled o řečových technologiích v nejvýznamnějších komunikačních aplikacích. Studenti by měli ovládnout problematiku zahrnující základní popis a charakteristiky řečového signálu, problematiku kódování řeči, zvýrazňování řeči, rozpoznávání řeči a řečové syntézy. Základní úlohy jsou procvičovány v programovém systému MATLAB a v dalších veřejně dostupných nástrojích pro analýzu řečového signálu. V rámci domácí přípravy studenti zpracovávají semestrální práci jejíž výsledky jsou prezentovány na cvičení podle daného harmonogramu.

Osnovy přednášek:

1. Úvod - řečový signál, základní charakteristiky, model vzniku řeči 2. Digitalizace a základní kódovací strategie (PCM, ADPCM, a-law)
3. Spektrální charakteristiky řečového signálu (DFT a LPC spektrum, LSF a LSP, kepstrum)
4. Vokodéry používané v telekomunikacích (RPE-LTP, CELP, ACELP)
5. Metody potlačování šumu v řečovém signálu (šum kanálu a šum akustický, VAD)
6. Metody potlačování echa v řečovém signálu
7. Měření kvality řečového signálu (subjektivní a objektivní metody)
8. Principy rozpoznávání řeči, základní úlohy, extrakce příznaků, algoritmus DTW
9. Jednoduché rozpoznávače s malým slovníkem na bázi HMM (nástroje HTK)
10. Rozpoznávání mluvčího: verifikace a identifikace.
11. Syntéza řeči, principy základních přístupů (konkatenační a formantová syntéza, PSOLA)
12. Dialogové komunikační systémy s hlasovým vstupem
13. Náhrada ztracených segmentů řeči při přenosu komunikačním kanálem
14. Další aplikace rozpoznávání řeči v komunikačních systémech. Rezerva

Osnovy cvičení:

1. Úvod: řečový signál, nástroje pro analýzu, dostupné zdroje signálů
2. Základní časové charakteristiky: energie, intenzita, průchody nulou, základní tón
3. Spektrální charakteristiky: krátkodobé DFT a LPC spektrum, spektrogram
4. LPC vokodér: jednotlivých principiálních bloků
5. Potlačování aditivního šumu v řečovém signálu
6. Potlačování echa v řečovém signálu
7. Kepstrum a kepstrální vzdálenost: detekce řečových úseků, příznaky pro rozpoznávání
8. Rozpoznávání na bázi DTW: jednoduchý rozpoznávač jednotlivých slov
9. Rozpoznávání na bázi HMM: jednoduché úlohy a demonstrace průchodu HMM modelem
10. Verifikace mluvčího na bázi GMM
11. Syntéza řeči: formantový syntezátor, demonstrace volně dostupných syntezátorů
12. Prezentace semestrálních prací
13. Prezentace semestrálních prací
14. Rezerva. Zápočty

Literatura:

[1] Uhlíř, J. - Sovka, P. - Pollák, P. - Hanžl, V. - Čmejla, R.: Technologie hlasových komunikací. Nakladatelství ČVUT, 2007.
[2] Psutka, J. - Müller, L. - Matoušek, J. - Radová, V.: Mluvíme s počítačem česky. Academia 2006.
[3] Huang, X. - Acero, A. - Hon, H.-W.: Spoken Language Processing. Prentice Hall 2001.

Požadavky:

Vstupními požadavky jsou základní znalosti z oblasti číslicového zpracování signálů.

Poznámka:

Rozsah výuky v kombinované formě studia: 14p+6c

Webová stránka:

https://moodle.fel.cvut.cz/course/view.php?id=540

Klíčová slova:

zpracování řeči, rozpoznávání řeči, zvýrazňování řeči, kódování řeči, syntéza řeči

Předmět je zahrnut do těchto studijních plánů:

Plán Obor Role Dop. semestr
MPIB Před zařazením do oboru V
MPEEM1 Technologické systémy V 3
MPEEM5 Ekonomika a řízení elektrotechniky V 3
MPEEM4 Ekonomika a řízení energetiky V 3
MPEEM3 Elektroenergetika V 3
MPEEM2 Elektrické stroje, přístroje a pohony V 3
MPKYR4 Letecké a kosmické systémy V 3
MPKME4 Sítě elektronických komunikací PO 3
MPKYR1 Robotika V 3
MPKYR3 Systémy a řízení V 3
MPKYR2 Senzory a přístrojová technika V 3


Stránka vytvořena 19.11.2019 17:50:44, semestry: Z,L/2020-1, L/2018-9, Z,L/2019-20, připomínky k informační náplni zasílejte správci studijních plánů Návrh a realizace: I. Halaška (K336), J. Novák (K336)
Za obsah odpovídá: doc. Ing. Ivan Jelínek, CSc.