DETAILS OF THE ACHIEVEMENT
Automatická segmentace řeči pomocí syntézy řeči a dynamického programování
Petr Horák, Ph.D.
Year: 1999
Pro hlubší výzkum prozodie přirozené řeči jsou potřeba prozodicky označkované databáze přirozených promluv, jejichž manuální vytváření je velice namáhavé a zdlouhavé. Z tohoto důvodu byl vyvinut programový systém pro automatickou segmentaci řeči umožňující automatické označování difónů, hlásek a případně i vyšších suprasegmentálních celků v přirozené řeči. Vyvinutý systém pracuje na principu porovnávání přirozené promluvy s identickou syntetickou promluvou, u které známe hranice mezi jednotlivými suprasegmentálními prvky, s použitím dynamického programování. Vstupem je tedy přirozená promluva a text této promluvy, výstupem je informace o poloze difónů a hlásek v přirozené promluvě. Popisovaný systém byl porovnáván s manuálním označováním a výsledky ukázaly použitelnost systému v praxi pro tvorbu prozodicky označkovaných databází. Použití automatické segmentace se neomezuje pouze na výzkum prozodie lidské řeči, ale je důležité také pro výzkum rozpoznávání řeči a má své uplatnění i při tvorbě nových inventářů pro syntézu řeči.
  1. Horák, P.: Automatic Speech Segmentation Using Czech TTS. In: Abstracts of 9th Czech-German Workshop Speech Processing, Prague, September 13–15, 1999, (in print).
  2. Horák, P.: Automatic Speech Segmentation Based on DTW with the Application of the Czech TTS System. In: Working papers of COST 258, Ed. by E. Keller, Laussanne, Switzerland, 2000 (in print).