Seminarium: Usuwanie pogłosu z sygnału mowy

We wtorek (29.10.2013) o 17.00 do koła zawita Mikołaj Kundegórski (zespół DSP, AGH) by opowiedzieć nam o usuwaniu pogłosu z sygnału mowy. Mikołaj zajmował się tym zagadnieniem w ramach praktyk na University of Surrey.
Serdecznie zapraszamy wszystkich zainteresowanych - zarówno tych, którzy już coś wiedzą o przetwarzaniu sygnałów, jak i tych, dla których będzie to nowość.

Abstrakt:

Pogłos jest częstym problemem w przetwarzaniu mowy, np. w jej automatycznym rozpoznawaniu (Automatic Speech Recognition, ASR).  Przestawię zasadę działania oraz porównanie popularnych metod usuwania pogłosu (spectral subtraction, precedence effect, binaural cues). Wyniki eksperymentów na polskim ASR SARMATA (rozwijanym na AGH w Krakowie) porównam z wynikami dla mowy angielskiej (opartym na HTK) oraz stosunkiem sygnału do zniekształceń (SDR) i sygnału do pogłosu (SegSRR).
Reverberation is a common problem for many speech technologies, such as automatic speech recognition (ASR) systems. This paper investigates the novel combination of precedence, binaural and statistical independence cues for enhancing reverberant speech, prior to ASR, under these adverse acoustical conditions when two microphone signals are available. Results of the enhancement are evaluated in terms of relevant signal measures and accuracy for both English and Polish ASR tasks. These show inconsistencies between the signal and recognition measures, although in recognition the proposed method consistently outperforms all other combinations and the spectral-subtraction baseline.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *