Jump label

Service navigation

Main navigation

You are here:

Main content

Lecture: Speech Recognition (Spracherkennung)

| Gernot A. Fink | Embedded System Design | Department of Computer Science | University of Dortmund


Vorlesung Spracherkennung im WS 2006/2007


Ziel der automatischen Spracherkennung ist es, gesprochene Äußerungen - d.h. das akustische Sprachsignal - unter Zuhilfenahme eines geeigneten Inventars von Wortformen auf eine möglichst exakte orthographische Repräsentation der Äußerung abzubilden. Diktiersysteme sind daher typische Beispiele für Spracherkennungssysteme. In der Veranstaltung werden ausschließlich Aspekte der Spracherkennung behandelt. Die Grundlagen bilden dabei speziell in der Spracherkennung eingesetzte Verfahren zur Signalverarbeitung sowie Erkenntnisse aus der artikulatorischen und akustische Phonetik. Schwerpunktmäßig wird dann das nach dem gegenwärtigen Stand der Forschung vorherrschende Paradigma zur automatischen Spracherkennung behandelt - die sogenannten Hidden-Markov-Modelle (HMM). Die mathematischen Grundlagen dieser statistischen Modellierungstechnik für gesprochene Sprache werden eingeführt und Algorithmen zur Parameterschätzung sowie zum Einsatz für die Analyse von Sprachsignalen behandelt. Anhand existierender Spracherkennungssysteme werden mögliche Varianten der HMM-Technologie vorgestellt und diskutiert.

Schwerpunktgebiete: 6 (Computational Intelligence ...), 7 (Intelligente Systeme)

Literatur:

  • Fink, Gernot A.: Mustererkennung mit Markov-Modellen, Leitfäden der Informatik, B. G. Teubner, Stuttgart - Leipzig - Wiesbaden, 2003.
  • Schukat-Talamazzini, E.-G.: Automatische Spracherkennung, Vieweg, Wiesbaden, 1995.
  • Huang, X., Acero, A., Hon, H-W.: Spoken Language Processing: A Guide to Theory, Algorithm, and System Development, Prentice Hall, Upper Saddle River, NJ, 2001.
  • Kohler, Klaus J.: Einführung in die Phonetik des Deutschen, Erich Schmidt Verlag, Berlin, 1977
  • Zwicker, E.: Psychoakustik, Springer, Berlin - Heidelberg - New York, 1982

Materialien zur Vorlesung:

Weitere Hilfmittel:
  • Bearbeitungs- und Annotationssoftware für Sprachsignale PRAAT (Universität Amsterdam)

 


| Gernot A. Fink | Embedded System Design | Department of Computer Science | University of Dortmund