Beitrag von eload24, 03.11.2008, 16:02
Künstliche Intelligenz: Wenn der Computer mitdenkt - Sprachausgabe
Sprachausgabe („Sprachsynthese“) nähert sich immer weiter der natürlichen Sprechweise an. Grundlage dafür bilden menschliche Sprecher. Diese werden von Sprachausgabe-Herstellern beauftragt, vorgegebene Texte im Studio aufzunehmen. Software-Entwickler zerlegen das Audiomaterial in Einzelteile.
Gute Sprachsynthese-Software muss vor dem Vorlesen ein gewisses Maß an künstlicher Intelligenz an den Tag legen. Jeden Satz analysiert sie akribisch. Zunächst sucht sie nach Abkürzungen sowie Zahlen und löst sie auf. Aus „etc.“ wird „et cetera“, aus „2004“ wird „zweitausendvier“. Schwieriger wird es bei der Zahl „1“, die je nach Kontext „ein“, „eine“ oder „eins“ ausgesprochen wird. Gleiches gilt für manche Abkürzung. Durch die intelligente Satzanalyse erschließt sich die Software den Zusammenhang. Das ist auch wichtig, um kontextabhängig die richtige Betonung einzelner Buchstaben im Wort und Wörter im Satz zu treffen.
Zum Vorlesen greifen manche Programme auf ein umfangreiches Lexikon zurück, in dem die Aussprache jedes Wortes definiert ist. Bei unbekannten Wörtern kommt eine Sammlung von allgemeinen Ausspracheregeln zum Einsatz. Andere Programme gehen den umgekehrten Weg: Sie setzen auf ausgeklügelte Listen mit Ausspracheregeln und fangen nur Ausnahmen in einem Wörterbuch ab.
Wenn das Programm mit seiner Wort- und Satzanalyse fertig ist, holt es sich die jeweils passenden Audioschnipsel aus seinem Fundus und fügt sie zu einem flüssig gesprochenen Satz zusammen. Da die Software bereits während des Vorlesens die folgenden Sätze analysiert, merken Sie in der Praxis keine Zeitverzögerung.
Ein Beispiel für eine leistungsfähige Sprachausgabe-Software ist Voice Reader Home (http://www.linguatec.net, 49 Euro). Da jede Sprache ihre Eigenheiten hat, gibt es das Programm in elf Versionen. Unter http://www.linguatec.net/onlineservices/voice_reader können Sie die Qualität der Sprachausgabe testen, indem Sie sich kurze Texte vorlesen lassen.
Eine Alternative ist das Programm Natural Reader (http://www.naturalreaders.com, 39,50 Dollar). Auch hier haben Sie die Wahl zwischen Sprechern aus verschiedenen Ländern. Es gibt auch eine kostenlose Version (9,4 MB). Diese setzt aber auf einen synthetischen, englischsprachigen Sprecher und liefert bei deutschsprachigen Texten keine brauchbaren Ergebnisse.
Themen: E-Mail Abo | Software
Tags: Aussprache | Ebook-00565 | Künstliche Intelligenz: Wenn der Computer mitdenkt | KI | Sprachausgabe | Sprachsynthese | vorlesen
TxtBear: Artikel als TxtBear Doc
Software

RSS 2.0