Im Rahmen dieser Arbeit geht es um die Implementierung einer einfachen
Sprachsynthese von Zahlen. Generell bevorzugt man in der
professionellen Sprachausgabe vollständig gesprochene Sätze vor
vollsynthetischer Sprache, weil erstere realistischer klingen.
Die Sprachsynthese im Rahmen dieser Arbeit muss nur Zahlen in
"beliebiger" Höhe vorlesen, die aus einzelnen Samples zusammengesetzt
werden soll, also z.B. den Ziffern und Zahlen bis 20, den Vielfachen
von 10 etc. Ein Schwerpunkt wird sein, dass auch zusammengesetzte
Zahlen so natürlich klingen sollen wie vom Menschen gesprochene. Dafür
könnte es nötig sein z.B. Ziffern mehrfach zu samplen, denn eine
alleinstehende 5 klingt evtl. etwas anders als die in 25.
Die Kür der Arbeit soll sein, Zahlen auch mit unterschiedlichen
Emotionen zu lesen, z.B. von -1=wütend über 0=sachlich bis
+1=erfreut. Hier soll der Abschlussarbeiter evaluieren welche Teile
einer gesprochenen Zahl Emotionen mehr oder weniger unterliegt, ob
weitere Samples benötigt werden, ob die Geschwindigkeit angepasst
werden muss etc.
Die Arbeit kann in Java oder C geschrieben werden. Die nötige
technische Ausstattung liefert der Lehrstuhl.
Kontakt: Dr. Thomas Haenselmann <haenselmann(a)uni-mannheim.de>
--
PD Dr. habil. Thomas Haenselmann @ University of Mannheim, Germany
phone +49 621 181 (voice -2603) (fax -2601)
Show replies by date