Sie kennen sicher die Ansagen auf einigen grösseren Bahnhöfen und Zügen. Die immergleiche Stimme - in der Regel die einer professionellen Sprecherin - gibt Zugsdestinationen, Abfahrtszeiten, Gleisangaben usw. bekannt.
An gewissen Eigenheiten, den unnatürlichen Übergängen im Sprechverlauf, kann man manchmal deutlich hören, dass die Ansage von einem Computer aus vorfabrizierten Elementen zusammengestückelt wurde. Die Textbausteine werden von SBB-Angestellten eingegeben. Die Software lässt sie über Lautsprecher ertönen.
Ähnliche Erfahrungen macht man als Hörer mit einem Video über Weiach, den man auf 45info.com findet. Die Firma hinter dieser Website hat sich die deutschsprachige Wikipedia vorgenommen und sie in «120.000 Informations-Clips» verarbeitet. Werbebotschaft: «Jedes Thema hören, sehen und verstehen in 45 Sekunden».
Sprachsynthese by Voice Reader
Der Text und die Tonbildschau, die man dabei präsentiert bekommt, basieren auf dem Material der jeweiligen Artikel der Wikipedia. Verwendet wird jeweils die Einleitung eines Artikels. Und das komplett - ohne Rücksicht auf im Artikel vorhandene Fehler.
Die Sprachsynthese stammt von «Linguatec Voice Reader». Die synthetische Sprecherin, genannt Julia, liefere «Audiobeiträge von herausragender Qualität», behauptet die Firma Linguatec, die sinnigerweise an der Gottfried-Keller-Straße 12 in München-Pasing ansässig ist.
Um wirklich eine herausragende Qualität zu erreichen, muss Julia aber noch viel lernen. Das wird schnell klar, wenn man sich die zu Weiach einschlägigen Artikel ansieht:
http://de.45info.com/video/Weiach
http://de.45info.com/video/Reformierte+Kirche+Weiach
Und: um etwas wirklich verstehen zu können wesentlich mehr als nur die einleitenden Sätze eines Wikipedia-Artikels. Aber das wissen die Verantwortlichen von Linguatec hoffentlich auch selber.
Fazit
Netter Versuch, aber nicht wirklich überzeugend. Vor allem Eigennamen wird das Programm wohl noch lange falsch interpretieren und dementsprechend in Sprache umwandeln. Es sei denn, man würde sich bei Wikipedia konsequent des Internationalen Phonetischen Alphabets bedienen und damit alle Texte hinterlegen.
[Veröffentlicht am 4. April 2010, 06:22]
1 Kommentar:
Gar nicht so schlecht … allerdings ärgern mich solche Anbieter, denn letztlich geht es ihnen darum, mit einer beinahe unendlichen Menge von Informationshäppchen Suchmaschinen-Benutzer auf ihre Seiten zu locken und so mit Werbung Geld zu verdienen.
Solche Anbieter sind übrigens auch häufig ein Grund, wieso Inhalte nicht unter einer vollständig freien Lizenz veröffentlicht werden.
Kommentar veröffentlichen