In letzter Zeit habe ich viele Gespräche geführt, ob ich glaube, dass KI-Dienste professionelle Sprecherinnen und Sprecher ersetzen können. Ich habe mich intensiv mit diesem Thema und den aktuellen KI-Diensten auseinandergesetzt und muss sagen, dass die Ergebnisse teilweise beeindruckend sind, wenn es darum geht, schnelle und konsistente Ergebnisse zu erzielen, die den reinen Faktor „Informationsaustausch“ betreffen.
Trotzdem muss ich betonen, dass diese KI-Systeme noch einen entscheidenden Unterschied zu echten menschlichen Stimmen aufweisen, besonders wenn man genau hinhört. Auch wenn Atmung, Pausen und sogar kleine Sprachfehler mittlerweile in die KI integriert werden, fehlt immer noch das gewisse Etwas, das nur ein echter Mensch vermitteln kann: Emotionen und Gefühle. Was im rein Textlichen ganz gut klappt, funktioniert im gesprochenen Wort nur semi.
Für bestimmte Anwendungen wie Systemsteuerungen sind diese KI-Ansagen zweifellos nützlich, da schnell und günstig. Aber für emotionale und individuelle Produktionen sind sie meiner Meinung nach noch lange nicht ausgereift genug, um echte Konkurrenz bieten zu können. Letztendlich geht es darum, eine Verbindung zum Empfänger herzustellen und das geht nicht alleine über Aussprache und Worte.
Eine bisher zweifelsfrei grandiose Technologie, die Einsatzorte hat. Um Menschen zu erreichen bedarf es meiner Meinung nach aber weiterhin Menschen.
#text2speech #voice #sprecher #studio
Folgen Sie mir gerne auch auf LinkedIn – Zum Beitrag