Was ist Text-to-Speech?

Digitalaudio ist heute allgegenwärtig, auch in Textinhalten und Zeitungen, wo es Leser zu Hörern macht. Dies ist eine neue Möglichkeit, Inhalte in einer Umgebung, in der die Zuhörer aufnahmefähig und interessiert sind, gewinnbringend zu nutzen.

Laut einem im Januar 2021 veröffentlichten Bericht von MarketsandMarkets wurde der Markt für Text-to-Speech (Sprachsynthese) 2020 auf 2 Mrd. US$ geschätzt und wird bis 2026 voraussichtlich 5 Mrd. US$ erreichen.  

 

Die wichtigsten Wachstumsfaktoren sind die steigende Nachfrage nach mobilen Geräten, erhöhte öffentliche Ausgaben für die Bildung von Behinderten und älteren Menschen sowie neue Wege des Lesens und Lernens 

 

In den Vereinigten Staaten haben fast 200 Millionen Hörer auf digitales Hören umgestellt, wobei die Technologie zur Umwandlung von Text in Audio hier eine große Rolle spielt. Zahlreiche Akteure haben sich in diesem Markt etabliert. 

 

Zeitung hören statt lesen 

Seit vielen Jahren verlagern sich die Werbeeinnahmen von Zeitungen und Magazinen in den digitalen Bereich, doch ihr altes, auf Papier basierendes Geschäftsmodell leidet seit dem Aufkommen von Mobilgeräten unter der Umstellung. Text-to-Speech bringt im Kontext zunehmender Mobilität eine neue Dimension von Textinhalten und einen Mehrwert für den Leser.  

 

Für die Presse ist Audio ein neuer Wachstumsfaktor. Das liegt daran, dass die Aufmerksamkeit von Hörern im Durchschnitt dreimal so lange anhält wie die von Lesern. Eine britische Studie, die von der Publisher’s Association durchgeführt wurde, zeigt, dass für die Mehrheit der Befragten das Hören eines Buches oder Artikels eindringlicher und intimer ist als bloßes Lesen. Dies ist ein Kontext, in dem digitale Audiowerbung ganz natürlich ihren Platz findet, da sie in einem Umfeld der Nähe und größeren Aufnahmefähigkeit ausgestrahlt wird. 

 

Digitale Audiowerbung gewinnt rasch an Bedeutung, wie Audiate.Me, ein Unternehmen, das sich darauf spezialisiert hat, Texte mittels eines simplen Widget in Audioinhalte umzuwandeln, bestätigt. Im vergangenen Jahr verzeichnete das Unternehmen einen Umsatzsprung von 60 % bei den Programmen im Bereich Digital Audio 

 

Einer der Pioniere auf dem Gebiet der Sprachsynthese ist Trinity Audio, ein 2017 gegründetes Unternehmen aus Tel Aviv. Seine Mission, so CEO Ron Jowarski, ist folgende: „to audify the Internet“ (wörtlich: dem Internet eine Stimme geben). Durch den Einsatz von Text-to-Speech-Technologien für Audio spricht es die drei Säulen des Bereichs an: Verleger, Leser und Werbetreibende. 

 

Vom Text zum Podcast 

 Ein weiterer innovativer Player auf diesem Gebiet, Remixd aus Washington DC, ermöglicht die Schaffung von Podcasts auf der Grundlage von Textinhalten. Ihre einfache Technologie ermöglicht es Marken, entweder eine Podcast-Präsenz auf den wichtigsten Plattformen aufzubauen oder diese anzureichern. Diese Technologie erfordert keine zusätzliche Entwicklungsarbeit. Das Unternehmen hat sich auf Premium-Inhalte spezialisiert, die von prestigeträchtigen Marken wie Sports Illustrated, The Verge, Pop Sugar, The New Yorker, People und Thrillist genutzt werden. 

2021 – der Audio-Boom hält an 

Im Bereich Text-to-Speech wird das Jahr 2020 als Katalysator in die Geschichte eingehen: Die aufeinanderfolgenden Lockdowns haben die Nachfrage nach Audio eindeutig gesteigert. Die Verlagswelt verstand sehr schnell die Veränderungen im Medienkonsum und fügt massenhaft Audioversionen von Presseartikeln hinzu.  

 

Für Verlage ist dies eine KI-Technologie, die einfach zu implementieren, kostengünstig und skalierbar ist und das Einfügen von Audio-Werbung in Inhalte ermöglicht. Hörer sind dafür empfänglicher: Sie können sich über die neuesten Entwicklungen in den Nachrichten auf dem Laufenden halten, unabhängig davon, was sie zur gleichen Zeit tun.  

 

Trinity Audio veröffentlichte erstmals einen interessanten Bericht zum Thema Hörerbindung mit Digitalaudio und nativer Audiowerbung, aus dem man bereits einiges lernen kann:  

 

  1. Die gesamte „Listen-Through-Rate“ (LTR) beträgt bei Audio-Inhalten 59 %. 
  2. Das Hören von Audiowerbung ist akzeptiert, die LTR beträgt 91 % 
  3. Hörer hören lieber längere Inhalte: eine LTR von 70 % bei Inhalten, die länger als 5 Minuten dauern, verglichen mit weniger als 60 % bei kürzeren Inhalten. 

 

Lassen Sie uns über die Möglichkeiten sprechen, wie Sie mit Text-to-Speech Ihre Inhalte gewinnbringend nutzen können! 

Related posts

Load More

Don't miss a thing!