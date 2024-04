OpenAI, das US-Unternehmen hinter dem künstlich-intelligenten Textgenerator ChatGPT, hat mehrere KI-Angebote im Programm, zu denen unter anderem das sogenannte TTS-Modell des Anbieters zählt.

TTS steht für Text-to-Speech, also für die synthetische Spracherzeugung auf Basis von Texten, mit denen sich beliebige Artikel, Dokumente und Schriftstücke in Hörinhalte umwandeln lassen. Dabei bietet OpenAI zwei unterschiedliche Modelle an: tts-1 ist auf die Echtzeitumwandlung von Textinhalten ausgerichtet, tts-1-hd benötigt etwas mehr Zeit und konzentriert sich auf das qualitativ hochwertigste Ergebnis.

Die aktuelle Ausgabe der TTS-KI-Modelle versteht sich auf zahlreiche Eingangssprachen und bietet mehrere unterschiedliche Stimmen an, zu denen etwa Alloy, Echo, Fable, Onyx, Nova und Shimmer zählen.

Über die Programmierschnittstelle von OpenAI lässt sich das Modell mit Texten füttern, anschließend liefert dieses je nach Wunsch eine MP3- oder auch eine Opus-, AAC-, FLAC-, WAV-, oder PCM-Datei aus.

Nutzer der Schnittstelle erhalten alle Rechte an den so erstellten Audiodateien, jedoch auch die Auflage, Anwender darüber zu informieren, dass sie eine KI-generierte Stimme hören und nicht eine echte Person.

AudioBuddy liefert TTS für markierte Texte

Zur Nutzung der TTS-Schnittstelle bietet sich jetzt die Mac-Applikation AudioBuddy an, die direkt mit der API des Anbieters kommunizieren kann. Nutzer müssen hier lediglich ihren vorhandenen API-Schlüssel eintragen und können sich zuvor kopierte Textinhalte mit wenigen Mausklicks direkt in der hervorragenden Audioqualität des OpenAI-Angebotes vorlesen lassen.

Der Download steht sowohl auf dem Open-Source-Portal GitHub als auch über den Gumroad-Shop des Entwicklers bereit. Hier wird AudioBuddy zum „Zahle, was du willst“-Preis angeboten und kann sowohl als Freeware aus dem Netz geladen werden, lässt sich aber auch mit einer 10-Euro-Spende an den Entwickler verknüpfen.

Die API-Preise liegen bei $30 für eine Million vertonte Zeichen. Eine voll geschriebene DIN-A-4 Seite kommt auf grob 2.000 Zeichen.

Auch mit Bordmitteln möglich