Text zu Audio

Mit Text zu Audio wandelt ihr Text in eine Audio-Datei um. Das ist nützlich für Sprachaufnahmen, Instruktionsvideos, interne Kommunikation, Schulungsmaterial und Skripte.

Starten vom Dashboard

Auf dem Dashboard wählt ihr unter dem Eingabefeld Text zu Audio. Das Eingabefeld wird größer, damit längere Skripte gut eingegeben werden können. Danach könnt ihr den Text eingeben und Audio generieren.

Einstellungen

Über den Einstellungsknopf neben dem Eingabefeld könnt ihr die Sprach-Einstellungen anpassen.

Einstellung	Erklärung
Modell	Wählt das Text-zu-Sprachmodell.
Sprache	Wählt die Sprache, in der der Text ausgesprochen werden soll.
Stimme	Wählt eine Stimme, die für die gewählte Sprache geeignet ist.
Systeemprompt	Gebt Anweisungen zur Aussprache, Tonfall, Tempo, Akzent und speziellen Begriffen.
Stilreferenz	Fügt zusätzliche Hinweise zur gewünschten Sprechweise hinzu.

Die Stimmliste wird nach der gewählten Sprache gefiltert. Wenn eine Stimme nur für bestimmte Sprachen vorgesehen ist, siehst du diese Sprache bei der Stimme aufgeführt.

Aussprache und Stil

Der Systeemprompt steuert, wie die Stimme klingen soll. Hier könnt ihr zum Beispiel festlegen:

dass der Sprecher Niederländisch als Muttersprache klingen soll;
dass Wörter wie AI, AI-Corporate, ChatGPT, OpenAI und Gemini mit englischer Aussprache ausgesprochen werden dürfen;
dass Claude als französischer Name ausgesprochen werden soll;
oder der Ton ruhig, warm, geschäftlich, informell, niedrig oder energisch sein soll.

Wenn ihr eine andere Sprache wählt, passt AI-Corporate die Standardanweisungen an diese Sprache an.

Speichern und Wiederherstellen

Ihr könnt eure Einstellungen auf eurem Konto speichern. AI-Corporate merkt sich dann unter anderem Modell, Sprache, Stimme und Systeemprompt. Bei Standard wiederherstellen löscht ihr diese gespeicherten Präferenzen.

Ergebnis

Nach dem Generieren erscheint die Audiodatei direkt im Chat. Ihr könnt sie dort mit dem Audio-Player abspielen und mit dem Download-Button herunterladen.

Während der Generierung wird das Eingabeformular vorübergehend deaktiviert. So vermeidet ihr, dass mehrere Audio-Generierungen durcheinanderlaufen.

Starten vom Dashboard​

Einstellungen​

Aussprache und Stil​

Speichern und Wiederherstellen​

Ergebnis​

Starten vom Dashboard

Einstellungen

Aussprache und Stil

Speichern und Wiederherstellen

Ergebnis