Text zu Audio
Mit Text zu Audio wandelt ihr Text in eine Audio-Datei um. Das ist nützlich für Sprachaufnahmen, Instruktionsvideos, interne Kommunikation, Schulungsmaterial und Skripte.
Starten vom Dashboard
Auf dem Dashboard wählt ihr unter dem Eingabefeld Text zu Audio. Das Eingabefeld wird größer, damit längere Skripte gut eingegeben werden können. Danach könnt ihr den Text eingeben und Audio generieren.
Einstellungen
Über den Einstellungsknopf neben dem Eingabefeld könnt ihr die Sprach-Einstellungen anpassen.
| Einstellung | Erklärung |
|---|---|
| Modell | Wählt das Text-zu-Sprachmodell. |
| Sprache | Wählt die Sprache, in der der Text ausgesprochen werden soll. |
| Stimme | Wählt eine Stimme, die für die gewählte Sprache geeignet ist. |
| Systeemprompt | Gebt Anweisungen zur Aussprache, Tonfall, Tempo, Akzent und speziellen Begriffen. |
| Stilreferenz | Fügt zusätzliche Hinweise zur gewünschten Sprechweise hinzu. |
Die Stimmliste wird nach der gewählten Sprache gefiltert. Wenn eine Stimme nur für bestimmte Sprachen vorgesehen ist, siehst du diese Sprache bei der Stimme aufgeführt.
Aussprache und Stil
Der Systeemprompt steuert, wie die Stimme klingen soll. Hier könnt ihr zum Beispiel festlegen:
- dass der Sprecher Niederländisch als Muttersprache klingen soll;
- dass Wörter wie AI, AI-Corporate, ChatGPT, OpenAI und Gemini mit englischer Aussprache ausgesprochen werden dürfen;
- dass Claude als französischer Name ausgesprochen werden soll;
- oder der Ton ruhig, warm, geschäftlich, informell, niedrig oder energisch sein soll.
Wenn ihr eine andere Sprache wählt, passt AI-Corporate die Standardanweisungen an diese Sprache an.
Speichern und Wiederherstellen
Ihr könnt eure Einstellungen auf eurem Konto speichern. AI-Corporate merkt sich dann unter anderem Modell, Sprache, Stimme und Systeemprompt. Bei Standard wiederherstellen löscht ihr diese gespeicherten Präferenzen.
Ergebnis
Nach dem Generieren erscheint die Audiodatei direkt im Chat. Ihr könnt sie dort mit dem Audio-Player abspielen und mit dem Download-Button herunterladen.
Während der Generierung wird das Eingabeformular vorübergehend deaktiviert. So vermeidet ihr, dass mehrere Audio-Generierungen durcheinanderlaufen.