Tekst-til-tale-modeller

AI-Corporate understøtter tekst-til-tale-modeller, som konverterer tekst til lyd. Disse modeller bruges i Tekst til lyd på instrumentbrætet og i funktioner, der genererer lyd fra en chat.

Nuværende katalog

Udbyder	Model	Bemærkning
OpenAI	GPT-4o mini TTS	Naturligt klingende tale med god styring af tone og stil.
Google	Gemini 3.1 Flash TTS Preview	Nyt Gemini-tale-model med nøjagtig styring af stil, tempo og tone.
Europæisk AI	Voxtral Mini TTS	Europæisk tekst-til-tale baseret på Mistral Voxtral Mini.

Claude har ikke noget eget tekst-til-tale-model i kataloget. Hvis Claude som udbyder er aktiveret, forbliver tale-modeller afhængige af de øvrige konfigurerede udbydere.

Hvad et tale-model bestemmer

Et tale-model bestemmer, hvordan teksten udtales, og hvilke muligheder der er tilgængelige. Tænk på:

de tilgængelige stemmer;
de sprog, en stemme understøtter;
kvaliteten og naturligheden af udtalen;
måden, hvorpå instruktioner om tempo, tone, accent og udtale følges.

Stemmer og sprog

Tilgængelige stemmer varierer per udbyder. AI-Corporate viser ved tekst til lyd kun stemmer, der passer til det valgte sprog, eller stemmer, der er egnet til flere sprog. Hvis en stemme kun er beregnet til bestemte sprog, står det sprog ved stemmen.

OpenAI og Google understøtter de fleste sprog i kataloget. Voxtral Mini TTS understøtter et mindre sæt sprog, herunder nederlandsk, engelsk, fransk, spansk, portugisisk, italiensk, tysk, hindi og arabisk.

Systeemprompt

Ved tekst til lyd kan systeempromptet bruges til at styre udtale og stil. Du kan f.eks. angive, at nederlandsk skal lyde naturligt, at termer som AI, AI-Corporate, ChatGPT og OpenAI må udtales med engelsk udtale, eller at Claude skal lyde som et fransk navn.

Præferencer

Brugere kan gemme deres tekst-til-lyd-indstillinger som personlige præferencer. Så behøver model, sprog, stemme og udtaleinstruktioner ikke vælges igen og igen.

Nuværende katalog​

Hvad et tale-model bestemmer​

Stemmer og sprog​

Systeemprompt​

Præferencer​

Nuværende katalog

Hvad et tale-model bestemmer

Stemmer og sprog

Systeemprompt

Præferencer