Gå til hovedindhold

Tekst-til-tale-modeller

AI-Corporate understøtter tekst-til-tale-modeller, som konverterer tekst til lyd. Disse modeller bruges i Tekst til lyd på instrumentbrætet og i funktioner, der genererer lyd fra en chat.

Nuværende katalog

UdbyderModelBemærkning
OpenAIGPT-4o mini TTSNaturligt klingende tale med god styring af tone og stil.
GoogleGemini 3.1 Flash TTS PreviewNyt Gemini-tale-model med nøjagtig styring af stil, tempo og tone.
Europæisk AIVoxtral Mini TTSEuropæisk tekst-til-tale baseret på Mistral Voxtral Mini.

Claude har ikke noget eget tekst-til-tale-model i kataloget. Hvis Claude som udbyder er aktiveret, forbliver tale-modeller afhængige af de øvrige konfigurerede udbydere.

Hvad et tale-model bestemmer

Et tale-model bestemmer, hvordan teksten udtales, og hvilke muligheder der er tilgængelige. Tænk på:

  • de tilgængelige stemmer;
  • de sprog, en stemme understøtter;
  • kvaliteten og naturligheden af udtalen;
  • måden, hvorpå instruktioner om tempo, tone, accent og udtale følges.

Stemmer og sprog

Tilgængelige stemmer varierer per udbyder. AI-Corporate viser ved tekst til lyd kun stemmer, der passer til det valgte sprog, eller stemmer, der er egnet til flere sprog. Hvis en stemme kun er beregnet til bestemte sprog, står det sprog ved stemmen.

OpenAI og Google understøtter de fleste sprog i kataloget. Voxtral Mini TTS understøtter et mindre sæt sprog, herunder nederlandsk, engelsk, fransk, spansk, portugisisk, italiensk, tysk, hindi og arabisk.

Systeemprompt

Ved tekst til lyd kan systeempromptet bruges til at styre udtale og stil. Du kan f.eks. angive, at nederlandsk skal lyde naturligt, at termer som AI, AI-Corporate, ChatGPT og OpenAI må udtales med engelsk udtale, eller at Claude skal lyde som et fransk navn.

Præferencer

Brugere kan gemme deres tekst-til-lyd-indstillinger som personlige præferencer. Så behøver model, sprog, stemme og udtaleinstruktioner ikke vælges igen og igen.