Tekst-til- tale-modeller

AI-Corporate støtter tekst-til-tale-modeller som kan konvertere tekst til lyd. Disse modellene brukes i Tekst til lyd på dashbordet og i funksjoner som genererer lyd fra en chat.

Nåværende katalog

Leverandør	Modell	Merknad
OpenAI	GPT-4o mini TTS	Naturlig klingende tale med god styring av tone og stil.
Google	Gemini 3.1 Flash TTS Preview	Ny Gemini-tale-modell med presis styring av stil, tempo og tonasjon.
Europeisk AI	Voxtral Mini TTS	Europeisk tekst-til-tale basert på Mistral Voxtral Mini.

Claude har ingen egen tekst-til-tale-modell i katalogen. Hvis Claude er aktivert som leverandør, forblir tale-modellene avhengige av de andre konfigurerte leverandørene.

Hva en tale-modell bestemmer

En tale-modell bestemmer hvordan teksten uttales og hvilke muligheter som er tilgjengelige. Tenk på:

tilgjengelige stemmer;
språkene en stemme støtter;
kvaliteten og naturligheten i uttalen;
måten instruksjoner om tempo, tone, aksent og uttale følges på.

Stemmer og språk

Tilgjengelige stemmer varierer mellom leverandører. AI-Corporate viser ved tekst-til-lyd kun stemmer som passer til valgt språk, eller stemmer som passer for flere språk. Dersom en stemme er ment kun for visse språk, står språket ved stemmen.

OpenAI og Google støtter de fleste språk i katalogen. Voxtral Mini TTS støtter et mindre sett språk, blant annet norsk, engelsk, fransk, spansk, portugisisk, italiensk, tysk, hindi og arabisk.

Systeemprompt

Ved tekst-til-audio kan systeemprompten brukes til å dirigere uttale og stil. Du kan for eksempel angi at norsk skal høres naturlig ut, at termer som AI, AI-Corporate, ChatGPT og OpenAI skal uttales med engelsk uttale, eller at Claude skal høres som et fransk navn.

Preferanser

Brukere kan lagre sine tekst-til-lyd-innstillinger som personlige preferanser. Da trenger ikke modell, språk, stemme og uttalesinstruksjoner å velges på nytt hver gang.

Nåværende katalog​

Hva en tale-modell bestemmer​

Stemmer og språk​

Systeemprompt​

Preferanser​

Nåværende katalog

Hva en tale-modell bestemmer

Stemmer og språk

Systeemprompt

Preferanser