Tekst-til- tale-modeller
AI-Corporate støtter tekst-til-tale-modeller som kan konvertere tekst til lyd. Disse modellene brukes i Tekst til lyd på dashbordet og i funksjoner som genererer lyd fra en chat.
Nåværende katalog
| Leverandør | Modell | Merknad |
|---|---|---|
| OpenAI | GPT-4o mini TTS | Naturlig klingende tale med god styring av tone og stil. |
| Gemini 3.1 Flash TTS Preview | Ny Gemini-tale-modell med presis styring av stil, tempo og tonasjon. | |
| Europeisk AI | Voxtral Mini TTS | Europeisk tekst-til-tale basert på Mistral Voxtral Mini. |
Claude har ingen egen tekst-til-tale-modell i katalogen. Hvis Claude er aktivert som leverandør, forblir tale-modellene avhengige av de andre konfigurerte leverandørene.
Hva en tale-modell bestemmer
En tale-modell bestemmer hvordan teksten uttales og hvilke muligheter som er tilgjengelige. Tenk på:
- tilgjengelige stemmer;
- språkene en stemme støtter;
- kvaliteten og naturligheten i uttalen;
- måten instruksjoner om tempo, tone, aksent og uttale følges på.
Stemmer og språk
Tilgjengelige stemmer varierer mellom leverandører. AI-Corporate viser ved tekst-til-lyd kun stemmer som passer til valgt språk, eller stemmer som passer for flere språk. Dersom en stemme er ment kun for visse språk, står språket ved stemmen.
OpenAI og Google støtter de fleste språk i katalogen. Voxtral Mini TTS støtter et mindre sett språk, blant annet norsk, engelsk, fransk, spansk, portugisisk, italiensk, tysk, hindi og arabisk.
Systeemprompt
Ved tekst-til-audio kan systeemprompten brukes til å dirigere uttale og stil. Du kan for eksempel angi at norsk skal høres naturlig ut, at termer som AI, AI-Corporate, ChatGPT og OpenAI skal uttales med engelsk uttale, eller at Claude skal høres som et fransk navn.
Preferanser
Brukere kan lagre sine tekst-til-lyd-innstillinger som personlige preferanser. Da trenger ikke modell, språk, stemme og uttalesinstruksjoner å velges på nytt hver gang.