Tekst-naar-spraakmodellen
AI-Corporate ondersteunt tekst-naar-spraakmodellen waarmee tekst kan worden omgezet naar audio. Deze modellen worden gebruikt bij Tekst naar audio op het dashboard en bij functies die audio genereren vanuit een chat.
Huidige catalogus
| Aanbieder | Model | Opmerking |
|---|---|---|
| OpenAI | GPT-4o mini TTS | Natuurlijk klinkende spraak met goede sturing op toon en stijl. |
| Gemini 3.1 Flash TTS Preview | Nieuw Gemini-spraakmodel met nauwkeurige sturing op stijl, tempo en toon. | |
| Europese AI | Voxtral Mini TTS | Europese text-to-speech op basis van Mistral Voxtral Mini. |
Claude heeft geen eigen tekst-naar-spraakmodel in de catalogus. Als Claude als aanbieder is ingeschakeld, blijven spraakmodellen afhankelijk van de overige geconfigureerde aanbieders.
Wat een spraakmodel bepaalt
Een spraakmodel bepaalt hoe tekst wordt uitgesproken en welke mogelijkheden beschikbaar zijn. Denk aan:
- de beschikbare stemmen;
- de talen die een stem ondersteunt;
- de kwaliteit en natuurlijkheid van de uitspraak;
- de manier waarop instructies over tempo, toon, accent en uitspraak worden opgevolgd.