Metin-iyonlu- konuşma modelleri
AI-Corporate metin-naar-spraak modellerini destekler; bu modeller metni sesli olarak dönüştürür. Bu modeller, paneldeki Metinden sese bölümünde ve sohbet'ten ses üreten işlevlerde kullanılır.
Mevcut katalog
| Sağlayıcı | Model | Not |
|---|---|---|
| OpenAI | GPT-4o mini TTS | Ton ve stil üzerinde iyi yönlendirme ile doğal sesli konuşma. |
| Gemini 3.1 Flash TTS Preview | Stil, tempo ve ton üzerinde doğru yönlendirme ile yeni Gemini konuşma modeli. | |
| Avrupa AI | Voxtral Mini TTS | Mistral Voxtral Mini tabanlı Avrupa metin-okunabilir sese sahip. |
Claude, katalogda kendi metinden sese modeline sahip değildir. Claude sağlayıcısı etkinleştirilirse, konuşma modelleri diğer yapılandırılmış sağlayıcılara bağlı olarak kalır.
Bir konuşma modelinin belirlediği şey
Bir konuşma modeli, metnin nasıl telaffuz edileceğini ve hangi olanakların mevcut olduğunu belirler. Şu konulara dikkat edin:
- mevcut sesler;
- bir sesin desteklediği diller;
- telaffuzın kalitesi ve doğallığı;
- talimatların tempo, ton, vurgu ve telaffuz konularında nasıl takip edildiği.
Sesler ve diller
Mevcut sesler sağlayıcıya göre değişir. AI-Corporate, metinden sese bakarken yalnızca seçilen dile uyan sesleri veya birden çok dili kapsayan sesleri gösterir. Bir ses yalnızca belirli diller için tasarlanmışsa, o sesin yanında o dil belirtilir.
OpenAI ve Google, katalogdaki çoğu dili destekler. Voxtral Mini TTS, Türkçe de dahil olmak üzere daha küçük bir diller kümesini destekler: Hollandaca, İngilizce, Fransızca, İspanyolca, Portekizce, İtalyanca, Almanca, Hintçe ve Arapça.
Sistem istemi
Metinden sese durumda sistem istemi, telaffuz ve stili yönlendirmek için kullanılabilir. Örneğin, Hollandacanın doğal şekilde konuşması gerektiğini belirtmek, AI, AI-Corporate, ChatGPT ve OpenAI terimlerinin İngilizce telaffuzla okunmasına izin vermek veya Claude isminin Fransızca gibi okunmasını istemek gibi ayarlar yapabilirsiniz.
Tercihler
Kullanıcılar kendi metin-naar-audio ayarlarını kişisel tercihler olarak kaydedebilir. Böylece model, dil, ses ve telaffuz talimatlarını her seferinde yeniden seçmek zorunda kalmaz.