Ana içeriğe atla

Metin-iyonlu- konuşma modelleri

AI-Corporate metin-naar-spraak modellerini destekler; bu modeller metni sesli olarak dönüştürür. Bu modeller, paneldeki Metinden sese bölümünde ve sohbet'ten ses üreten işlevlerde kullanılır.

Mevcut katalog

SağlayıcıModelNot
OpenAIGPT-4o mini TTSTon ve stil üzerinde iyi yönlendirme ile doğal sesli konuşma.
GoogleGemini 3.1 Flash TTS PreviewStil, tempo ve ton üzerinde doğru yönlendirme ile yeni Gemini konuşma modeli.
Avrupa AIVoxtral Mini TTSMistral Voxtral Mini tabanlı Avrupa metin-okunabilir sese sahip.

Claude, katalogda kendi metinden sese modeline sahip değildir. Claude sağlayıcısı etkinleştirilirse, konuşma modelleri diğer yapılandırılmış sağlayıcılara bağlı olarak kalır.

Bir konuşma modelinin belirlediği şey

Bir konuşma modeli, metnin nasıl telaffuz edileceğini ve hangi olanakların mevcut olduğunu belirler. Şu konulara dikkat edin:

  • mevcut sesler;
  • bir sesin desteklediği diller;
  • telaffuzın kalitesi ve doğallığı;
  • talimatların tempo, ton, vurgu ve telaffuz konularında nasıl takip edildiği.

Sesler ve diller

Mevcut sesler sağlayıcıya göre değişir. AI-Corporate, metinden sese bakarken yalnızca seçilen dile uyan sesleri veya birden çok dili kapsayan sesleri gösterir. Bir ses yalnızca belirli diller için tasarlanmışsa, o sesin yanında o dil belirtilir.

OpenAI ve Google, katalogdaki çoğu dili destekler. Voxtral Mini TTS, Türkçe de dahil olmak üzere daha küçük bir diller kümesini destekler: Hollandaca, İngilizce, Fransızca, İspanyolca, Portekizce, İtalyanca, Almanca, Hintçe ve Arapça.

Sistem istemi

Metinden sese durumda sistem istemi, telaffuz ve stili yönlendirmek için kullanılabilir. Örneğin, Hollandacanın doğal şekilde konuşması gerektiğini belirtmek, AI, AI-Corporate, ChatGPT ve OpenAI terimlerinin İngilizce telaffuzla okunmasına izin vermek veya Claude isminin Fransızca gibi okunmasını istemek gibi ayarlar yapabilirsiniz.

Tercihler

Kullanıcılar kendi metin-naar-audio ayarlarını kişisel tercihler olarak kaydedebilir. Böylece model, dil, ses ve telaffuz talimatlarını her seferinde yeniden seçmek zorunda kalmaz.