टेक्स्ट-टू-स्पीच मॉडलों
AI-Corporate टेक्स्ट-टू-स्पीच मॉडलों का समर्थन करता है जो टेक्स्ट को ऑडियो में बदलते हैं। ये मॉडल डैशबोर्ड पर टेक्स्ट टू ऑडियो में और चैट से ऑडियो जनरेट करने वाले फ़ंक्शनों में प्रयुक्त होते हैं।
वर्तमान कैटलॉग
| सप्लायर | मॉडल | टिप्पणी |
|---|---|---|
| OpenAI | GPT-4o mini TTS | प्राकृतिक ध्वनि वाला स्पीच के साथ टोन और स्टाइल पर अच्छी नियंत्रण। |
| Gemini 3.1 Flash TTS Preview | नया Gemini-टेक्स्ट-टू-स्पीच मॉडल स्टाइल, स्पीड और टोन पर सटीक नियंत्रण के साथ। | |
| Europese AI | Voxtral Mini TTS | Mistral Voxtral Mini पर आधारित यूरोपीय टेक्स्ट-टू-स्पीच। |
Claude के पास कैटलॉग में अपना टेक्स्ट-टू-स्पीच मॉडल नहीं है। यदि Claude सप्लायर के रूप में सक्षम है, तो स्पीच मॉडलों को अन्यConfigured सप्लायर्स के अनुसार ही मानक के रूप में रखा जाएगा।
स्पीच मॉडल क्या निर्धारित करता है
स्पीच मॉडल यह तय करता है कि टेक्स्ट कैसे उच्चार किया जाएगा और कौन-कौन सी सुविधाएं उपलब्ध होंगी। विचार करें:
- उपलब्ध आवाज़ें;
- वे भाषाएं जिनका एक आवाज़ समर्थन करती है;
- उच्चारण की गुणवत्ता और प्राकृतिकता;
- गति, टोन, एक्सेंट और उच्चारण के निर्देशों के पालन का तरीका।
आवाज़ें और भाषाएं
उपलब्ध आवाज़ें सप्लायर के अनुसार भिन्न होती हैं। AI-Corporate टेक्स्ट-टू-ऑडियो में केवल उन आवाज़ों को दिखाता है जो चुनी गई भाषा के अनुरूप हों, या बहुभाषी आवाज़ें हो। यदि किसी आवाज़ का उद्देश्य केवल कुछ भाषाओं के लिए है, तो आवाज के साथ वह भाषा उल्लेखित होती है।
OpenAI और Google कैटलॉग में अधिकतर भाषाओं को सपोर्ट करते हैं। Voxtral Mini TTS कॅटलॉग में एक छोटी सूची की भाषाएं हैं, जिसमें डच, अंग्रेज़ी, फ्रेंच, स्पेनिश, पुर्तगाली, इटालियन, जर्मन, हिंदी और अरबी शामिल हैं।