テキスト音声変換モデル
AI-Corporate は、テキストを音声に変換するテキスト音声変換モデルをサポートします。これらのモデルはダッシュボードの「テキストから音声」およびチャットから音声を生成する機能で使用されます。
現在のカタログ
| 提供者 | モデル | 備考 |
|---|---|---|
| OpenAI | GPT-4o mini TTS | 自然な発音と音色・スタイルの指示性が高い声。 |
| Gemini 3.1 Flash TTS Preview | 新しい Gemini 音声モデルで、スタイル・テンポ・トーンの正確な制御。 | |
| 欧州 AI | Voxtral Mini TTS | Mistral Voxtral Mini に基づく欧州のテキスト-音声。 |
Claude はカタログに独自のテキスト音声モデルを持っていません。Claude を提供者として有効化していても、音声モデルは他の設定済み提供者次第になります。
どのように音声モデルが決まるか
音声モデルは、テキストがどの ように発音されるかと、どの機能が利用可能かを決定します。以下を想像してください:
- 利用可能な声の種類
- 声がサポートする言語
- 発音の品質と自然さ
- テンポ、トーン、アクセント、発音に関する指示の追従方法
声と言語
利用可能な声は提供者ごとに異なります。AI-Corporate は「テキストから音声」時に、選択された言語に適した声、または複数言語に対応する声のみを表示します。特定の言語のみに対応している声は、声の横に言語が記載されます。
OpenAI と Google はカタログの多くの言語をサポートします。Voxtral Mini TTS は、オランダ語・英語・フランス語・スペイン語・ポルトガル語・イタリア語・ドイツ語・ヒンディー語・アラビア語を含む、より限られた言語セットをサポートします。
システムプロンプト
テキストから音声では、システムプロンプトを使用して発音やスタイルを指示できます。たとえば、オランダ語を自然に聞こえるようにする、AI、AI-Corporate、ChatGPT、OpenAI を英語の発音で発音させる、または Claude をフランス名として発音させる、といった指示が可能です。
好み
ユーザーは、テキスト音声設定を個人の好みとして保存できます。これにより、モデル、言語、声、発音指示を毎回選択する必要がなくなります。