テキスト音声変換モデル

AI-Corporate は、テキストを音声に変換するテキスト音声変換モデルをサポートします。これらのモデルはダッシュボードの「テキストから音声」およびチャットから音声を生成する機能で使用されます。

現在のカタログ

提供者	モデル	備考
OpenAI	GPT-4o mini TTS	自然な発音と音色・スタイルの指示性が高い声。
Google	Gemini 3.1 Flash TTS Preview	新しい Gemini 音声モデルで、スタイル・テンポ・トーンの正確な制御。
欧州 AI	Voxtral Mini TTS	Mistral Voxtral Mini に基づく欧州のテキスト-音声。

Claude はカタログに独自のテキスト音声モデルを持っていません。Claude を提供者として有効化していても、音声モデルは他の設定済み提供者次第になります。

どのように音声モデルが決まるか

音声モデルは、テキストがどのように発音されるかと、どの機能が利用可能かを決定します。以下を想像してください：

利用可能な声の種類
声がサポートする言語
発音の品質と自然さ
テンポ、トーン、アクセント、発音に関する指示の追従方法

声と言語

利用可能な声は提供者ごとに異なります。AI-Corporate は「テキストから音声」時に、選択された言語に適した声、または複数言語に対応する声のみを表示します。特定の言語のみに対応している声は、声の横に言語が記載されます。

OpenAI と Google はカタログの多くの言語をサポートします。Voxtral Mini TTS は、オランダ語・英語・フランス語・スペイン語・ポルトガル語・イタリア語・ドイツ語・ヒンディー語・アラビア語を含む、より限られた言語セットをサポートします。

システムプロンプト

テキストから音声では、システムプロンプトを使用して発音やスタイルを指示できます。たとえば、オランダ語を自然に聞こえるようにする、AI、AI-Corporate、ChatGPT、OpenAI を英語の発音で発音させる、または Claude をフランス名として発音させる、といった指示が可能です。

好み

ユーザーは、テキスト音声設定を個人の好みとして保存できます。これにより、モデル、言語、声、発音指示を毎回選択する必要がなくなります。

現在のカタログ​

どのように音声モデルが決まるか​

声と言語​

システムプロンプト​

好み​

現在のカタログ

どのように音声モデルが決まるか

声と言語

システムプロンプト

好み