処理
言語モデル
言語モデルは、人間の言語を理解、解釈、生成できる高度なAIシステムです。これらのモデルは膨大なテキストデータセットで訓練され、パターン、語の組み合わせ、文構造、さらにはさまざまな言語と言語使用の微妙なニュアンスを学習します。現代の多くの言語モデルの核はトランスフォーマーアーキテクチャであり、自己注意機構を用いて、ある文脈でどの部分が重要かを判断します。
言語処理において、これらのモデルは統計的方法を用いて、次に来る最も可能性の高い単語や文を予測します。長いテキストの文脈を理解することができ、文法的に正しいだけでなく、内容的にも一貫性があり関連性のあるテキストを生成します。
例えばチャットボットやテキスト生成器のために言語モデルを使用する場合、モデルは特定のプロンプトや初期データを与えられ、それに基づいて文脈に論理的に続くテキストを生成します。これらのモデルの目的は、内容とスタイルの両方でできるだけ人間らしいテキストを出力することです。
テキストから画像へのモデル
テキストから画像へのモデルは、説明されたテキスト記述から視覚的表現を生成することができるAIシステムです。写真、イラスト、その他の画像素材を作成します。これらのモデルは高度なニューラルネットワーク、特に生成対向ネットワーク(GAN)やそれを派生させた拡散モデルを利用します。
処理は、ユーザーが入力したテキスト説明から始まります。モデルはこのテキストの意味と文脈を理解しようとします。次に、学習中に得た知識を活用して、テキスト描述に対応する画像を生成します。大量のテキストと画像のペアデータセットで訓練されます。
訓練中、モデルはテキスト描述と視覚的特徴との関連を学習します。例えば、モデルが「黄色い太陽の上に青い海」という語の組み合わせを、これを説明する画像と繰り返し組み合わせて見た場合、これらの要素を識別し、今後の画像作成で再現できるようになります。
結果は、入力されたテキスト描述に合致することが多く、詳細な画像として現れます。これらのモデルはますます洗練され、複数のオブジェクトや抽象的概念を含む複雑なシナリオを表現する能力があります。芸術作品の制作、ゲーム設計、仮想現実など、幅広い応用分野で利用されています。
AI-Corporate が公開するモデル
AI-Corporate は、さまざまなAIモデルを大手テクノロジー企業が提供するAPIを通じて公開していることを理解しておくことが重要です。API、またはApplication Programming Interfaceは、ソフトウェアプログラム同士が通信するための規則と定義のセットです。プログラム同士が情報をやり取りし、相互に機能を呼び出すための「言語」のような役割を果たします。AI-Corporate 自身は言語モデルやテキスト・ツー・画像モデルを保有していません。
私たちは、さまざまなモデルの結果について責任を負いません。とはいえ、企業向けに最適で興味深いモデルを選定することには配慮しています。
処理手順
回答を生成するために以下の手順を踏みます:
- ユーザーがプロンプトを作成します。
- フロントエンドのウェブアプリケーションはこれをアクティブなチャットに接続し、ステータスを「初期化」としてチャットメッセージを追加します。
- AI-Corporate のサーバー上で、チャットメッセージの追加により関数がトリガーされます。
- チャットメッセージのステータスを「処理中」に設定します。
- ドキュメント付きのチャットを選択した場合、サーバーはまずFirestore ベクタデータベースへ要求を送信し、文書からテキストを抽出します。
- その後、選択された言語モデルへAPI連携を介してリクエストを送ります。
- 設定がストリーミングの場合、受信した10チャンクごと、または100チャンクを受信した後の25チャンクごとにメッセージを保存します。
- 全体の回答を受信すると、ステータスを「完了」に設定します。
- フロントエンドアプリケーションはデータベース更新の都度リフレッシュします。
- エラーが検出された場合、ステータスを「エラー」とし、エラーメッセージを表示します。
各APIリクエストには個人データを送信しません。ただし、ユーザーはプロンプトやアップロードされたドキュメントに個人データを含めることがあります。