メインコンテンツへスキップ

Audio Transcriptie & Vergadernotulen

AI-Corporate は OpenAI のリアルタイム API を使用して、音声をテキストに変換する強力な文字起こし機能を提供します。文字起こしはライブで行われるため、テキストが正しく表示されているかをすぐに確認できます。さらに、文字起こしを基に自動的に会議メモを作成することもできます。

スタート画面

文字起こしモジュールのスタート画面では、新規のリアルタイム録音を選ぶか、既存の音声ファイルをアップロードするかを選択できます。

音声の提供

文字起こしのための音声提供には、2つの方法があります。

AI-Corporate での直接録音

大きな「Start Opname(録音開始)」ボタンをクリックしてリアルタイム録音を開始します。録音開始前には、録音設定のダイアログが表示されます。

録音設定

録音を開始する際、さまざまな設定を構成できます。

  1. 録音タイプ: 音質を最適化する録音タイプを選択してください。

    • プライベート録音: マイクに近い1人用(ポッドキャスト、個人メモ)
    • 会議(標準): 複数の話者がいる部屋向け
    • 講義またはプレゼンテーション: 主講者1名と対話のある場合

    選択に基づいて適切なオーディオフィルターが適用されます:

    • プライベート録音にはネアフィールドフィルター
    • 会議にはフィルターなし(全ての話者を正確にキャプチャするため)
    • 講義・プレゼンにはファーフィールドフィルター
  2. 音声録音: 録音中に音声を保存するかどうかを選択

    • はい: 音声は Firebase Storage に保存されます
    • いいえ: 文字起こしテキストのみが保存されます
  3. 音声アップロード間隔(音声録音を選択した場合のみ):

    • 音声が保存される間隔を設定します(1-15分)
    • 標準: 5分
    • 短い間隔(例: 1-2分): 音声ファイルが増えますが、コンピューターのクラッシュ時の安全性は高まります
    • 長い間隔(例: 10-15分): ファイル数が少なくなりますが、技術的問題時の損失リスクがあります

既存の音声ファイルを使用

以前に録音した音声ファイルを AI-Corporate にアップロードすることもできます。ボタン「音声ファイルを選択」をクリックしてファイルを選択します。対応形式は MP3、WAV、M4A、WebM です。

ライブ文字起こし

文字起こし中、AI-Corporate は OpenAI のリアルタイム API を使用します。これにより、ライブで読み進めたり、文字起こしが正しく表示されているかを確認できます。

注意: 文字起こしが話されたテキストと100%一致しない場合は、以下を確認してください。

  • 話し方を明瞭に、はっきりと発音する
  • 良いマイクを使用しているかを確認する
  • 話者の近くにマイクを適切に配置する
  • 設定の録音タイプを正しく選択する

会議メモ

録音と文字起こしの後、会議メモを自動で作成することができます。タブ「会議メモ」に切り替え、「会議メモを作成」ボタンをクリックします。

会議メモは文字起こしとアクティブなプロンプトに基づいて自動作成されます。

高度な設定

プロンプトの管理

会議メモ用のプロンプトを完全にカスタマイズして管理できます。ボタン「プロンプトを設定」をクリックしてプロンプトダイアログを開きます。

標準プロンプト

AI-Corporate には2つの標準プロンプトがあります。

  1. 標準会議: 一般的なセクションを含む構造化された会議メモを生成
  2. 話者認識付き: 話者認識付きの会議メモを生成し、各話者に一意の番号を付与

独自プロンプト

独自のカスタムプロンプトを作成することもできます。

  • **「独自プロンプトを追加」**をクリック
  • プロンプトに名前を付ける
  • 会議メモの作成方法に関する指示を記述
  • プロンプトを保存

すべてのカスタムプロンプトはあなたのアカウントに保存され、将来の文字起こしですぐに利用できます。

履歴の管理

過去の文字起こしの履歴を「履歴」ボタンで閲覧・管理できます。

履歴では以下を行えます。

  • タイトル、日付、内容で文字起こしを検索
  • 複製用の鉛筆アイコンをクリックしてタイトルを編集
  • 文字起こしをロードして再確認・編集
  • もう不要な文字起こしを削除
  • 文字起こしに音声が含まれている場合は「再生」できます

文字起こしの活用

文字起こしはさまざまな方法で活用できます。

  • コピー: コピー用ボタンで文字起こしをコピー
  • PDFへエクスポート: PDF ドキュメントとしてダウンロード
  • チャットで使用: チャットに貼り付けて質問や分析を依頼
  • 会議メモをエクスポート: 会議メモを PDF または Word にエクスポート

自動音声分割

ライブ文字起こし中、AI-Corporate は音声を部分的に保存します。これらのパーツはバックグラウンドでアップロード・処理され、長い録音でも接続・ブラウザ・デバイスの途切れ時にも保護されます。

インターバルアップロードはライブ録音を停止させません。各間隔は独立した WAV 音声ファイルとして保存され、処理サービスが完全で有効な音声ファイルを受け取れるようにします。最後の部分も録音を停止した際に保存されます。

音声分割の処理に失敗した場合でも、録音自体は継続できます。終了後にファイルのステータスを確認し、必要に応じてその部分を再アップロードまたは再処理してください。