Zum Hauptinhalt springen

Chat mit Dokumenten

Der nächste Schritt in der Informationsverarbeitung

Anstatt sich auf öffentliche Datensätze und allgemeines Wissen zu verlassen, generiert "Chat mit Dokumenten" kontextspezifische Antworten und Analysen basierend auf Ihren vertrauten internen Quellen. Laden Sie Ihre Dokumente hoch und verwenden Sie diese als Grundlage für Fragen im Chat!

Lösung von Dateneinschränkungen

Wenn Sie einem Sprachmodell Fragen stellen, sind Sie von dem Datensatz abhängig, mit dem das Modell trainiert wurde. Dies sind in der Regel Informationen, die aus dem Internet stammen. Nicht-öffentliche Quellen sind in diesem Datensatz wahrscheinlich nicht enthalten. Indem Sie Ihre Dokumente als Quelle für den Chat verwenden, stellen Sie sicher, dass das Modell über die Informationen verfügt, die Sie zum Beantworten Ihrer Fragen benötigen.

Möglichkeiten mit Ihren Dokumenten

Sie können Fragen zu Ihren Dokumenten stellen, wie das Auflisten der Hauptpunkte eines Dokuments oder das Zusammenfassen des Dokuments. Auch können Sie vom Sprachmodell spezifische Analysen mit Hilfe Ihres eigenen Datensatzes durchführen lassen.

Nachteile des dokumentbasierten Chats

Das Hochladen und Verarbeiten von Dokumenten sind zusätzliche Schritte, die Sie nicht unternehmen müssen, wenn Sie auch ohne den Kontext spezifischer Informationen gute Antworten erhalten können. Auch dauert es länger, eine Antwort zu generieren, da zunächst die erforderlichen Informationen aus dem Dokument abgerufen werden müssen, bevor die Anfrage an das Sprachmodell gesendet werden kann.

Hinter den Kulissen des Chats mit Dokumenten

Der Text aus den von Ihnen hochgeladenen Dokumenten wird extrahiert und in Stücke unterteilt. Diese Stücke haben eine feste Anzahl von Zeichen (1024 Zeichen), und wir haben auch eine Überlappung (128 Zeichen) zwischen den Stücken festgelegt. Jedes Textstück wird als Vektor in einer Vektordatenbank gespeichert. Bei jeder Frage wird aus diesen Daten eine Auswahl basierend auf der Ähnlichkeit mit der gestellten Frage getroffen.

Auswahlprozess von Dokumentfragmenten

Die Textstücke wurden bereits in Vektoren umgewandelt. Vektoren haben mehrere Dimensionen, die angeben, wie "gleich" dieser Text zu anderen Texten ist. Denken Sie an das RGB-Farbsystem. Eine Farbe mit einem ähnlichen RGB-Wert ist auch eine ähnliche Farbe, aber leicht anders. Die Vektordatenbank ermöglicht es uns, die Textstücke basierend auf der gestellten Frage geordnet und gefiltert abzurufen. Wir wählen maximal 100 Textstücke von 1024 Zeichen aus, um sie mit der Frage zu senden.

Geeignete Modelle für dokumentbasierten Chat

Wir haben Modelle mit einem großen Kontextfenster ausgewählt, um das Chatten mit Dokumenten zu ermöglichen. Wir möchten maximal 100 Textstücke von 1024 Zeichen senden können. Das sind mehr als 100.000 Zeichen. Modelle wie GPT 3.5 können so viel Text nicht verarbeiten. Deshalb empfehlen wir, diese Funktion nur in Kombination mit GPT-4.1, Gemini 2.5 Pro und Claude 4.0 zu verwenden.

Geeignete Modelle

Geeignete Modelle sind GPT-4.1, Gemini 2.5 Pro und Claude 4.0.

Wählen Sie ein oder mehrere Dokumente

Sie können den Dateimodus aktivieren, indem Sie auf die Büroklammer rechts neben der Fragezeile klicken. Sie können bis zu 10 Dateien zum Chatten auswählen.

Geeignete Sprachmodelle

Wenn Sie mit Dokumenten chatten, wird geprüft, ob das Sprachmodell für das Chatten mit Dokumenten geeignet ist. Falls dies nicht der Fall ist, wird automatisch GPT-4o ausgewählt.

Sie chatten mit diesen Dokumenten, solange der Dateimodus aktiviert ist.

Unterstützte Dateitypen

AI-Corporate unterstützt verschiedene Dateitypen für das Chatten mit Dokumenten:

  • PDF-Dateien mit der Endung .pdf
  • Word-Dateien mit der Endung .docx
  • CSV-Dateien mit der Endung .csv
  • JSON-Dateien mit der Endung .json
  • Textdateien mit der Endung .txt
  • Audio- und Videodateien mit den Erweiterungen 'mp3', 'mp4', 'mpeg', 'mpga', 'm4a', 'wav' oder 'webm'

Chat mit Audio- oder Videodateien

Für den Chat mit Audio- oder Videodateien verwendet AI-Corporate das Whisper-Modell von OpenAI.

Nach der Textextraktion leiten wir den Text noch durch GPT-4o, um Interpunktion und Rechtschreibung zu überprüfen und zu korrigieren.

Danach folgt dasselbe Verfahren wie bei der Extraktion aus PDF- oder Word-Dokumenten.

Whisper hat eine Grenze von 25 MB pro Audio- oder Videodatei. Wir wenden daher dieselbe Grenze beim Hochladen neuer Dateien an.

Dateien, die Sie als Beispiel herunterladen können

Beispiel Geschäftsbericht Beispiel Projektplan Umfangreiches Geschichtsdokument