Zum Hauptinhalt springen

Verarbeitung

Sprachmodelle

Sprachmodelle sind fortschrittliche AI-Systeme, die menschliche Sprache verstehen, interpretieren und generieren können. Diese Modelle werden auf enormen Textdatensätzen trainiert und lernen Muster, Wortkombinationen, Satzstrukturen und sogar die Nuancen verschiedener Sprachen und Sprachgebräuche. Der Kern vieler moderner Sprachmodelle ist die Transformer-Architektur, die Selbstaufmerksamkeitsmechanismen nutzt, um zu bestimmen, welche Teile des Textes in einem gegebenen Kontext wichtig sind.

Bei der Sprachverarbeitung verwenden diese Modelle statistische Methoden, um vorherzusagen, was das wahrscheinlichste nächste Wort oder der wahrscheinlichste nächste Satz in einem Text sein könnte. Sie können Kontext über lange Textpassagen hinweg verstehen und dadurch nicht nur grammatikalisch korrekte, sondern auch inhaltlich zusammenhängende und relevante Texte generieren.

Bei der Verwendung eines Sprachmodells für beispielsweise einen Chatbot oder einen Textgenerator wird dem Modell bestimmte Prompts oder Ausgangsdaten gegeben. Basierend auf dieser Eingabe generiert das Modell Text, der logisch aus dem gegebenen Kontext folgt. Das Ziel dieser Modelle ist es, Text zu produzieren, der so menschlich wie möglich wirkt, sowohl in Bezug auf Inhalt als auch Stil.

Text-zu-Bild-Modelle

Text-zu-Bild-Modelle sind AI-Systeme, die in der Lage sind, aus geschriebenen Textbeschreibungen visuelle Repräsentationen zu generieren, wie Fotos, Illustrationen oder andere Arten von Bildmaterial. Diese Modelle nutzen fortschrittliche neuronale Netze, insbesondere generative adversariale Netze (GAN's) oder Variationen wie Diffusionsmodelle.

Der Prozess beginnt mit einer vom Benutzer eingegebenen Textbeschreibung. Das Modell bewertet diesen Text und versucht, dessen Bedeutung und Kontext zu verstehen. Anschließend generiert das Modell Bilder, die der Textbeschreibung entsprechen, und nutzt dabei das, was es während des Trainings gelernt hat, wobei es auf riesigen Datensätzen von Text-Bild-Paaren trainiert wird.

Während des Trainings lernt das Modell Assoziationen zwischen Textbeschreibungen und visuellen Merkmalen. Wenn das Modell beispielsweise wiederholt die Wortkombination "eine gelbe Sonne über einem blauen Meer" zusammen mit Bildern sieht, die dieses Szenario illustrieren, lernt es, diese Elemente zu erkennen und in zukünftigen Bildkreationen zu reproduzieren.

Das Ergebnis sind oft überraschend akkurate und detaillierte Bilder, die der eingegebenen Textbeschreibung entsprechen. Diese Modelle werden immer ausgefeilter und sind in der Lage, komplexe Szenarien mit mehreren Objekten und abstrakten Konzepten darzustellen. Sie werden in einem breiten Spektrum von Anwendungen eingesetzt, einschließlich künstlerischer Kreationen, Spieldesign, virtueller Realität und mehr.

AI-Corporate erschließt Modelle

Es ist wichtig zu verstehen, dass AI-Corporate verschiedene AI-Modelle erschließt, die von großen Technologieunternehmen über eine API angeboten werden. Eine API, oder Application Programming Interface, ist ein Satz von Regeln und Definitionen, mit denen Softwareprogramme miteinander kommunizieren können. Sie funktioniert wie eine Art "Sprache", die von Programmen verstanden wird, um Informationen auszutauschen und Funktionen voneinander aufzurufen. AI-Corporate selbst verfügt nicht über Sprachmodelle oder Text-zu-Bild-Modelle.

Wir sind nicht verantwortlich für die Ergebnisse der verschiedenen Modelle. Wir haben jedoch Wert auf die Auswahl der besten und interessantesten Modelle für Unternehmen gelegt.

Verarbeitungsprozedur

Die folgende Prozedur wird befolgt, um eine Antwort zu generieren:

  • Der Benutzer erstellt einen Prompt.
  • Die Frontend-Webanwendung verknüpft dies mit dem aktiven Chat und fügt eine Chatnachricht mit dem Status "Initialisieren" hinzu.
  • Auf den Servern von AI-Corporate wird eine Funktion ausgelöst durch das Hinzufügen einer Chatnachricht.
  • Der Status der Chatnachricht wird auf "Verarbeiten" gesetzt.
  • Bei Auswahl eines Chats mit Dokumenten sendet der Server zuerst eine Anfrage an die Firestore Vektor-Datenbank, um die Texte aus den Dokumenten auszuwählen.
  • Der Server sendet dann die Anfrage über eine API-Verbindung an das ausgewählte Sprachmodell.
  • Wenn die Einstellung Streamen aktiviert ist, speichern wir die Nachricht nach jeweils 10 empfangenen Chunks und nach jeweils 25 Chunks nach Erhalt von 100 Chunks.
  • Sobald die gesamte Antwort empfangen wurde, wird der Status auf "Abgeschlossen" gesetzt.
  • Die Frontend-Anwendung wird nach jeder Datenbankaktualisierung aktualisiert.
  • Bei festgestellten Fehlern wird der Status auf "Fehler" gesetzt und eine Fehlermeldung angezeigt.

Wir senden keine personenbezogenen Daten mit jeder API-Anfrage mit. Allerdings kann der Benutzer personenbezogene Daten im Prompt oder in den hochgeladenen Dokumenten enthalten haben.