Gå til hovedindhold

Chat med dokumenter

Næste skridt i informationsbehandling

I stedet for at stole på offentlige datasæt og generel viden genererer "Chat med Dokumenter" kontekst-specifikke svar og analyser baseret på dine betroede interne kilder. Upload dine dokumenter og brug disse dokumenter som grundlag for at besvare spørgsmål i chatten!

Løsning af databegrænsninger

Hvis du stiller spørgsmål til en sprogmodel, er du afhængig af datasættet, som modellen er trænet på. Dette er typisk information hentet fra internettet. Ikke-offentlige kilder er sandsynligvis ikke i dette datasæt. Ved at bruge dine dokumenter som kilde for chatten, sikrer du, at modellen har den information, du har brug for til at besvare dine spørgsmål.

Muligheder med dine dokumenter

Du kan stille spørgsmål om dine dokumenter, såsom at nævne hovedpunkterne i et dokument eller at opsummere dokumentet. Du kan også få modellen udføre specifikke analyser ved hjælp af dit eget datasæt.

Ulemper ved dokumentbaseret chat

Upload af dokumenter og behandlingen heraf er ekstra Skridt, som du ikke behøver at foretage, hvis du kan få et godt svar uden kontekst af specifik information. Det tager også længere tid at generere et svar, fordi den nødvendige information skal hentes fra dokumentet, inden forespørgslen sendes til sprogmodellen.

Bag kulisserne ved chat med dokumenter

Teksten fra de dokumenter, du uploader, ekstraheres fra dokumentet og opdeles i stykker. Disse stykker har et fast antal tegn (1024 tegn), og vi har også indstillet en overlapning (128 tegn) mellem stykkerne. Hver tekstbit gemmes som en vektor i en vektor-database. For hver forespørgsel udvælger vi baseret på lighed mellem spørgsmålet og de givne data.

Udvælgelsesproces af dokumentfragmenter

Tekststykkerne er allerede omgjort til vektorer. Vektorer har flere dimensioner, der indikerer, hvor “ens” teksten er med andre tekster. Tænk på RGB-farvesystemet. En farve med tilsvarende RGB-værdi er også en tilsvarende farve, men lidt forskellig. Vektor-databasen gør det muligt at hente tekststykker rangeret og filtreret efter spørgsmålet.

Vi udvælger højst 100 tekststykker à 1024 tegn at sende med spørgsmålet.

Passende modeller til dokumentbaseret chat

Vi har udvalgt modeller med stort kontekstvindue for at mulighed for at chatte med dokumenter. Vi vil gerne kunne sende højst 100 stykker tekst à 1024 tegn. Dette er mere end 100.000 tegn. Brug derfor fortrinsvis en højtekts sprogmodel fra central modelkatalog.

Passende modeller

Passende modeller er modeller med tilstrækkelig kontekst og god dokumentanalyse, som f.eks. høj-kvalitetsmodeller fra OpenAI, Claude, Google eller European AI.

Vælg et eller flere dokumenter

Du kan aktivere filtilstand ved at klikke på clips-ikonet til højre for spørgsmålsfeltet. Du kan vælge op til 10 filer til chat.

Passende sprogmodeller

Når du begynder at chatte med dokumenter, bliver det kontrolleret, om sprogmodellen er egnet til chat med dokumenter. Hvis ikke, vælges automatisk et passende model fra den aktuelle katalog.

Du kan chatte med disse dokumenter, så længe filtilstanden er tilsluttet.

Behandling pr. fil

Udover chat med dokumenter giver AI-Corporate også mulighed for at anvende en prompt separat på hvert dokument og modtage individuelle svar. Denne funktion hedder Behandling pr. fil.

Behandling pr. fil

Denne funktion kan bruges i kombination med "Chat med filer".

Potentielt scenarie

Et praktisk eksempel på brug af "Behandling pr. fil":

  1. Du uploader et referencedokument (f.eks. en kontraktmal) og aktiverer det i Chat med filer
  2. Du uploader flere dokumenter, der skal analyseres, og aktiverer det i Behandling pr. fil
  3. Du formulerer en prompt, der anvendes på alle filer individuelt

På denne måde kan du f.eks. få alle kontrakter analyseret automatisk baseret på reference-skabelonen.

Maksimalt antal filer

Der gælder en maksimum på 30 filer for funktionen "Behandling pr. fil".

Understøttede filtyper

AI-Corporate understøtter forskellige filtyper til chat med dokumenter:

  • PDF-filer med slutningen .pdf
  • Word-filer med slutningen .docx
  • CSV-filer med slutningen .csv
  • JSON-filer med slutningen .json
  • Tekstfiler med slutningen .txt
  • Lyd- og videofiler med udvidelserne 'mp3', 'mp4', 'mpeg', 'mpga', 'm4a', 'wav' eller 'webm'

Chat med lyd eller videofiler

For chat med lyd- eller videofiler bruger AI-Corporate OpenAI Whisper-model.

Efter tekstudtræk kan et passende tekstmodel bruges til at kontrollere og rette tegnsætning og stavemåde.

Herefter følger den samme procedure som udtræk fra PDF- eller Word-dokumenter.

Whisper har en grænse på 25 MB per lyd- eller videofil. Vi håndhæver derfor den samme grænse ved upload af nye filer.

Filer du kan downloade som eksempel

Eksempel på virksomhedsrapport Eksempel på projektplan Stor historikdokument

Behandling og genanvendelse af filer

Filer, du uploader, bliver først behandlet, inden AI-Corporate kan bruge indholdet i chats, assistenter og arbejdsgange. Hvis behandlingen fejler, får filen en fejlstatus, og du kan uploade den igen eller lade den behandle igen fra Filbehandling.

For PDFs kan AI-Corporate bruge den sædvanlige tekstlag og, hvis nødvendigt, udføre en mere omfattende PDF-analyse. Dette er nyttigt ved scannede dokumenter, udfyldte formularer, håndskrevne noter, afkrydsede eller understregede valg, tabeller og visuel information. Større PDFs kan opdeles i mindre dele under behandlingen.

Når en formular eller workflow beder om en fil, kan du uploade en ny fil eller vælge en eksisterende via medieforvalteren. Filer, som tilføjes via en sådan formular, er tilgængelige for assistenten i den pågældende chat, men vælges ikke automatisk til almindelige chatspørgsmål.

Markdown-filer med filtypen .md understøttes også.