Chat med dokumenter

Næste skridt i informationsbehandling

I stedet for at stole på offentlige datasæt og generel viden genererer "Chat med Dokumenter" kontekst-specifikke svar og analyser baseret på dine betroede interne kilder. Upload dine dokumenter og brug disse dokumenter som grundlag for at besvare spørgsmål i chatten!

Løsning af databegrænsninger

Hvis du stiller spørgsmål til en sprogmodel, er du afhængig af datasættet, som modellen er trænet på. Dette er typisk information hentet fra internettet. Ikke-offentlige kilder er sandsynligvis ikke i dette datasæt. Ved at bruge dine dokumenter som kilde for chatten, sikrer du, at modellen har den information, du har brug for til at besvare dine spørgsmål.

Muligheder med dine dokumenter

Du kan stille spørgsmål om dine dokumenter, såsom at nævne hovedpunkterne i et dokument eller at opsummere dokumentet. Du kan også få modellen udføre specifikke analyser ved hjælp af dit eget datasæt.

Ulemper ved dokumentbaseret chat

Upload af dokumenter og behandlingen heraf er ekstra Skridt, som du ikke behøver at foretage, hvis du kan få et godt svar uden kontekst af specifik information. Det tager også længere tid at generere et svar, fordi den nødvendige information skal hentes fra dokumentet, inden forespørgslen sendes til sprogmodellen.

Bag kulisserne ved chat med dokumenter

Teksten fra de dokumenter, du uploader, ekstraheres fra dokumentet og opdeles i stykker. Disse stykker har et fast antal tegn (1024 tegn), og vi har også indstillet en overlapning (128 tegn) mellem stykkerne. Hver tekstbit gemmes som en vektor i en vektor-database. For hver forespørgsel udvælger vi baseret på lighed mellem spørgsmålet og de givne data.

Udvælgelsesproces af dokumentfragmenter

Tekststykkerne er allerede omgjort til vektorer. Vektorer har flere dimensioner, der indikerer, hvor “ens” teksten er med andre tekster. Tænk på RGB-farvesystemet. En farve med tilsvarende RGB-værdi er også en tilsvarende farve, men lidt forskellig. Vektor-databasen gør det muligt at hente tekststykker rangeret og filtreret efter spørgsmålet.

Vi udvælger højst 100 tekststykker à 1024 tegn at sende med spørgsmålet.

Passende modeller til dokumentbaseret chat

Vi har udvalgt modeller med stort kontekstvindue for at mulighed for at chatte med dokumenter. Vi vil gerne kunne sende højst 100 stykker tekst à 1024 tegn. Dette er mere end 100.000 tegn. Brug derfor fortrinsvis en højtekts sprogmodel fra central modelkatalog.

Passende modeller

Passende modeller er modeller med tilstrækkelig kontekst og god dokumentanalyse, som f.eks. høj-kvalitetsmodeller fra OpenAI, Claude, Google eller European AI.

Vælg et eller flere dokumenter

Du kan aktivere filtilstand ved at klikke på clips-ikonet til højre for spørgsmålsfeltet. Du kan vælge op til 10 filer til chat.

Passende sprogmodeller

Når du begynder at chatte med dokumenter, bliver det kontrolleret, om sprogmodellen er egnet til chat med dokumenter. Hvis ikke, vælges automatisk et passende model fra den aktuelle katalog.

Du kan chatte med disse dokumenter, så længe filtilstanden er tilsluttet.

Behandling pr. fil

Udover chat med dokumenter giver AI-Corporate også mulighed for at anvende en prompt separat på hvert dokument og modtage individuelle svar. Denne funktion hedder Behandling pr. fil.

Behandling pr. fil

Denne funktion kan bruges i kombination med "Chat med filer".

Potentielt scenarie

Et praktisk eksempel på brug af "Behandling pr. fil":

Du uploader et referencedokument (f.eks. en kontraktmal) og aktiverer det i Chat med filer
Du uploader flere dokumenter, der skal analyseres, og aktiverer det i Behandling pr. fil
Du formulerer en prompt, der anvendes på alle filer individuelt

På denne måde kan du f.eks. få alle kontrakter analyseret automatisk baseret på reference-skabelonen.

Maksimalt antal filer

Der gælder en maksimum på 30 filer for funktionen "Behandling pr. fil".

Understøttede filtyper

AI-Corporate understøtter forskellige filtyper til chat med dokumenter:

PDF-filer med slutningen .pdf
Word-filer med slutningen .docx
CSV-filer med slutningen .csv
JSON-filer med slutningen .json
Tekstfiler med slutningen .txt
Lyd- og videofiler med udvidelserne 'mp3', 'mp4', 'mpeg', 'mpga', 'm4a', 'wav' eller 'webm'

Chat med lyd- eller videofiler

For lyd- eller videofiler transskriberer AI-Corporate først filen via den konfigurerede transskriptionsudbyder, f.eks. OpenAI eller Europæisk AI. De konkrete modeller kommer fra det centrale modelkatalog.

Ved samtaler kan transskriptionen indeholde tidsblokke og talerlabels, når den valgte model understøtter det. Derefter kan en egnet tekstmodel rette tegnsætning, stavning, talerlabels og fagudtryk.

Efter transskription bruges samme proces som for PDF- eller Word-dokumenter.

Lyd- og videomodeller har udbyder- og modelafhængige grænser for filstørrelse og varighed. Lange filer kan derfor behandles anderledes end korte. Hvis behandlingen fejler, så kontrollér filstatus og prøv igen eller lever filen i mindre dele.

Filer du kan downloade som eksempel

Eksempel på virksomhedsrapport Eksempel på projektplan Stor historikdokument

Behandling og genanvendelse af filer

Filer, du uploader, bliver først behandlet, inden AI-Corporate kan bruge indholdet i chats, assistenter og arbejdsgange. Hvis behandlingen fejler, får filen en fejlstatus, og du kan uploade den igen eller lade den behandle igen fra Filbehandling.

For PDFs kan AI-Corporate bruge den sædvanlige tekstlag og, hvis nødvendigt, udføre en mere omfattende PDF-analyse. Dette er nyttigt ved scannede dokumenter, udfyldte formularer, håndskrevne noter, afkrydsede eller understregede valg, tabeller og visuel information. Større PDFs kan opdeles i mindre dele under behandlingen.

Når en formular eller workflow beder om en fil, kan du uploade en ny fil eller vælge en eksisterende via medieforvalteren. Filer, som tilføjes via en sådan formular, er tilgængelige for assistenten i den pågældende chat, men vælges ikke automatisk til almindelige chatspørgsmål.

Markdown-filer med filtypen .md understøttes også.

Løsning af databegrænsninger​

Muligheder med dine dokumenter​

Ulemper ved dokumentbaseret chat​

Bag kulisserne ved chat med dokumenter​

Udvælgelsesproces af dokumentfragmenter​

Passende modeller til dokumentbaseret chat​

Vælg et eller flere dokumenter​

Behandling pr. fil​

Potentielt scenarie​

Understøttede filtyper​

Chat med lyd- eller videofiler​

Filer du kan downloade som eksempel​

Behandling og genanvendelse af filer​

Løsning af databegrænsninger

Muligheder med dine dokumenter

Ulemper ved dokumentbaseret chat

Bag kulisserne ved chat med dokumenter

Udvælgelsesproces af dokumentfragmenter

Passende modeller til dokumentbaseret chat

Vælg et eller flere dokumenter

Behandling pr. fil

Potentielt scenarie

Understøttede filtyper

Chat med lyd- eller videofiler

Filer du kan downloade som eksempel

Behandling og genanvendelse af filer