Chat con documenti
Il prossimo passo nell'elaborazione delle informazioni
Invece di fare affidamento su set di dati pubblici e conoscenze generali, "Chat con Documenti" genera risposte e analisi contestuali specifiche del contesto basate sulle tue fonti interne fidate. Carica i tuoi documenti e usa questi documenti come base per rispondere alle domande nella chat!
Risoluzione dei limiti dei dati
Se poni domande a un modello linguistico, dipendi dal dataset con cui il modello è stato addestrato. In generale, si tratta di informazioni tratte da Internet. Fonti non pubbliche probabilmente non sono presenti in questo dataset. Utilizzando i tuoi documenti come fonte per la chat, sai che il modello dispone delle informazioni necessarie per rispondere alle tue domande.
Possibilità con i tuoi documenti
Puoi porre domande sui tuoi documenti, ad esempio elencando i punti principali di un documento o riassumendolo. Puoi anche far eseguire analisi specifiche al modello linguistico utilizzando il tuo dataset.
Svantaggi della chat basata su documenti
Caricare documenti ed elaborarli comporta passaggi extra che non devi effettuare se puoi ottenere una risposta valida anche senza la contesto di informazioni specifiche. Inoltre, impiega più tempo per generare una risposta perché prima devono essere recuperate le informazioni necessarie dal documento prima che la richiesta possa essere inviata al modello linguistico.
Dietro le quinte della chat con documenti
Il testo dai documenti che carichi viene estratto dal documento e suddiviso in pezzi. Questi pezzi hanno un numero fisso di caratteri (1024 caratteri) e abbiamo anche impostato un overlap (128 caratteri) tra i pezzi. Ogni frammento di testo viene archiviato come vettore in un database di vettori. Per ogni domanda, questi dati vengono selezionati in base alla similitudine con la domanda posta.
Processo di selezione dei frammenti di documenti
I pezzi di testo sono già stati convertiti in vettori. I vettori hanno più dimensioni che indicano quanto è “uguale” questo testo ad altri testi. Pensa al sistema di colori RGB. Un colore con valore RGB simile è anche un colore simile ma leggermente diverso. Il database di vettori ci permette di recuperare i pezzi di testo ordinati e filtrati in base alla domanda posta. Selezioniamo al massimo 100 pezzi di testo da 1024 caratteri da inviare insieme alla domanda.
Modelli adatti per la chat basata su documenti
Abbiamo selezionato modelli con una grande finestra contestuale per rendere possibile chattare con documenti. Vogliamo poter inviare al massimo 100 pezzi di testo da 1024 caratteri. Sono più di 100.000 caratteri. Per questo uso preferito un modello linguistico di alta qualità dalla catalogo centrale dei modelli.
Modelli idonei sono modelli con sufficienti spazio di contesto e buona analisi dei documenti, come i modelli di alta qualità di OpenAI, Claude, Google o AI europee.
Seleziona uno o più documenti
Puoi attivare la modalità file cliccando sull'icona a graffetta sulla destra della barra delle domande. Puoi selezionare fino a 10 file per chattare.
Nel momento in cui inizi a chatare con documenti, viene controllato se il modello linguistico è adatto per la chat con documenti. In caso contrario, verrà automaticamente selezionato un modello idoneo dall'attuale catalogo.
Chatti con questi documenti finché la modalità file rimane attiva.
Elaborazione per file
Oltre alla chat con documenti, AI-Corporate offre anche la possibilità di applicare una prompt separatamente a ogni documento e ricevere risposte individuali. Questa funzione si chiama Elaborazione per file.

Questa funzione può essere usata in combinazione con "Chat con file".
###Scenario possibile
Un esempio pratico di utilizzo di "Elaborazione per file":
- Carichi un documento di riferimento (ad esempio un modello di contratto) e lo attivi in Chat con file
- Carichi più documenti da analizzare e li attivi in Elaborazione per file
- Formuli una prompt, che viene applicata a tutti i file individualmente
In questo modo puoi far analizzare automaticamente tutti i contratti in base al modello di riferimento.
È previsto un massimo di 30 file per la funzione "Elaborazione per file".
Tipi di file supportati
AI-Corporate supporta diversi tipi di file per la chat con documenti:
- File PDF con estensione .pdf
- File Word con estensione .docx
- File CSV con estensione .csv
- File JSON con estensione .json
- File di testo con estensione .txt
- File audio e video con le estensioni 'mp3', 'mp4', 'mpeg', 'mpga', 'm4a', 'wav' o 'webm'
Chat con file audio o video
Per chat con file audio o video, AI-Corporate utilizza il modello Whisper di OpenAI.
Dopo l’estrazione del testo, può essere utilizzato un modello di testo idoneo per controllare e correggere punteggiatura e ortografia.
Poi segue la stessa procedura di estrazione da documenti PDF o Word.
Whisper ha un limite di 25 MB per file audio o video. Pertanto applichiamo lo stesso limite anche quando carichi nuovi file.
File di esempio che puoi scaricare
Relazione aziendale di esempio Piano di progetto di esempio Documento storico grande
Elaborazione e riutilizzo dei file
I file che carichi vengono elaborati prima che AI-Corporate possa utilizzare il contenuto nelle chat, negli assistenti e nei workflow. Se l’elaborazione fallisce, il file assume uno stato di errore e puoi caricarlo di nuovo o farlo elaborare nuovamente dall’Archivio file.
Per i PDF, AI-Corporate può utilizzare lo strato di testo normale e, quando necessario, eseguire un'analisi PDF più elaborata. Questo è utile per documenti scansionati, modulo compilati, note scritte a mano, scelte cerchiate o sottolineate, tabelle e informazioni visive. Pdf grandi possono essere suddivisi durante l’elaborazione.
Quando un modulo o un flusso di lavoro richiede un file, puoi caricare un nuovo file o scegliere un file esistente tramite il gestore multimediale. I file aggiunti tramite un modulo non sono automaticamente selezionati per domande chat comuni, ma sono disponibili per l’assistente in quella chat.
I file Markdown con estensione .md sono supportati.