Ir al contenido principal

Chat con documentos

El siguiente paso en el procesamiento de información

En lugar de depender de conjuntos de datos públicos y conocimiento general, "Chat con Documentos" genera respuestas y análisis contextualmente específicos basados en tus fuentes internas de confianza. ¡Carga tus documentos y utiliza estos documentos como base para responder preguntas en el chat!

Solución de limitaciones de datos

Si haces preguntas a un modelo de lenguaje, dependes del conjunto de datos con el que el modelo ha sido entrenado. Por lo general, es información obtenida de Internet. Es probable que fuentes no públicas no estén en ese conjunto de datos. Al usar tus documentos como fuente para el chat, te aseguras de que el modelo tenga la información que necesitas para responder tus preguntas.

Posibilidades con tus documentos

Puedes hacer preguntas sobre tus documentos, como enumerar los puntos principales de un documento o resumirlo. También puedes pedir al modelo de lenguaje que realice análisis específicos utilizando tu propio conjunto de datos.

Desventajas del chat basado en documentos

La carga de documentos y su procesamiento son pasos adicionales que no tendrías que realizar si puedes obtener respuestas adecuadas sin el contexto de información específica. Además, tarda más en generar una respuesta porque primero hay que extraer la información necesaria del documento antes de enviar la solicitud al modelo de lenguaje.

Detrás de escena del chat con documentos

El texto de los documentos que subes se extrae del documento y se divide en fragmentos. Estos fragmentos tienen un número fijo de caracteres (1024) y también hemos configurado una superposición (128 caracteres) entre fragmentos. Cada trozo de texto se almacena como un vector en una base de datos de vectores. Con cada pregunta, se realiza una selección de estos datos basada en la similitud con la pregunta planteada.

Proceso de selección de fragmentos de documentos

Los fragmentos de texto ya se han convertido en vectores. Los vectores tienen múltiples dimensiones que indican cuán “parecido” es este texto a otros textos. Piensa en el sistema de color RGB. Un color con un valor RGB similar también es un color similar, pero ligeramente diferente. La base de datos de vectores nos permite recuperar los fragmentos de texto de forma ordenada y filtrada según la pregunta. Seleccionamos hasta 100 fragmentos de 1024 caracteres para enviar junto con la pregunta.

Modelos adecuados para chat basado en documentos

Hemos seleccionado modelos con un gran margen de contexto para permitir chatear con documentos. Queremos poder enviar como máximo 100 fragmentos de 1024 caracteres. Esto equivale a más de 100.000 caracteres. Para esto, utiliza preferentemente un modelo de lenguaje de alta calidad desde el catálogo central de modelos.

Modelos adecuados

Los modelos adecuados son aquellos con suficiente espacio de contexto y buena capacidad de análisis de documentos, como los modelos de alta calidad de OpenAI, Claude, Google o AI europe.

Selecciona uno o varios documentos

Puedes activar el modo de archivos haciendo clic en el clip en la derecha de la barra de preguntas. Puedes seleccionar hasta 10 archivos para chatear.

Modelos de lenguaje adecuados

Cuando empiezas a chatear con documentos, se verifica si el modelo de lenguaje es adecuado para chat con documentos. Si no lo es, se selecciona automáticamente un modelo adecuado de la catalogación vigente.

Chateas con estos documentos mientras el modo de archivos esté activo.

Procesar por archivo

Además de chatear con documentos, AI-Corporate también ofrece la posibilidad de aplicar un prompt por separado a cada documento y recibir respuestas individuales. Esta función se llama Procesar por archivo.

Procesar por archivo

Esta función puede usarse junto con “Chat con archivos”.

Escenario posible

Un ejemplo práctico de uso de “Procesar por archivo”:

  1. Subes un documento de referencia (por ejemplo, una plantilla de contrato) y lo activas en Chat con archivos
  2. Subes varios documentos que deben ser analizados y los activas en Procesar por archivo
  3. Formulas un prompt que se aplica a todos los archivos individualmente

De esta manera, por ejemplo, puedes hacer que todos los contratos se analicen automáticamente basándose en la plantilla de referencia.

Número máximo de archivos

Existe un máximo de 30 archivos para la función “Procesar por archivo”.

Tipos de archivos compatibles

AI-Corporate admite varios tipos de archivos para chatear con documentos:

  • Archivos PDF que terminan en .pdf
  • Archivos Word que terminan en .docx
  • Archivos CSV que terminan en .csv
  • Archivos JSON que terminan en .json
  • Archivos de texto que terminan en .txt
  • Archivos de audio y vídeo con las extensiones 'mp3', 'mp4', 'mpeg', 'mpga', 'm4a', 'wav' o 'webm'

Chatear con audio o archivos de vídeo

Para chatear con archivos de audio o vídeo, AI-Corporate utiliza el modelo Whisper de OpenAI.

Tras la extracción de texto, se puede usar un modelo de texto adecuado para comprobar y corregir puntuación y ortografía.

A continuación sigue el mismo procedimiento que la extracción de PDFs o documentos Word.

Whisper tiene un límite de 25 MB por archivo de audio o vídeo. Por ello, aplicamos el mismo límite al subir nuevos archivos.

Archivos que puedes descargar como ejemplo

Informe comercial de ejemplo Ejemplo de plan de proyecto Documento de historial extenso

Procesar y reutilizar archivos

Los archivos que subes se procesan primero antes de que AI-Corporate pueda usar su contenido en chats, asistentes y flujos de trabajo. Si el procesamiento falla, el archivo obtiene un estado de error y puedes volver a subirlo o volver a procesarlo desde la Gestión de Archivos.

Para PDFs, AI-Corporate puede usar la capa de texto regular y, cuando sea necesario, realizar un análisis más profundo de PDFs. Esto es útil para documentos escaneados, formularios rellenados, notas manuscritas, opciones marcadas o subrayadas, tablas e información visual. Los PDFs grandes pueden dividirse en partes más pequeñas durante el procesamiento.

Cuando un formulario o flujo de trabajo solicita un archivo, puedes cargar uno nuevo o elegir uno existente desde el gestor de medios. Los archivos añadidos a través de dicho formulario están disponibles para la asistente en ese chat, pero no se seleccionan automáticamente para preguntas de chat normales.

Los archivos Markdown con extensión .md también son compatibles.