Чат с документами
Следующий шаг в обработке информации
Вместо того чтобы полагаться на общедоступные наборы данных и общие знания, «Чат с документами» генерирует контекстно-специфические ответы и анализы на основе ваших доверенных внутренних источников. Загрузите ваши документы и используйте их в качестве основы для ответов на вопросы в чате!
Устранение ограничений данных
Если вы задаёте вопросы языковой модели, вы зависите от набора данных, на котором обуче на модель. Обычно это информация с интернета. Нейдоступные источники, вероятно, не входят в этот набор данных. Используя ваши документы в качестве источника для чата, вы точно знаете, что у модели есть та информация, которая вам нужна для ответа на ваши вопросы.
Возможности с вашими документами
Вы можете задавать вопросы по вашим документам, например перечислять главные пункты документа или суммировать документ. Также можно поручать языковой модели выполнить конкретные анализы с использованием вашего собственного набора данных.
Недостатки документно-ориентированного чата
Загрузка документов и их обработка — это дополнительные шаги, которые можно пропустить, если можно получить нормальный ответ без контекста специфической информации. Также ответ генерируется дольше, потому что сначала нужно извлечь необходимые данные из документа, прежде чем запрос отправится языковой модели.
За кулисами чата с документами
Текст из загруженных вами документов выделяется и делится на части. У этих частей заданное количество символов (1024 символа) и установлен перекрытие (128 символов) между частями. Каждую порцию текста сохраняют как вектор в векторной базе данных. При каждом запросе из этих данных выбирают, основываясь на схожести с заданным вопросом.