انتقل إلى المحتوى الرئيسي

الدردشة مع المستندات

الخطوة التالية في معالجة المعلومات

بدلاً من الاعتماد على مجموعات البيانات العامة والمعرفة العامة، تولّد "الدردشة مع المستندات" إجابات وتحليلات سياقية خاصة بالسياق استناداً إلى مواردك الداخلية الموثوقة. قم بتحميل مستنداتك واستخدم هذه المستندات كقاعدة للإجابة على الأسئلة في الدردشة!

حل قيود البيانات

عند طرح أسئلة على نموذج لغوي، أنت تعتمد على مجموعة البيانات التي تدرب عليها النموذج. عادةً ما تكون هذه معلومات من الإنترنت. من المحتمل أن المصادر غير العامة لا تكون موجودة في هذه المجموعة. باستخدام مستنداتك كمصدر للدردشة، تتأكد من أن لدى النموذج المعلومات التي تحتاجها للإجابة على أسئلتك.

إمكانات مع مستنداتك

يمكنك طرح أسئلة حول مستنداتك مثل ذكر النقاط الرئيسية لمستند أو تلخيص المستند. كما يمكنك أيضاً أن تتيح للنموذج إجراء تحليلات محددة باستخدام مجموعة البيانات الخاصة بك.

عيوب المحادثة المستندة

رفع المستندات ومعالجتها هي خطوات إضافية لا تحتاجها إذا كان بإمكانك الحصول على إجابة مناسبة بدون سياق معلومات محددة. كما أن إنشاء الإجابة يستغرق وقتاً أطول لأن المعلومات اللازمة من المستند يجب استخراجها أولاً قبل إرسال الطلب إلى النموذج اللغوي.

وراء كواليس المحادثة مع المستندات

يتم استخراج النص من المستندات التي ترفعها وتقسيمه إلى مقاطع. لهذه المقاطع عدد محدد من الأحرف (1024 حرفاً) وهناك أيضًا تداخل محدد (128 حرفاً) بين المقاطع. يتم حفظ كل قطعة من النص كـ vector في قاعدة بيانات vectors. مع كل سؤال يتم اختيار بيانات من هذه المعلومات بناءً على التشابه مع السؤال المعروض.

عملية اختيار مقاطع المستند

تم تحويل قطع النص بالفعل إلى متجهات. للمتجهات أبعاد متعددة تشير إلى مدى "التشابه" بين هذا النص ونص آخر. فكر في نظام الألوان RGB. لون له قيمة RGB مشابهة هو لون مشابه أيضًا لكن مختلف. قاعدة البيانات الشعاعية تتيح لنا استرجاع مقاطع النص مرتبة ومفلترة بناءً على السؤال. نحدد أقصى 100 مقطع نصي من 1024 حرفاً لإرسالها مع السؤال.

النماذج المناسبة للدردشة المستندة

لقد اخترنا نماذج ذات نافذة سياق كبيرة لتمكين الدردشة مع المستندات. نود أن نتمكن من إرسال أقصى 100 مقطع نصي من 1024 حرفاً. هذا يزيد عن 100 ألف حرف. استخدم غالباً نموذج لغوي عالي الجودة من الكتالوج المركزي للنماذج.

نماذج مناسبة

النماذج المناسبة هي تلك التي لديها مساحة سياق كافية وتحليل مستند جيد، مثل النماذج عالية الجودة من OpenAI، Claude، Google أو EU AI.

اختر واحداً أو أكثر من المستندات

يمكنك تفعيل وضع الملفات بالنقر على مشبك الورق في يمين شريط السؤال. يمكنك اختيار حتى 10 ملفات للدردشة معها.

نماذج لغوية مناسبة

عند البدء بالدردشة مع المستندات، يتم التحقق مما إذا كان النموذج اللغوي مناسب للدردشة مع المستندات. إذا لم يكن كذلك، يتم اختيار نموذج مناسب تلقائياً من الكتالوج الفعلي.

تستطيع الدردشة مع هذه المستندات طالما وضع الملفات مُفعل.

المعالجة per ملف

بالإضافة إلى الدردشة مع المستندات، يتيح AI-Corporate أيضاً إمكانية تطبيق موجه خاص على كل مستند والحصول على إجابات فردية. هذه الميزة تُسمى المعالجة per ملف.

المعالجة per ملف

يمكن استخدام هذه الميزة بالتوازي مع "الدردشة مع الملفات".

سيناريو محتمل

مثال عملي لاستخدام "المعالجة per ملف":

  1. تقوم بتحميل مستند مرجعي (مثلاً نموذج عقد) وتفعيله مع الدردشة مع الملفات
  2. تقوم بتحميل مستندات متعددة يجب تحليلها وتفعيله مع المعالجة per ملف
  3. تصيغ موجه، تُطبق على جميع الملفات بشكل فردي

وبهذه الطريقة يمكن، على سبيل المثال، تحليل جميع العقود تلقائياً استناداً إلى نموذج المرجع.

الحد الأقصى لعدد الملفات

هناك حد أقصى 30 ملفاً لوظيفة "المعالجة per ملف".

أنواع الملفات المدعومة

يدعم AI-Corporate أنواع ملفات مختلفة للدردشة مع المستندات:

  • ملفات PDF تنتهي بـ .pdf
  • ملفات Word تنتهي بـ .docx
  • ملفات CSV تنتهي بـ .csv
  • ملفات JSON تنتهي بـ .json
  • ملفات نصية تنتهي بـ .txt
  • ملفات صوت وفيديو بامتدادات 'mp3', 'mp4', 'mpeg', 'mpga', 'm4a', 'wav' أو 'webm'

الدردشة مع ملفات صوتية أو فيديو

للدردشة مع ملفات صوتية أو فيديو، يستخدم AI-Corporate نموذج Whisper من OpenAI.

بعد استخراج النص يمكن استخدام نموذج نصي مناسب للتحقق من علامات الت찌endiz والتهجئة وتصحيحها.

ثم تتبع نفس إجراء الاستخراج من مستندات PDF أو Word.

لدى Whisper حد أقصى 25 MB لكل ملف صوتي أو فيديو. لذا نلتزم بنفس الحد عند رفع ملفات جديدة.

ملفات يمكنك تنزيلها كأمثلة

مثال تقرير شركة مثال خطة مشروع مستند تاريخ كبير

معالجة الملفات وإعادة استخدامها

سيتم معالجة الملفات التي ترفعها قبل أن يتمكن AI-Corporate من استخدام محتواها في المحادثات والمساعدين وتدفقات العمل. إذا فشل المعالجة، سيُعطى الملف حالة خطأ ويمكنك إعادة رفعه أو إعادة معالجته من خلال إدارة الملفات.

بالنسبة لملفات PDF يمكن لـ AI-Corporate استخدام طبقة النص العادية، وإذا لزم الأمر إجراء تحليل PDF أكثر تفصيلاً. هذا مفيد للمستندات الممسوحة ضوئياً، النماذج المملوءة، الملاحظات المكتوبة بخط اليد، الاختيارات المرسومة أو المسطرة، الجداول والمعلومات البصرية. يمكن تقسيم الملفات الكبيرة إلى أجزاء أصغر أثناء المعالجة.

عندما يطلب نموذج أو إجراء تدفق عمل ملفاً، يمكنك رفع ملف جديد أو اختيار ملف موجود من خلال مدير الوسائط. الملفات المضافة عبر مثل هذا النموذج تكون متاحة للمساعد في تلك الدردشة، لكنها لا تُستخدم تلقائياً للإجابات الشائعة.

دعم Markdown ملفات بامتداد .md.