هذا نموذج أولي لروبوت الدردشة الذي يمكنه الإجابة على الأسئلة المتعلقة بملفات PDF. ويستخدم واجهة برمجة تطبيقات OpenAI لنمذجة اللغة، وLanceDB لتخزين واسترجاع المتجهات.
يستخدم هذا الشعر لإدارة التبعية. لتثبيت التبعيات:
$ poetry install
ستحتاج أيضًا إلى إنشاء ملف .env
وإضافة OPENAI_API_KEY
إليه (راجع .env.example
).
سيقوم الأمر أدناه بتشغيل المسار على دليل papers
، الذي يحتوي على عدد قليل من ملفات PDF. سيبدأ بعد ذلك REPL حيث يمكنك طرح أسئلة حول ملفات PDF. يمكنك الخروج من حلقة الأسئلة والأجوبة عن طريق كتابة "exit" أو cmd/ctrl + c.
$ poetry run python main.py --pdf_directory=papers
لاحظ أن قاعدة بيانات LanceDB مضمنة في هذا الريبو، لذلك سيتم تخطي إنشاء وتخزين التضمينات داخل رمز العرض ما لم تقم بحذف دليل .lancedb
. تم تضمين ذلك لتسهيل تشغيل التعليمات البرمجية دون الحاجة إلى انتظار إنشاء التضمينات.
لقد كتبت تدوينة مختصرة وسجلت مقطع فيديو تجريبيًا لهذا المشروع هنا.