ConversAI هو إطار عمل مبتكر للذكاء الاصطناعي للمحادثة مصمم لتمكين المستخدمين من التفاعلات الذكية عبر تنسيقات المستندات المختلفة ومحتوى الويب. باستخدام تقنيات معالجة اللغة الطبيعية المتقدمة (NLP)، يتيح ConversAI إمكانية استخراج النص والاستعلام بسلاسة، مما يجعله أداة لا تقدر بثمن للباحثين والطلاب والمهنيين وأي شخص يتفاعل بانتظام مع المعلومات المستندة إلى النص.
في عصر يتسم بالحمل الزائد للمعلومات، تعد المعالجة الفعالة للبيانات أمرًا بالغ الأهمية. تعالج ConversAI هذا التحدي من خلال الاستفادة من أحدث التقنيات لتحويل البيانات غير المنظمة إلى رؤى قابلة للتنفيذ. سواء كنت تقوم باستخراج معلومات مفيدة من ملفات PDF، أو جلب النصوص من مقاطع فيديو YouTube، أو جمع البيانات من صفحات ويب متعددة، توفر ConversAI واجهة سهلة الاستخدام تعمل على تبسيط هذه المهام المعقدة.
بفضل تصميمها المعياري، لا تعد ConversAI مجرد أداة ولكنها منصة يمكن توسيعها وتخصيصها لتناسب متطلبات المستخدمين المتنوعة.
قبل تشغيل ConversAI، تأكد من تثبيت التبعيات التالية:
apt-get update && apt-get upgrade -y
apt-get install poppler-utils -y
بالإضافة إلى ذلك، تحتاج إلى إعداد متغيرات البيئة الخاصة بك لـ GROQ API:
GROQ_API_KEY
في متغيرات البيئة الخاصة بك.استنساخ المستودع:
git clone https://github.com/rauhanahmed/ConversAI.git
cd ConversAI
تثبيت الحزم المطلوبة:
pip install -r requirements.txt
لتشغيل التطبيق، قم بتشغيل الأمر التالي:
python app.py
سيتم فتح واجهة Gradio في متصفح الويب الافتراضي الخاص بك.
في حالة عدم توفر وحدة معالجة الرسومات، يرجى تعديل ملف config.ini
كما يلي:
ضمن القسم [EMBEDDINGS]
، قم بتغيير:
device = cuda
ل:
device = cpu
ضمن قسم [EASYOCR]
، قم بتغيير:
gpu = true
ل:
gpu = false
ستضمن هذه التعديلات تشغيل التطبيق بسلاسة على موارد وحدة المعالجة المركزية.
بعد استخدام الواجهة، تأكد من النقر فوق الزر "مسح" لإعادة ضبط الحقول. يعد هذا أمرًا بالغ الأهمية لأنه لم يتم تنفيذ إدارة الجلسة في هذا الإصدار، وقد يؤدي الفشل في مسح المدخلات إلى استمرار البيانات غير المقصودة أثناء التفاعلات اللاحقة.
فيما يلي عرض شامل لشجرة دليل المشروع:
ConversAI/
├── app.py # Main application file
├── config.ini # Configuration file
├── params.yaml # Prompts for the application
├── requirements.txt # Required Python packages
├── src/ # Source code directory
│ ├── components/ # Component modules
│ │ ├── loaders/ # Data loaders
│ │ │ ├── pdfLoader.py
│ │ │ ├── websiteCrawler.py
│ │ │ └── youtubeLoader.py
│ │ ├── rag/ # Retrieval-Augmented Generation components
│ │ │ └── RAG.py
│ │ └── vectors/ # Vector storage and processing
│ │ └── vectorstore.py
│ ├── utils/ # Utility functions and classes
│ │ ├── exceptions.py
│ │ ├── functions.py
│ │ ├── logging.py
│ ├── pipelines/ # Pipeline logic for data processing
│ │ └── completePipeline.py
└── README.md # Project documentation
ConversAI هي أكثر من مجرد أداة؛ إنه حل شامل لإدارة واستخراج الرؤى من العديد من تنسيقات المستندات ومصادر الويب. بفضل إمكاناتها القوية وواجهتها سهلة الاستخدام، تستعد ConversAI لجعل استرجاع المعلومات ومعالجتها أسهل وأكثر كفاءة من أي وقت مضى.
بالتأكيد! فيما يلي قسم محدث ليشمل مساهماتك وشكرًا لك:
تم تطوير هذا المشروع أثناء العمل كمهندس ذكاء اصطناعي في Tech Consulting Partners. لقد قمت ببناء ConversAI من الصفر، وقمت بتنفيذ أساليب متقدمة لاسترجاع المستندات، وتقنيات إعادة الترتيب، ومنهجيات البحث الهجين، وعمليات التكامل المتعددة مع نماذج اللغات الكبيرة (LLMs)، والكثير من الوظائف المعقدة الأخرى.
تشتمل الواجهة الخلفية على ميزات إدارة المستخدم وحلول تخزين البيانات المتطورة (بما في ذلك إدارة تخزين S3) وإدارة قواعد البيانات وقواعد بيانات المتجهات. تعمل استراتيجية النشر على تعزيز واجهات برمجة التطبيقات القوية وحاويات Docker وممارسات CI/CD ومراقبة النماذج ونشر النظام الأساسي السحابي.
يعد هذا النموذج الأولي مفتوح المصدر بمثابة نقطة انطلاق نحو مشروع أكثر شمولاً يهدف إلى تحقيق الصالح العام، ويعرض الإمكانات الهائلة لتقنيات الذكاء الاصطناعي المتقدمة في التطبيقات اليومية. وأود أن أعرب عن امتناني العميق لشركاء الاستشارات التقنية لثقتهم بي بهذه المبادرة ودعمهم الذي لا يقدر بثمن طوال عملية التطوير.
هذا المشروع مرخص بموجب ترخيص MIT - راجع ملف الترخيص للحصول على التفاصيل.
نأمل أن تستمتع باستخدام ConversAI! إذا كانت لديك أي أسئلة أو تعليقات، يرجى التواصل عبر مستودع المشروع أو البريد الإلكتروني.