تنزيل ai vinyl specialist - تنزيل كود مصدر ai vinyl specialist

ai vinyl specialist

كود الذكاء الاصطناعي

1.0.0

تنزيل

ديفيد متخصص في الفينيل

ديفيد متخصص في تسجيلات الفينيل. يمكنك أن تطلب منه توصية أو معلومات إضافية حول أي من السجلات الموجودة في مجموعة Discogs الخاصة بك. سيكون ديفيد سعيدًا بمساعدتك.

التفاصيل الفنية

يعد تطبيق LLM هذا مثالًا بسيطًا لوكيل المحادثة الذي يستخدم Discogs API لتوفير معلومات حول سجلات الفينيل. ويتكون من 4 وحدات بناء رئيسية:

عميل Discogs API : نظرًا لاسم مستخدم، فإنه يسترد مجموعة سجلات الفينيل من Discogs API.
محرك مساعد الذكاء الاصطناعي (ديفيد) : نظرًا لمجموعة السجلات، فإنه يوفر واجهة محادثة حول السجلات.
خادم Websockets : يوفر خادم websockets للتفاعل مع مساعد الذكاء الاصطناعي.
واجهة المستخدم : توفر واجهة مستخدم بسيطة للتفاعل مع مساعد الذكاء الاصطناعي من خلال مقابس الويب.

وهو يستخدم حاليًا LangChain4j كإطار عمل مع GPT-4o كمحرك مساعد للذكاء الاصطناعي، ولكن يمكن تكييفه بسهولة لاستخدام محركات أخرى.

يتم فرض بنية التطبيق من الرسم البياني أدناه بواسطة إطار عمل ArchUnit من خلال الاختبارات في فئة ArchitectureTest.

مخطط الهندسة المعمارية

الدروس المستفادة

تم تطوير واجهة المستخدم لهذا المشروع باستخدام الموجه التالي:

 I need the code for an HTML 5 page that contains an input field for a Discogs username 
and a text area for inserting prompts for the application to send to AI agents. 
Above the text area there should be the space in which the AI responses are displayed, in the ChatGPT style

أعطى كود HTML5 الذي تم إنشاؤه من GitHub Copilot العناصر المرئية الأولية لواجهة المستخدم والتي قمت بتعديلها بعد ذلك لإضافة اتصال websocket والمنطق لإرسال واستقبال الرسائل من مساعد الذكاء الاصطناعي. لقد وجدت أن هذا هو النهج السريع جدًا للنماذج الأولية. بعد ذلك، انتقلت إلى مكونات أكثر قوة من تصميم النمل، بما في ذلك الدردشة الاحترافية.

كنت أرغب في البداية في استخدام اللاما3. لا يدعم نموذج llama3 حاليًا الأدوات (يونيو 2024). وهذا يعني أن مساعد الذكاء الاصطناعي لا يمكنه جمع اسم مستخدم Discogs واسترداد مجموعة السجلات بمفرده. انتقلنا إلى GPT-4o حتى يتمكن David من طلب معلومات Discogs وإلغاء الحاجة إلى أي نماذج.

بعض LLMs ليست ذكية مثل غيرها. على الرغم من أن نموذج Mistral 7b يدعم الأدوات، إلا أنني لم أتمكن من الحصول على إجابات جيدة منه. ولن ينجح حتى في اختبارات التكامل الخاصة بي. ومع ذلك، لم أتمكن من تشغيل ماجستير في القانون باستخدام الأدوات مجانًا.

الهلوسة هي الألم. لقد بدأت رحلتي إلى RAG كوسيلة لتقليلها. وبما أن ديفيد يعمل في مجال الموسيقى، فإن ويكيبيديا هي أول قاعدة معرفية تتبادر إلى ذهن RAG. ربما يمكنني الاستفادة من واجهة برمجة تطبيقات MediaWiki للبحث في صفحات الموسيقى ذات الصلة بالمحادثة. في الوقت الحالي، أستخدم بحث Google فقط وهو يساعد في بعض الأحيان ولكنه بالتأكيد لا يكفي لتغطية التكلفة التي يضيفها باستخدام الرموز المميزة.

كان اختبار تطبيق LLM تحديًا. لقد أجريت اختبارات التكامل أكثر من المعتاد. أدى هذا إلى دورة تطوير أبطأ. كما أن الطبيعة الاحتمالية لمساعد الذكاء الاصطناعي تجعل من الصعب اختبار التطبيق بطريقة حتمية.

تتضمن اختبارات الوحدة العالمية في LLM المطالبة بنموذج الذكاء الاصطناعي بدلاً من مجرد استدعاء وحدة من التعليمات البرمجية. عند استخدام نموذج قائم على السحابة، يكون لإجراء اختبارات الوحدة تكلفة. لقد جربت أيضًا استخدام وكيل ذكاء اصطناعي ثانٍ لمساعدتي في تأكيد النتائج من الذكاء الاصطناعي الرئيسي. إنه نهج واعد لأننا نستطيع القيام بالتأكيدات الدلالية، وليس فقط معالجة السلسلة. والمقايضة هنا هي أنها تولد أيضًا تكلفة، وتزيد من مخاطر الأخطاء الاحتمالية التي تقدمها LLMs.

الذهاب إلى اليمين / الخطأ

اذهب إلى اليمين: مطالبة قليلة بالرصاص. تحسنت النتائج من الموصي بشكل ملحوظ عندما قمت بتطبيق هذه التقنية على موجه النظام الخاص بي. أضفت الشخصية والنبرة وبعض السياق وراء المحادثة وبعض الأمثلة حول ما يمكن توقعه من الذكاء الاصطناعي.
اذهب إلى اليمين: مراجع اختبار الذكاء الاصطناعي. غالبًا ما تتضمن التأكيدات الصادرة عن اختبارات تكامل الذكاء الاصطناعي معالجة السلسلة. اعتقدت أن استخدام ذكاء اصطناعي آخر متخصص في مراجعة نتائج الاختبار من شأنه أن يسهل العملية. سأعطيه بيانًا والرد من الذكاء الاصطناعي الرئيسي، وسيعود مراجع الاختبار في حالة النجاح أو الفشل. وقد أدى ذلك إلى اختبارات غير مستقرة عند استخدام اللاما 3 بسبب تراكم الأخطاء الاحتمالية لكلا الذكاءين الاصطناعيين اللذين يعملان معًا. عند الانتقال إلى GPT-4o، ثبت أنها أداة رائعة جدًا. مكنت التأكيدات الدلالية. استخدم أقوى LLM لديك لتأكيدات الاختبار.
اذهب إلى اليمين: الأدوات. لقد قمت في البداية بجلب مجموعة سجلات الفينيل من Discogs باستخدام رمز التطبيق وأضفتها إلى موجه النظام الخاص بـ LLM. يتطلب هذا الأسلوب حقل إدخال في واجهة المستخدم لجمع هذه البيانات. عند التغيير إلى الأدوات، سيكون الذكاء الاصطناعي قادرًا على جمع اسم مستخدم Discogs من المستخدم بمفرده، وجعله أكثر تحادثيًا. إنه يلغي الحاجة إلى نماذج واجهة المستخدم.
أخطأ: التكلفة. تتضمن إضافة ميزات إلى وكيل الذكاء الاصطناعي زيادة عدد الرموز المميزة التي تدخل في كل دردشة. ويزداد أكثر عند استخدام نموذج مضبوط. كلما قمنا بزيادة عدد الأمثلة في المطالبة ذات اللقطات القليلة، كلما زاد دفعنا مقابل رسائل مطالبة النظام. إن استخدام GPT-4o له تكلفة عالية في هذه اللحظة، وينبغي النظر بعناية في اختيار LLM لاستخدامه. يساعد LangChain في طبقة التجريد التي تجعل من السهل تغيير LLM الأساسي.
أخطأ: استخدام Ollama وllama3. لقد استخدمت في البداية llama3 الذي يعمل داخل Ollama كوسيلة لتصميم نموذج أولي لتطبيق ذكاء اصطناعي عام مجانًا. لقد نجح الأمر في البداية، لكنه سرعان ما أدى إلى دورات تطوير بطيئة للغاية. ستستغرق مجموعة الاختبار الخاصة بي 5 دقائق للتشغيل مع 20 اختبارًا أثناء تشغيل حاوية اختبار قابلة لإعادة الاستخدام. أدى تشغيل التطبيق إلى تأخير البدء البارد لمدة دقيقة تقريبًا لبدء المحادثة. اضطررت إلى استبداله ببرنامج LLM قائم على السحابة مثل ChatGPT 3.5.