Phi3 Vision huggingface
1.0.0
يحتوي هذا المستودع على تعليمات برمجية لتنفيذ مهام الرؤية باستخدام نموذج LLM Phi-3 Vision المحلي ومكتبة Hugging Face. يوضح الكود كيفية إنشاء استجابة بناءً على صورة إدخال ومطالبة محددة من قبل المستخدم.
transformers
Hugging Face لتشغيل هذا المشروع، ستحتاج إلى لغة Python والتبعيات الضرورية. اتبع الخطوات أدناه لإعداد بيئتك.
استنساخ البوابة https://github.com/manunair1990/Phi3-Vision-huggingface
قرص مضغوط Phi3-Vision-huggingface
قم بتثبيت حزم بايثون المطلوبة باستخدام النقطة.
تثبيت النقطة -r متطلبات.txt
بيثون phi3_vision_huggingface.py
ملاحظات لاستخدام عنوان URL بدلاً من ملف صورة محلي، قم بإلغاء تعليق الأسطر ذات الصلة واستبدل عنوان URL بعنوان URL للصورة المطلوبة.
Hugging Face لتوفير النموذج وواجهات برمجة التطبيقات للرمز المميز.
منشئو نموذج Phi-3 Vision.