GenAI GeoGuesser
تخمين اسم البلد من الزيارات الناتجة عن الذكاء الاصطناعي
يعد هذا المشروع بمثابة نسخة مختلفة من لعبة GeoGuessr الشهيرة حيث يتم وضعك في موقع عالمي عشوائي على خرائط Google وعليك تخمين الموقع أثناء العد التنازلي للوقت. هنا سيتعين عليك تخمين اسم البلد بناءً على تلميحات متعددة الوسائط تم إنشاؤها بواسطة نماذج الذكاء الاصطناعي، ويمكنك الاختيار من بين 3 طرق، نص يمنحك وصفًا نصيًا للبلد، وصورة تمنحك صورة تشبه البلد، وصوتًا يعطيك لك عينة صوتية تتعلق بالبلد.
يمكنك التحقق من العرض التوضيحي عبر الإنترنت لهذا التطبيق في مساحات HuggingFace، وكان هذا العرض التوضيحي مقتصرًا على إنشاء تلميحات للصور فقط لأسباب تتعلق بالأداء.
إذا كنت تريد معرفة المزيد حول كيفية عمل هذا المشروع وكيفية إنشائه، فاطلع على المقالة "إنشاء GeoGuesser منتج يعتمد على الذكاء الاصطناعي".
سير العمل
- اختر طرائق التلميح المطلوبة.
- اختر عدد التلميحات لكل طريقة.
- انقر على زر "ابدأ اللعبة".
- انظر إلى كل التلميحات واكتب تخمينك في حقل "تخمين الدولة".
- انقر على زر "قم بالتخمين".
تجريبي
بالنسبة للأمثلة أدناه، الدولة المختارة هي روسيا .
تلميح النص
تلميح الصورة
تلميح صوتي
الاستخدام
الطريقة الموصى بها لاستخدام هذا المستودع هي باستخدام Docker، ولكن يمكنك أيضًا استخدام venv مخصص، فقط تأكد من تثبيت جميع التبعيات.
التكوينات
local:
to_use: true
text:
model_id: google/gemma-1.1-2b-it
device: cpu
max_output_tokens: 50
temperature: 1
top_p: 0.95
top_k: 32
image:
model_id: stabilityai/sdxl-turbo
device: mps
num_inference_steps: 1
guidance_scale: 0.0
audio:
model_id: cvssp/audioldm2-music
device: cpu
num_inference_steps: 200
audio_length_in_s: 10
vertex:
to_use: false
project: {VERTEX_AI_PROJECT}
location: {VERTEX_AI_LOCALTION}
text:
model_id: gemini-1.5-pro-preview-0409
max_output_tokens: 50
temperature: 1
top_p: 0.95
top_k: 32
- محلي
- to_use: إذا كان يجب على المشروع استخدام تكوين الإعداد هذا
- نص
- model_id: النموذج المستخدم لإنشاء تلميحات النص
- الجهاز: الجهاز الذي يستخدمه الطراز، عادةً ما يكون واحدًا من (cpu، cuda، mps)
- max_output_tokens: الحد الأقصى لعدد الرموز المميزة التي تم إنشاؤها بواسطة النموذج
- درجة الحرارة: تتحكم درجة الحرارة في درجة العشوائية في اختيار الرمز المميز. تعتبر درجات الحرارة المنخفضة مفيدة للمطالبات التي تتوقع استجابة حقيقية أو صحيحة، في حين أن درجات الحرارة المرتفعة يمكن أن تؤدي إلى نتائج أكثر تنوعًا أو غير متوقعة. مع درجة حرارة 0 يتم دائمًا تحديد أعلى رمز احتمالي
- top_p: يغير Top-p كيفية اختيار النموذج للرموز المميزة للإخراج. يتم اختيار الرموز من الأكثر احتمالاً إلى الأقل حتى يساوي مجموع احتمالاتها قيمة p الأعلى. على سبيل المثال، إذا كانت الرموز المميزة A وB وC لها احتمال 0.3 و0.2 و0.1 وكانت قيمة أعلى p هي 0.5، فسيقوم النموذج بتحديد إما A أو B كالرمز المميز التالي (باستخدام درجة الحرارة )
- top_k: يغير Top-k كيفية اختيار النموذج للرموز المميزة للإخراج. تعني أعلى k من 1 أن الرمز المميز المحدد هو الأكثر احتمالاً بين جميع الرموز المميزة في مفردات النموذج (وتسمى أيضًا فك التشفير الجشع)، بينما تعني أعلى k من 3 أن الرمز المميز التالي تم تحديده من بين الرموز الثلاثة الأكثر احتمالية ( باستخدام درجة الحرارة)
- صورة
- model_id: النموذج المستخدم لإنشاء تلميحات الصورة
- الجهاز: الجهاز الذي يستخدمه الطراز، عادةً ما يكون واحدًا من (cpu، cuda، mps)
- num_inference_steps: عدد خطوات الاستدلال للنموذج
- Guidance_scale: يجبر الجيل على مطابقة الموجه بشكل أفضل على حساب جودة الصورة أو التنوع
- صوتي
- model_id: النموذج المستخدم لإنشاء التلميحات الصوتية
- الجهاز: الجهاز الذي يستخدمه الطراز، عادةً ما يكون واحدًا من (cpu، cuda، mps)
- num_inference_steps: عدد خطوات الاستدلال للنموذج
- audio_length_in_s: طول مدة التلميح الصوتي
- قمة الرأس
- to_use: إذا كان يجب على المشروع استخدام تكوين الإعداد هذا
- المشروع: اسم المشروع الذي تستخدمه Vertex AI
- الموقع: موقع المشروع الذي تستخدمه Vertex AI
- نص
- model_id: النموذج المستخدم لإنشاء تلميحات النص
- max_output_tokens: الحد الأقصى لعدد الرموز المميزة التي تم إنشاؤها بواسطة النموذج
- درجة الحرارة: تتحكم درجة الحرارة في درجة العشوائية في اختيار الرمز المميز. تعتبر درجات الحرارة المنخفضة مفيدة للمطالبات التي تتوقع استجابة حقيقية أو صحيحة، في حين أن درجات الحرارة المرتفعة يمكن أن تؤدي إلى نتائج أكثر تنوعًا أو غير متوقعة. مع درجة حرارة 0 يتم دائمًا تحديد أعلى رمز احتمالي
- top_p: يغير Top-p كيفية اختيار النموذج للرموز المميزة للإخراج. يتم اختيار الرموز من الأكثر احتمالاً إلى الأقل حتى يساوي مجموع احتمالاتها قيمة p الأعلى. على سبيل المثال، إذا كانت الرموز المميزة A وB وC لها احتمال 0.3 و0.2 و0.1 وكانت قيمة أعلى p هي 0.5، فسيقوم النموذج بتحديد إما A أو B كالرمز المميز التالي (باستخدام درجة الحرارة )
- top_k: يغير Top-k كيفية اختيار النموذج للرموز المميزة للإخراج. تعني أعلى k من 1 أن الرمز المميز المحدد هو الأكثر احتمالاً بين جميع الرموز المميزة في مفردات النموذج (وتسمى أيضًا فك التشفير الجشع)، بينما تعني أعلى k من 3 أن الرمز المميز التالي تم تحديده من بين الرموز الثلاثة الأكثر احتمالية ( باستخدام درجة الحرارة)
الأوامر
ابدأ تطبيق اللعبة.
بناء صورة عامل الميناء.
قم بتطبيق الوبر والتنسيق على الكود (مطلوب للتطوير فقط).