هل سبق لك أن أردت تشغيل أغنية لم تكن متوفرة في لعبة الإيقاع المفضلة لديك؟ هل سبق لك أن أردت تشغيل أشكال لا حصر لها من تلك الأغنية؟
يهدف هذا المشروع البحثي مفتوح المصدر إلى إضفاء الطابع الديمقراطي على عملية إنشاء خريطة الضرب تلقائيًا، وتقديم أدوات يمكن الوصول إليها ونماذج أساسية لمطوري الألعاب واللاعبين والمتحمسين على حدٍ سواء، مما يمهد الطريق لعصر جديد من الإبداع والابتكار في الألعاب الإيقاعية.
أمثلة (المزيد قريبًا):
ستحتاج أولاً إلى تثبيت Python 3.12، والانتقال إلى دليل المستودع وإنشاء بيئة افتراضية عبر:
python3 -m venv venv
ثم اتصل source venv/bin/activate
أو venvScriptsactivate
إذا كنت تستخدم جهاز يعمل بنظام Windows. بعد تفعيل البيئة الافتراضية يمكنك تثبيت المكتبات المطلوبة عبر:
pip3 install -r requirements.txt
يمكنك استخدام Jupyter للوصول إلى أمثلة notebooks/
:
jupyter notebook
يمكنك تجربة إصدار Google Collab أيضًا، طالما أن لديك مثيلات GPU متاحة (تستغرق مثيلات وحدة المعالجة المركزية الافتراضية وقتًا طويلاً لتحويل أغنية).
يدعم خط الأنابيب فقط خرائط OSU في الوقت الحالي.
لا يزال هذا المستودع قيد التنفيذ . الهدف هو تطوير نماذج توليدية قادرة على إنتاج خرائط إيقاعية تلقائيًا لمجموعة متنوعة من ألعاب الإيقاع، بغض النظر عن الأغنية. لا يزال هذا البحث مستمرًا، ولكن الهدف هو إخراج MVPs في أسرع وقت ممكن.
يتم تقدير جميع المساهمات، خاصة في شكل تبرعات حسابية لنماذج مؤسسة التدريب. لذا، إذا كنت مهتمًا، فلا تتردد في المشاركة!
انضم إلينا في استكشاف الإمكانيات التي لا نهاية لها لإنشاء خريطة ضربات تعتمد على الذكاء الاصطناعي وتشكيل مستقبل ألعاب الإيقاع!
الموديل (النماذج) متاحة على HuggingFace.
يتم في البداية تحويل خرائط ضربات لعبة الإيقاع إلى تنسيق ملف متوسط، والذي يتم بعد ذلك ترميزها إلى أجزاء بحجم 100 مللي ثانية. كل رمز قادر على تشفير ما يصل إلى حدثين مختلفين خلال هذه الفترة الزمنية (عمليات التعليق و/أو الزيارات) بدقة تصل إلى 10 مللي ثانية. يتم حساب مفردات أداة الرمز المميز مسبقًا بدلاً من تعلمها من البيانات للوفاء بهذا المعيار. يتم الاحتفاظ بطول السياق وحجم المفردات بشكل صغير عن عمد بسبب ندرة أمثلة التدريب عالية الجودة في هذا المجال.
تعمل هذه الرموز المميزة، جنبًا إلى جنب مع شرائح البيانات الصوتية (مخطط Mel Spectogram المتوقع المتوافق مع الرموز المميزة)، كمدخلات لنموذج التشفير المقنع. على غرار BeRT، فإن نموذج التشفير له هدفان أثناء التدريب: تقدير الإيقاع من خلال مهمة الانحدار والتنبؤ بالرمز (الرموز) المقنع (التالي) عبر وظيفة فقدان السمع . يتم دعم خرائط Beatmap ذات المسارات 1 و2 و4. يتم التنبؤ بكل رمز مميز من اليسار إلى اليمين، مما يعكس عملية إنشاء بنية وحدة فك التشفير. ومع ذلك، تتمتع الرموز المميزة المقنعة أيضًا بإمكانية الوصول إلى معلومات صوتية إضافية من المستقبل، يُشار إليها على أنها رموز استشرافية من اليمين.
الغرض من نموذج الذكاء الاصطناعي ليس التقليل من قيمة خرائط الضرب المصممة بشكل فردي، بل:
يجب أن يتوافق كل المحتوى الذي تم إنشاؤه مع لوائح الاتحاد الأوروبي وأن يتم تصنيفه بشكل مناسب، بما في ذلك البيانات الوصفية التي تشير إلى مشاركة نموذج الذكاء الاصطناعي.
يُمنع منعًا باتًا إنشاء خرائط إيقاعية للمواد المحمية بحقوق الطبع والنشر! استخدم فقط الأغاني التي تمتلك حقوقًا لها!
ينشأ الصوت الموجود في أمثلة ملفات OSU من فنانين مدرجين على موقع OSU ضمن قسم الفنانين المميزين وهو مرخص للاستخدام على وجه التحديد في المحتوى المرتبط بـ OSU.
لمنع استخدام خريطة الضرب الخاصة بك كبيانات تدريب في المستقبل، قم بتضمين البيانات الوصفية التالية في ملف خريطة الضرب الخاصة بك:
robots: disallow
يستمد المشروع الإلهام من محاولة سابقة تُعرف باسم AIOSU.
إلى جانب الاعتماد على ويكي جامعة ولاية أوهايو، كان محلل OSU فعالاً في توضيح إعلانات خريطة الضرب (خاصة أشرطة التمرير). تأثر نموذج المحول بـ NanoGPT ومن تنفيذ pytorch لـ BeRT.