لاعب SSBM يعتمد على التعلم المعزز العميق.
ملحوظة: هذا المشروع لم يعد نشطًا ويخضع لتعفن البتات. هناك مشروع لاحق يعتمد على التعلم التقليد من إعادات سليبي على https://github.com/vladfi1/slippi-ai.
تم الاختبار على: Ubuntu >=14.04، OSX، Windows 7/8/10.
pip install -e .
.agents
. المجموعة الكاملة من الوكلاء المدربين متاحة هنا. سوف تحتاج إلى معرفة مكان وجود الدلفين. على نظام Mac، سيكون مسار Dolphin هو /Applications/Dolphin.app/Contents/MacOS/Dolphin
. إذا كان dolphin-emu
موجودًا بالفعل على PATH
الخاص بك، فيمكنك حذفه.
python3 phillip/run.py --gui --human --start 0 --reload 0 --epsilon 0 --load agents/FalconFalconBF --iso /path/to/SSBM.iso --exe /path/to/dolphin [--windows]
يتم تخزين الوكلاء المدربين في دليل agents
. بصرف النظر عن FalconFalconBF
، فإن الوكلاء في agents/delay0/
أقوياء أيضًا إلى حد ما. قم بتشغيل --help
لرؤية جميع الخيارات. أفضل وكيل شبيه بالإنسان هو delay18/FalcoBF
، وهو متوفر في ملف Google Drive zip.
--exe
هو المسار إلى الملف Binaryx64Dolphin.exe
الذي قمت بفك ضغطه. بشكل عام، يجب أن يكون الأمام /
s
لجميع المسارات، إلا إذا كنت تستخدم MinGW، أو Cygwin، أو git bash، أو أي محاكي Shell Unix آخر.3
من أوامر مثل python3
و pip3
.--tcp 1
(المشار إليها الآن ضمنيًا بواسطة --windows
). قد تحتاج أيضًا إلى فتح المنفذ 5555 في جدار الحماية الخاص بك.--user tmp
(تبدأ الدلائل المؤقتة التي تنشئها python بـ /tmp/...
وهي غير صالحة لنظام التشغيل windows dolphin). يتم التحكم في التدريب بواسطة phillip/train.py
. راجع أيضًا runner.py
و launcher.py
للتدريب المكثف بالتوازي على مجموعات slurm. تم تدريب فيليب في MGHPCC. يوصى بالتدريب باستخدام دولفين مخصص يستخدم zmq للمزامنة مع الذكاء الاصطناعي - وإلا فمن المحتمل أن تفشل الأوامر أدناه.
التدريب المحلي ممكن أيضا. أولاً، قم بتحرير runner.py
باستخدام معلمات التدريب المطلوبة (المتقدمة). ثم افعل:
python3 runner.py # will output a path
python3 launcher.py saves/path/ --init --local [--agents number_of_agents] [--log_agents]
لعرض الإحصائيات أثناء التدريب:
tensorboard --logdir logs/
يقوم المدرب والوكلاء (اختياريًا) بإعادة توجيه stdout/err إلى slurm_logs/
. لإنهاء التدريب:
kill $(cat saves/path/pids)
لاستئناف التدريب، قم بتشغيل launcher.py
مرة أخرى، لكن احذف --init
(سيحل محل شبكتك القديمة).
التدريب على نظام التشغيل Windows غير مدعوم.
وبفضل microsoftv يوجد الآن فيديو تعليمي أيضًا!
تعال إلى الخلاف!
لقد قمت ببث التدريبات على http://twitch.tv/x_pilot. وهناك أيضًا بعض التسجيلات على قناتي على اليوتيوب.
شكرًا جزيلاً لـ altf4 لأنه ساعدني في البدء، ولـ spxtr لمراقب ذاكرة بايثون. تم استعارة بعض الأكواد الخاصة بتفاعل الدلفين من كلا المشروعين (في الغالب الأخير بعد أن تحولت إلى لغة بايثون النقية).