deep rts
1.0.0
DeepRTS は、強化学習研究用の高性能リアルタイム ストラテジー ゲームです。パフォーマンスを向上させるために C++ で書かれていますが、機械学習ツールキットとのインターフェイスを改善するための Python インターフェイスが提供されています。 Deep RTS は、1 秒あたり6,000,000ステップ以上、グラフィックスのレンダリング時に2,000,000ステップ以上でゲームを処理できます。 StarCraft などの他のソリューションと比較すると、Nvidia RTX 2080 TI を搭載した Intel i7-8700k で実行すると、シミュレーション時間が 15 000% 以上高速になります。
Deep RTS の目的は、計算時間を短縮することで、RTS AI 研究に、より手頃な価格で持続可能なソリューションをもたらすことです。
環境の最新 (通常は最適な) バージョンには、master ブランチを使用することをお勧めします。環境改善に向けたご意見をお待ちしております。
作品内で使用する場合は以下の引用をお願いします!
@INPROCEEDINGS{8490409,
author={P. {Andersen} and M. {Goodwin} and O. {Granmo}},
booktitle={2018 IEEE Conference on Computational Intelligence and Games (CIG)},
title={Deep RTS: A Game Environment for Deep Reinforcement Learning in Real-Time Strategy Games},
year={2018},
volume={},
number={},
pages={1-8},
keywords={computer games;convolution;feedforward neural nets;learning (artificial intelligence);multi-agent systems;high-performance RTS game;artificial intelligence research;deep reinforcement learning;real-time strategy games;computer games;RTS AIs;Deep RTS game environment;StarCraft II;Deep Q-Network agent;cutting-edge artificial intelligence algorithms;Games;Learning (artificial intelligence);Machine learning;Planning;Ground penetrating radar;Geophysical measurement techniques;real-time strategy game;deep reinforcement learning;deep q-learning},
doi={10.1109/CIG.2018.8490409},
ISSN={2325-4270},
month={Aug},}
sudo pip3 install git+https://github.com/cair/DeepRTS.git
git clone https://github.com/cair/deep-rts.git
cd deep-rts
git submodule sync
git submodule update --init
sudo pip3 install .
10x10-2-FFA
15x15-2-FFA
21x21-2-FFA
31x31-2-FFA
31x31-4-FFA
31x31-6-FFA
Deep RTS は、事前に構築されたミニゲームであるシナリオを特徴としています。これらのミニゲームは、特定のタスクについてエージェントをトレーニングしたり、さまざまな問題設定でアルゴリズムをテストしたりするのに適しています。シナリオを使用する利点は、タスクの完了に応じてそれぞれが報酬/罰信号を出力する基準を使用して報酬関数を簡単に設計できることです。タスクの例は次のとおりです。
Deep RTS は現在、次のシナリオを実装しています。
GoldCollectFifteen
GeneralAIOneVersusOne
import random
from DeepRTS . python import Config
from DeepRTS . python import scenario
if __name__ == "__main__" :
random_play = True
episodes = 100
for i in range ( episodes ):
env = scenario . GeneralAI_1v1 ( Config . Map . THIRTYONE )
state = env . reset ()
done = False
while not done :
env . game . set_player ( env . game . players [ 0 ])
action = random . randrange ( 15 )
next_state , reward , done , _ = env . step ( action )
state = next_state
if ( done ):
break
env . game . set_player ( env . game . players [ 1 ])
action = random . randrange ( 15 )
next_state , reward , done , _ = env . step ( action )
state = next_state