グリッド ワールドを作成するための C++ と Lua で書かれた学習環境。
DeepMind Lab2Dは、機械学習用の 2D 環境を作成するためのシステムです。システムの主な目標は使いやすさとパフォーマンスです。環境は「グリッド ワールド」であり、世界のレイアウト用の単純なテキストベースのマップとその動作用の Lua コードの組み合わせで定義されます。機械学習エージェントは、Python dm_env
API またはカスタム C API (DeepMind Lab でも使用されます) の 2 つの API のいずれかを介してこれらの環境と対話します。複数のエージェントがサポートされています。
研究でDeepMind Lab2D を使用しており、それを引用したい場合は、付属のホワイトペーパーを引用することをお勧めします。
DeepMind Lab2dは PyPI で利用でき、以下を使用してインストールできます。
pip install dmlab2d
dmlab2d
、Linux および macOS 用のビルド済みホイールとして配布されます。プラットフォームに適切なホイールがない場合は、ソースからビルドする必要があります。セットアップに適応できるインストール スクリプトの例については、 install.sh
参照してください。
ランダムなアクションを実行する「ランダム」エージェントの例をpython/random_agent
で提供します。これは、独自のエージェントを作成するためのベースとして、また環境をプレビューするための簡単なツールとして使用できます。
bazel run -c opt dmlab2d/random_agent -- --level_name=clean_up
DeepMind Lab2D はいくつかの外部ソフトウェア ライブラリに依存しており、これらはいくつかの異なる方法で出荷されます。
dm_env
、 eigen
、 luajit
、 lua5.1
、 lua5.2
、 luajit
、 png
、およびzlib
ライブラリは外部 Bazel ソースとして参照され、Bazel BUILD ファイルが提供されます。依存コード自体はかなり移植可能である必要があり、出荷される BUILD ルールは Linux x86 および MacOS (x86 および arm64) に固有です。別のプラットフォームでビルドするには、ほとんどの場合、それらの BUILD ファイルを編集する必要があります。
「汎用強化学習 API」は//third_party/rl_api
に含まれています。
いくつかの追加ライブラリが必要ですが、いかなる形式でも出荷されません。これらはシステム上に存在する必要があります。
NumPy
、 PyGame
、およびpackaging
を備えたPython 3.8
以降。ビルド ルールでは、GCC/Clang に固有のいくつかのコンパイラ設定が使用されています。一部のフラグがコンパイラによって認識されない場合 (通常、これらは特定の警告抑制です)、それらのフラグを編集する必要がある場合があります。
これは Google の公式製品ではありません。