ACMEは、シンプルで効率的で読みやすいエージェントを暴露しようと努力する強化学習(RL)ビルディングブロックのライブラリです。これらのエージェントは、何よりもまず参照実装として機能し、アルゴリズムのパフォーマンスのための強力なベースラインを提供します。ただし、ACMEによって露出したベースラインエージェントは、新しい研究のスターティングブロックとして使用できる十分な柔軟性とシンプルさを提供する必要があります。最後に、ACMEのビルディングブロックは、エージェントを複数のスケール(シングルストリーム対分布エージェントなど)で実行できるように設計されています。
開始する最も簡単な方法は、例のサブディレクトリにある詳細な作業コードの例を見ることです。これらは、さまざまなエージェントをインスタンス化し、さまざまな環境内で実行する方法を示しています。 QuickStartノートブックを参照して、さらに迅速に飛び込み、単一のエージェントを使用してください。エージェントの内部構築に関するさらに詳細は、チュートリアルノートブック内にあります。最後に、完全な説明ACMEとその基礎となるコンポーネントは、ドキュメントを参照することで見つけることができます。設計上の決定の背後にあるより多くの背景情報と詳細については、テクニカルレポートに記載されています。
注:ACMEは、研究者向けの研究者が書いたRL研究のフレームワークです。私たちはそれを毎日自分の仕事に使用しています。そのため、それを念頭に置いて、私たちはすべてをうまく機能させようとするあらゆる試みをしますが、物事は時々壊れるかもしれません。しかし、もしそうなら、私たちはそれらをできるだけ早く修正するために最善を尽くします!
すぐに立ち上がって実行するには、以下の手順に従ってください。
標準のPython環境にACMEをインストールできますが、Python仮想環境を使用して依存関係を管理することを強くお勧めします。これは、バージョンの競合を回避し、一般的にインストールプロセスを簡単にするのに役立つはずです。
python3 -m venv acme
source acme/bin/activate
pip install --upgrade pip setuptools wheel
コアdm-acme
ライブラリを直接PIPインストールできますが、インストールに含まれる依存関係のセットは最小限です。特に、含まれているエージェントのいずれかを実行するには、エージェントに応じてJAXまたはTensorflowのいずれかも必要です。その結果、これらのコンポーネントもインストールすることをお勧めします。
pip install dm-acme[jax,tf]
最後に、いくつかの環境をインストールするには(ジム、DM_CONTROL、BSUITEを含む)。
pip install dm-acme[envs]
GitHubからのインストール:ACMEのブリードエッジバージョンの実行に興味がある場合は、ACME GitHubリポジトリをクローニングしてから、メインディレクトリ( setup.py
が配置されている場所)から次のコマンドを実行することでそうすることができます。
pip install .[jax,tf,testing,envs]
作業でACMEを使用する場合は、更新された付随する技術レポートを引用してください。
@article { hoffman2020acme ,
title = { Acme: A Research Framework for Distributed Reinforcement Learning } ,
author = {
Matthew W. Hoffman and Bobak Shahriari and John Aslanides and
Gabriel Barth-Maron and Nikola Momchev and Danila Sinopalnikov and
Piotr Sta'nczyk and Sabela Ramos and Anton Raichuk and
Damien Vincent and L'eonard Hussenot and Robert Dadashi and
Gabriel Dulac-Arnold and Manu Orsini and Alexis Jacq and
Johan Ferret and Nino Vieillard and Seyed Kamyar Seyed Ghasemipour and
Sertan Girgin and Olivier Pietquin and Feryal Behbahani and
Tamara Norman and Abbas Abdolmaleki and Albin Cassirer and
Fan Yang and Kate Baumli and Sarah Henderson and Abe Friesen and
Ruba Haroun and Alex Novikov and Sergio G'omez Colmenarejo and
Serkan Cabi and Caglar Gulcehre and Tom Le Paine and
Srivatsan Srinivasan and Andrew Cowie and Ziyu Wang and Bilal Piot and
Nando de Freitas
} ,
year = { 2020 } ,
journal = { arXiv preprint arXiv:2006.00979 } ,
url = { https://arxiv.org/abs/2006.00979 } ,
}