recsim
1.0.0
RecSim 是一個可設定平台,用於為推薦系統 (RS) 創建模擬環境,自然支援與使用者的順序互動。 RecSim 允許創建新環境,在抽象層級上反映使用者行為和專案結構的特定方面,非常適合在順序互動推薦問題中突破當前強化學習 (RL) 和 RS 技術的限制。可以輕鬆配置環境來改變以下方面的假設:使用者偏好和項目熟悉度;使用者潛在狀態及其動態;以及選擇模型和其他使用者回應行為。我們概述了 RecSim 如何為 RL 和 RS 研究人員和從業者提供價值,以及它如何作為學術-工業合作的工具。有關 RecSim 架構的詳細說明,請閱讀 Ie 等人。如果您在工作中使用此儲存庫中的程式碼,請引用該論文。
@article{ie2019recsim,
title={RecSim: A Configurable Simulation Platform for Recommender Systems},
author={Eugene Ie and Chih-wei Hsu and Martin Mladenov and Vihan Jain and Sanmit Narvekar and Jing Wang and Rui Wu and Craig Boutilier},
year={2019},
eprint={1909.04847},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
這不是 Google 官方支援的產品。
建議使用(https://pypi.org/project/recsim/)安裝RecSim:
pip install recsim
但是,截至 2019 年 12 月,PyPI 中還沒有最新版本的 Dopamine。 我們希望在安裝 RecSim 之前從 Dopamine 儲存庫安裝最新版本,如下所示。請注意,Dopamine 需要 Tensorflow 1.15.0,這是最終的 1.x 版本,包括對 Ubuntu 和 Windows 的 GPU 支援。
pip install git+https://github.com/google/dopamine.git
以下是一些可用於測試安裝的範例命令:
git clone https://github.com/google-research/recsim
cd recsim/recsim
python main.py --logtostderr
--base_dir="/tmp/recsim/interest_exploration_full_slate_q"
--agent_name=full_slate_q
--environment_name=interest_exploration
--episode_log_file='episode_logs.tfrecord'
--gin_bindings=simulator.runner_lib.Runner.max_steps_per_episode=100
--gin_bindings=simulator.runner_lib.TrainRunner.num_iterations=10
--gin_bindings=simulator.runner_lib.TrainRunner.max_training_steps=100
--gin_bindings=simulator.runner_lib.EvalRunner.max_eval_episodes=5
然後您可以啟動張量板並查看輸出
tensorboard --logdir=/tmp/recsim/interest_exploration_full_slate_q/ --port=2222
您也可以在 /tmp/recsim/episode_logs.tfrecord 中找到模擬日誌
要開始使用,請查看我們的 Colab 教學。在RecSim:概述中,我們對 RecSim 進行了簡要概述。然後我們討論每個可配置元件:環境和推薦代理。
高層設計請參考白皮書。