recsim
1.0.0
RecSim 是一个可配置平台,用于为推荐系统 (RS) 创作模拟环境,自然支持与用户的顺序交互。 RecSim 允许创建新环境,在抽象级别上反映用户行为和项目结构的特定方面,非常适合在顺序交互式推荐问题中突破当前强化学习 (RL) 和 RS 技术的限制。可以轻松配置环境来改变以下方面的假设:用户偏好和项目熟悉度;用户潜在状态及其动态;以及选择模型和其他用户响应行为。我们概述了 RecSim 如何为 RL 和 RS 研究人员和从业者提供价值,以及它如何作为学术-工业合作的工具。有关 RecSim 架构的详细说明,请阅读 Ie 等人。如果您在工作中使用此存储库中的代码,请引用该论文。
@article{ie2019recsim,
title={RecSim: A Configurable Simulation Platform for Recommender Systems},
author={Eugene Ie and Chih-wei Hsu and Martin Mladenov and Vihan Jain and Sanmit Narvekar and Jing Wang and Rui Wu and Craig Boutilier},
year={2019},
eprint={1909.04847},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
这不是 Google 官方支持的产品。
建议使用(https://pypi.org/project/recsim/)安装RecSim:
pip install recsim
但是,截至 2019 年 12 月,PyPI 中还没有最新版本的 Dopamine。我们希望在安装 RecSim 之前从 Dopamine 存储库安装最新版本,如下所示。请注意,Dopamine 需要 Tensorflow 1.15.0,这是最终的 1.x 版本,包括对 Ubuntu 和 Windows 的 GPU 支持。
pip install git+https://github.com/google/dopamine.git
以下是一些可用于测试安装的示例命令:
git clone https://github.com/google-research/recsim
cd recsim/recsim
python main.py --logtostderr
--base_dir="/tmp/recsim/interest_exploration_full_slate_q"
--agent_name=full_slate_q
--environment_name=interest_exploration
--episode_log_file='episode_logs.tfrecord'
--gin_bindings=simulator.runner_lib.Runner.max_steps_per_episode=100
--gin_bindings=simulator.runner_lib.TrainRunner.num_iterations=10
--gin_bindings=simulator.runner_lib.TrainRunner.max_training_steps=100
--gin_bindings=simulator.runner_lib.EvalRunner.max_eval_episodes=5
然后您可以启动张量板并查看输出
tensorboard --logdir=/tmp/recsim/interest_exploration_full_slate_q/ --port=2222
您还可以在 /tmp/recsim/episode_logs.tfrecord 中找到模拟日志
要开始使用,请查看我们的 Colab 教程。在RecSim:概述中,我们对 RecSim 进行了简要概述。然后我们讨论每个可配置组件:环境和推荐代理。
高层设计请参考白皮书。