Скачать calm textgame - calm textgame Скачать исходный код

calm textgame

AI Исходный код

1.0.0

Скачать

Модель контекстного языка действий (CALM) и набор данных ClubFloyd

Код и данные для бумаги Keep CALM and Explore: Language Models for Action в текстовых играх на EMNLP 2020.

Обзор

Наш набор данных ClubFloyd ( calm/lm_data.zip ) получен с веб-сайта ClubFloyd и содержит 426 транскриптов игрового процесса, охватывающих 590 текстовых игр различных жанров и стилей.

Данные состоят из 223 527 пар контекст-действие в формате [CLS] observation [SEP] action [SEP] next observation [SEP] next action [SEP] . Мы используем [CLS] observation [SEP] action [SEP] next observation [SEP] в качестве контекста для обучения языковых моделей (n-грамма, GPT-2) для прогнозирования next action [SEP] и показываем, что эта способность генерации действий обобщает к невидимым играм и поддерживает игровой процесс в сочетании с обучением с подкреплением.

Начиная

Клонируйте репозиторий и установите зависимости:

pip install torch==1.4 transformers==2.5.1 jericho fasttext wandb importlib_metadata
git clone https://github.com/princeton-nlp/calm-textgame && cd calm-textgame
ln -s ../lm calm && ln -s ../lm drrn

(Если установка pip для fasttext не удалась, попробуйте выполнить шаги сборки здесь: https://github.com/facebookresearch/fastText#building-fasttext-for-python)

Поезд СПОКОЙСТВИЕ:

 cd calm
unzip lm_data.zip
python train.py

Вес обученной модели можно скачать здесь как для моделей GPT-2, так и для n-грамм.

Затем обучите DRRN, используя обученный CALM:

 cd ../drrn
python train.py --rom_path ../games/ ${GAME} --lm_path ${PATH_TO_CALM} --lm_type ${gpt_or_ngram}

Чтобы быстро опробовать модель GPT-2 CALM:

 from lm import GPT2LM
model = GPT2LM ( "model_weights/gpt2" )
print ( model . generate ( "[CLS] observation [SEP] action [SEP] next observation [SEP]" , k = 30 ))

Цитирование

 @inproceedings{yao2020calm,
    title={Keep CALM and Explore: Language Models for Action Generation in Text-based Games},
    author={Yao, Shunyu and Rao, Rohan and Hausknecht, Matthew and Narasimhan, Karthik},
    booktitle={Empirical Methods in Natural Language Processing (EMNLP)},
    year={2020}
}