STEVE 1 Скачать - STEVE 1 Загрузка исходного кода

STEVE 1

Другой исходный код

1.0.0

Скачать

STEVE-1: Генеративная модель преобразования текста в поведение в Minecraft

Шалев Лифшиц*, Кейран Пастер*, Харрис Чан†, Джимми Ба, Шейла МакИлрайт

Страница проекта | АрXив | PDF

Абстрактный

Создание моделей ИИ, реагирующих на текстовые инструкции, является сложной задачей, особенно для задач последовательного принятия решений. Эта работа представляет методологию, вдохновленную unCLIP, для настройки генеративных моделей поведения с помощью инструкций, не полагаясь на большой набор данных траекторий, помеченных инструкциями. Используя эту методологию, мы создаем настроенную на инструкции модель предварительной подготовки видео (VPT) под названием STEVE-1, которая может следовать открытым текстовым и визуальным инструкциям с коротким горизонтом в Minecraft™. STEVE-1 обучается в два этапа: адаптация предварительно обученной модели VPT для выполнения команд в скрытом пространстве MineCLIP, а затем предварительное обучение прогнозированию скрытых кодов из текста. Это позволяет нам точно настраивать VPT посредством самоконтролируемого поведенческого клонирования и ретроспективной перемаркировки, уменьшая необходимость в дорогостоящих текстовых аннотациях, выполняемых человеком, и все это за 60 долларов США за вычисления. Используя предварительно обученные модели, такие как VPT и MineCLIP, и применяя лучшие практики генерации изображений с текстовым условием, STEVE-1 устанавливает новую планку для открытого следования инструкциям в Minecraft с низкоуровневыми элементами управления (мышь и клавиатура) и вводом необработанных пикселей. намного превосходит предыдущие базовые показатели и уверенно выполняет 12 из 13 задач в нашем наборе оценок для ранней игры. Мы предоставляем экспериментальные данные, подчеркивающие ключевые факторы производительности последующих этапов, включая предварительное обучение, руководство без классификаторов и масштабирование данных. Все ресурсы, включая веса наших моделей, сценарии обучения и инструменты оценки, доступны для дальнейших исследований.

Структура каталогов:

 .
├── README.md
├── steve1
│   ├── All agent, dataset, and training code.
├── run_agent
│   ├── Scripts for running the agent.
├── train
│   ├── Script for training the agent and generating the dataset.

Попробуйте СТИВ-1

Настраивать

Установить среду

Мы рекомендуем запускать Linux в среде conda с Python 3.10.

Установите PyTorch 2.0: conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia
Установите MineDojo и MineCLIP: pip install minedojo git+https://github.com/MineDojo/MineCLIP
- См. раздел «Установка MineDojo» для получения более подробной информации, например, как установить правильную версию Java.
Установите MineRL: pip install git+https://github.com/minerllabs/[email protected]
- См. «Установка MineRL» для получения более подробной информации о том, как настроить MineRL.
Установите требования VPT: pip install gym==0.19 gym3 attrs opencv-python
- Примечание. На момент написания статьи для MineDojo и VPT требуются разные версии тренажерного зала. Пожалуйста, используйте версию тренажерного зала, требуемую VPT (gym==0.19). Если шаги установки выполняются в порядке, указанном здесь, правильная версия тренажерного зала будет установлена в конце установки (поскольку требования VPT устанавливаются после MineDojo).
Установите дополнительные требования: pip install gdown tqdm accelerate==0.18.0 wandb
Установите steve1 локально с помощью: pip install -e .

Работа на безголовом сервере

Если вы работаете на автономном сервере, вам необходимо установить xvfb и запустить каждый скрипт Python с помощью xvfb-run . Например, xvfb-run python script_name.py .

Также обратите внимание, что мы используем среду MineRL, а не среду MineDojo. Таким образом, установка MINEDOJO_HEADLESS=1 как указано в инструкциях по установке MineDojo, не будет иметь никакого эффекта.

Загрузите данные и веса

Запустите следующую команду, чтобы загрузить данные и веса:

 . download_weights.sh

Обучение

Чтобы обучить STEVE-1 с нуля, выполните следующие действия:

Создайте набор данных игрового процесса, запустив: . train/1_generate_dataset.sh
Создайте выборку (разделение поезд/значение), запустив: . train/2_create_sampling.sh
Обучите агента, запустив: . train/3_train.sh
Обучите предыдущий CVAE, выполнив: . train/4_train_prior.sh

Создание игровых видеороликов

Мы предоставили два сценария для тестирования агента с разными подсказками. Чтобы протестировать собственных обученных агентов, измените аргумент --in_weights в сценариях.

Бегать: . run_agent/1_gen_paper_videos.sh для создания видео, используемых в статье.
Бегать: . run_agent/2_gen_vid_for_text_prompt.sh для создания видео для произвольных текстовых подсказок.
Бегать: . run_agent/3_run_interactive_session.sh чтобы начать интерактивный сеанс со STEVE-1. Это не будет работать в безголовом режиме.

Бумажное цитирование

Пожалуйста, цитируйте нашу статью, если вы найдете STEVE-1 полезным для вашего исследования:

 @article{lifshitz2023steve1,
      title={STEVE-1: A Generative Model for Text-to-Behavior in Minecraft}, 
      author={Shalev Lifshitz and Keiran Paster and Harris Chan and Jimmy Ba and Sheila McIlraith},
      year={2023},
      eprint={2306.00937},
      archivePrefix={arXiv},
      primaryClass={cs.LG}
}

Расширять

Дополнительная информация