mmi_anti_pytorch Скачать - mmi_anti_pytorch Загрузка исходного кода

mmi_anti_pytorch

AI Исходный код

1.0.0

Скачать

mmi_anti_pytorch

Этот проект представляет собой реализацию pytorch для модели MMI-anti, описанной в разделе «Целевая функция содействия разнообразию для моделей нейронного диалога».

Ссылка

Этот код основан на OpenNMT-py и word_language_model.

Быстрый старт

Шаг 1. Предварительная обработка данных

 python preprocess.py

Мы будем работать с некоторыми примерами данных в папке data/ . Данные состоят из контекста параллельного диалога ( .en ) и данных его ответа ( .vi ), содержащих одно предложение в строке с токенами, разделенными пробелом:

train.en
train.vi
dev.en
dev.vi

После запуска предварительной обработки в папке data/ создаются следующие файлы:

dialogue.train.1.pt : сериализованный файл PyTorch, содержащий данные обучения.
dialogue.valid.1.pt : сериализованный файл PyTorch, содержащий данные проверки.
dialogue.vocab.pt : сериализованный файл PyTorch, содержащий словарные данные, которые будут использоваться в процессе обучения языковой модели.

Шаг 2. Обучение языковой модели

 cd lm/tool/

На этом этапе мы обучим языковую модель на основе ответов модели MMI-anti (пример data data/*.vi ). Поскольку эта языковая модель будет использоваться в модели MMI-anti, она будет использовать словарь ( data/*.vocab.pt ), созданный на Step1 .

Шаг 2.1: Предварительная обработка данных

 python preprocess.py

Эта предварительная обработка превратит все ответы для модели MMI-anti (пример data data/*.vi ) в параллельные данные для языковой модели.

После запуска предварительной обработки в папке lm/data/ создаются следующие файлы:

train.en
train.de
dev.en
dev.de

Например, ответ "they just want a story" в файле data/train.vi будет предварительно обработан до "<s> they just want a story" в файле lm/data/train.en и "they just want a story </s>" в файле lm/data/train.de .

Шаг 2.2: Обучение языковой модели

 cd ../
python lm.py

Эта команда поезда сохранит языковую модель в lm/model.pt .

Чтобы запустить этот код на ЦП, вам необходимо обновить pytorch до любой версии после 24th Feb 2018 и убедиться, что этот фрагмент кода можно найти в вашем torchtext/data/iterator.py :

 if not torch.cuda.is_available() and self.device is None:
  self.device = -1

Шаг 2.3. Проверьте свою языковую модель

 python generate.py

Этот инструмент случайным образом сгенерирует 1000 высказываний, используя языковую модель lm/model.pt , и сохранит их в файл lm/generated.txt .

Шаг 2.4: Вернитесь к нашей модели MMI-anti.

 cd ../

Шаг 3. Обучение модели MMI-анти.

 python train.py

Шаг 4: Создать

 python translate.py -model model_name

Результаты генерации будут сохранены в файле pred.txt .

Шаг 5: Оцените разнообразие?

 cat pred.txt | python diversity.py

Расширять

Дополнительная информация

Версия 1.0.0
Тип AI Исходный код
Время обновления 2024-12-30
размер 50MB
От Github

Связанные приложения

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Бесплатная версия механизма анализа данных Lihua 3.0_search_navigation_collection_public Opinion_ranking_api

2022-06-28

mmi_anti_pytorch

mmi_anti_pytorch

Ссылка

Быстрый старт

Шаг 1. Предварительная обработка данных

Шаг 2. Обучение языковой модели

Шаг 2.1: Предварительная обработка данных

Шаг 2.2: Обучение языковой модели

Шаг 2.3. Проверьте свою языковую модель

Шаг 2.4: Вернитесь к нашей модели MMI-anti.

Шаг 3. Обучение модели MMI-анти.

Шаг 4: Создать

Шаг 5: Оцените разнообразие?

OpenCore_NO_ACPI_Build

nspanel_pro_tools_apk

YuQue_Book_Download

zkwork_aleo_gpu_worker

nextcloud_share_url_downloader

Бесплатная версия механизма анализа данных Lihua 3.0_search_navigation_collection_public Opinion_ranking_api

chat.petals.dev

GPT Prompt Templates

GPTyped

node telegram bot api

typebot.io

python wechaty getting started

waymo open dataset

termwind

wp functions