mmi_anti_pytorch下載 - mmi_anti_pytorch原始碼下載

mmi_anti_pytorch

Ai源碼

1.0.0

下載

mmi_anti_pytorch

該項目是 A Diversity-Promoting Objective Function for Neural Conversation Models 中描述的 MMI-anti 模型的 pytorch 實現

參考

程式碼基於 OpenNMT-py 和 word_language_model

快速入門

Step1：資料預處理

 python preprocess.py

我們將使用data/資料夾中的一些範例資料。此資料由平行對話情境 ( .en ) 及其回應 ( .vi ) 資料組成，每行包含一個句子，標記之間以空格分隔：

train.en
train.vi
dev.en
dev.vi

執行預處理後，在data/資料夾中產生以下檔案：

dialogue.train.1.pt ：包含訓練資料的序列化 PyTorch 文件
dialogue.valid.1.pt ：包含驗證資料的序列化 PyTorch 文件
dialogue.vocab.pt ：包含詞彙資料的序列化PyTorch文件，將在語言模型的訓練過程中使用。

Step2：訓練語言模型

 cd lm/tool/

在此步驟中，我們將根據 MMI-anti 模型的反應訓練語言模型（範例資料data/*.vi ）。由於該語言模型將在 MMI-anti 模型中使用，因此它將共用Step1中產生的字典（ data/*.vocab.pt ）。

Step2.1：資料預處理

 python preprocess.py

這些預處理會將 MMI-anti 模型的所有回應（範例資料data/*.vi ）轉換為語言模型的平行資料。

運行預處理後，在lm/data/資料夾中產生以下檔案：

train.en
train.de
dev.en
dev.de

例如，文件data/train.vi中的回應"they just want a story"將被預處理為文件lm/data/train.en中的"<s> they just want a story"和"they just want a story </s>"文件lm/data/train.de中。

Step2.2：訓練語言模型

 cd ../
python lm.py

此訓練指令會將語言模型儲存到lm/model.pt 。

要在 CPU 上執行此程式碼，您需要將 pytorch 更新到24th Feb 2018之後的任何版本，並確保可以在torchtext/data/iterator.py中找到這段程式碼：

 if not torch.cuda.is_available() and self.device is None:
  self.device = -1

Step2.3：測試你的語言模型

 python generate.py

該工具將使用語言模型lm/model.pt隨機產生 1000 個話語，並將它們保存到檔案lm/generated.txt中。

Step2.4：回到我們的MMI-anti模型

 cd ../

Step3：訓練MMI-anti模型

 python train.py

第四步：生成

 python translate.py -model model_name

生成結果將保存在檔案pred.txt中。

Step5：評估多元性？

 cat pred.txt | python diversity.py

展開

附加信息

版本 1.0.0
類型 Ai源碼
更新時間 2024-12-30
大小 50MB
來自於 Github

相關應用

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
麗華資料分析引擎免費版3.0_搜尋_導航_採集_輿情_排行_api

2022-06-28

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
node telegram bot api

Ai源碼

v0.50.0
typebot.io

Ai源碼

v3.1.2
python wechaty getting started

Ai源碼

1.0.0
waymo open dataset

其他源碼

December 2023 Update
termwind

其他類別

v2.3.0
wp functions

其他類別

1.0.0

相關資訊全部