Unduh mmi_anti_pytorch - unduh kode sumber mmi_anti

mmi_anti_pytorch

Kode Sumber AI

1.0.0

Unduh

mmi_anti_pytorch

Proyek ini adalah implementasi pytorch untuk model anti-MMI yang dijelaskan dalam Fungsi Tujuan Mempromosikan Keanekaragaman untuk Model Percakapan Neural

Referensi

Kode ini didasarkan pada OpenNMT-py dan word_bahasa_model

Mulai cepat

Langkah 1: Proses awal data

 python preprocess.py

Kami akan bekerja dengan beberapa contoh data di folder data/ . Data terdiri dari data konteks dialog paralel ( .en ) dan responsnya ( .vi ) yang berisi satu kalimat per baris dengan token dipisahkan oleh spasi:

train.en
train.vi
dev.en
dev.vi

Setelah menjalankan prapemrosesan, file berikut dibuat di folder data/ :

dialogue.train.1.pt : file PyTorch berseri yang berisi data pelatihan
dialogue.valid.1.pt : file PyTorch berseri yang berisi data validasi
dialogue.vocab.pt : file PyTorch berseri yang berisi data kosakata, yang akan digunakan dalam proses pelatihan model bahasa.

Langkah2: Latih model bahasa

 cd lm/tool/

Pada langkah ini, kita akan melatih model bahasa berdasarkan respons untuk model anti-MMI (contoh data/*.vi ). Karena model bahasa ini akan digunakan dalam model anti-MMI, model ini akan membagikan kamus ( data/*.vocab.pt ) yang dihasilkan pada Step1 .

Langkah2.1: Proses awal data

 python preprocess.py

Pemrosesan awal ini akan mengubah semua respons untuk model anti-MMI (contoh data/*.vi ) menjadi data paralel untuk model bahasa.

Setelah menjalankan prapemrosesan, file berikut dibuat di folder lm/data/ :

train.en
train.de
dev.en
dev.de

Misalnya, respons "they just want a story" di file data/train.vi akan diproses terlebih dahulu menjadi "<s> they just want a story" di file lm/data/train.en dan "they just want a story </s>" dalam berkas lm/data/train.de .

Langkah2.2: Latih model bahasa

 cd ../
python lm.py

Perintah train ini akan menyimpan model bahasa ke lm/model.pt .

Untuk menjalankan kode ini pada CPU, Anda perlu memperbarui pytorch Anda ke versi apa pun setelah 24th Feb 2018 dan pastikan bahwa potongan kode ini dapat ditemukan di torchtext/data/iterator.py Anda:

 if not torch.cuda.is_available() and self.device is None:
  self.device = -1

Langkah2.3: Uji model bahasa Anda

 python generate.py

Alat ini akan menghasilkan 1000 ucapan secara acak menggunakan model bahasa lm/model.pt dan menyimpannya ke dalam file lm/generated.txt .

Langkah2.4: Kembali ke model anti MMI kami

 cd ../

Langkah 3: Latih model anti MMI

 python train.py

Langkah4: Hasilkan

 python translate.py -model model_name

Hasil pembuatannya akan disimpan dalam file pred.txt .

Langkah5: Evaluasi keragamannya?

 cat pred.txt | python diversity.py

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2024-12-30
ukuran 50MB
Berasal dari Github

Aplikasi Terkait

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Mesin analisis data Lihua versi gratis 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
node telegram bot api

Kode Sumber AI

v0.50.0
typebot.io

Kode Sumber AI

v3.1.2
python wechaty getting started

Kode Sumber AI

1.0.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
termwind

Kategori lainnya

v2.3.0
wp functions

Kategori lainnya

1.0.0

Informasi Terkait Semua