Repositori ini memfasilitasi pelatihan model bahasa tingkat karakter atau tingkat kata hanya berdasarkan pesan obrolan WhatsApp. Setelah pelatihan model, seseorang dapat memulai percakapan sintetis dengan grup obrolan Whatsapp yang terlatih.
assets/input/chat.txt
hanyalah pengganti, yang akan diganti dengan korpus pesan obrolan sebenarnya. |-- assets
| |-- input
| | |-- chat.txt
| |-- output
| | |-- contacts.txt
| | |-- vocab.txt
| | |-- train.pt
| | |-- valid.pt
| |-- models
| | |--model.pt
|-- src
| |-- chat.py
| |-- model.py
| |-- preprocess.py
| |-- train.py
| |-- utils.py
|-- config.py
|-- run.py
assets/input/chat.txt:
File input harus berupa obrolan WhatsApp yang diekspor (tanpa media).assets/output/:
Data pelatihan/validasi yang dikodekan dan model yang dilatih akan ditulis ke lokalsi ini.assets/models/model.pt:
Objek model pytorch terlatih.src/preprocess.py:
Mengubah pesan obrolan menjadi tensor PyTorch yang dikodekan. Data dibagi menjadi set pelatihan dan validasi.src/model.py:
Mendefinisikan kelas model bahasa.src/train.py:
Berisi kode untuk melatih model bahasa.src/chat.py:
Berisi fungsi interaksi percakapan dengan model.src/utils.py:
Fungsi utilitas berguna lainnya.run.py:
Skrip utama dengan parser argumen untuk memanggil salah satu dari tiga tindakan ("preprocess", "train", "chat").config.py:
Parameter untuk prapemrosesan dan pelatihan model dicatat. git clone https://github.com/bernhard-pfann/lad-gpt.git
cd lad-gpt
pip install -r requirements.txt
Untuk memanfaatkan proyek ini sepenuhnya, Anda memerlukan file .txt yang berisi pesan dari obrolan WhatsApp. Berikut langkah-langkah untuk mengekspor obrolan grup WhatsApp Anda menjadi file .txt:
Setelah Anda memiliki file .txt, letakkan di direktori assets/input
, bernama chat.txt
. Maka Anda siap berangkat!
Setelah data masukan tersedia, obrolan perlu dikodekan ke dalam tensor numerik. Data yang dikodekan juga dibagi menjadi set pelatihan dan validasi:
python run.py preprocess
Untuk melatih model bahasa dari awal dan hanya berdasarkan data obrolan yang dikodekan. Setel --update
jika Anda ingin melanjutkan pelatihan model yang sudah ada.
python run.py train --update
Untuk memulai obrolan dengan model terlatih:
python run.py chat