Repositori berisi kode untuk menghasilkan puisi pendek menggunakan model bahasa generatif dengan arsitektur GPT.
Model bahasa transformatif berdasarkan arsitektur GPT digunakan. Model ini memperhitungkan tata bahasa bahasa Rusia (mirip dengan model bahasa seperti rugpt) dan fonetiknya, termasuk aturan rima dan konstruksi meteran puisi. Detailnya ada di presentasi.
Biner model tersedia di gambar buruh pelabuhan inkoziev/verslibre:latest.
Unduh dan jalankan gambar:
sudo docker pull inkoziev/verslibre:latest
sudo docker run -it inkoziev/verslibre:latest
Setelah peluncuran, program akan meminta Anda memasukkan token untuk bot telegram.
Setelah memuat semua model, Anda dapat memulai bot dalam obrolannya dengan perintah /start. Bot akan meminta Anda memilih salah satu dari tiga topik acak untuk esai Anda atau memasukkan topik Anda sendiri. Topiknya bisa berupa frasa apa pun yang memiliki kata benda sebagai pemeran utama, misalnya “pembuat puisi”.
Bot ini tersedia di telegram sebagai @verslibre_bot
Contoh generasi:
* * *
Любовь - источник вдохновения,
Души непризнанных людей.
И день весеннего цветения,
Омытый зеленью дождей…
* * *
Душа, гонимая страстями,
Тревожит, веет теплотой.
Любовь, хранимая стихами,
И примиренье, и покой.
Selain model generatif itu sendiri, transkriptor puitis, yang menandai puisi sumber untuk model pelatihan, sangat penting untuk pengoperasian yang benar. Anda dapat membaca lebih lanjut tentang pekerjaan transkriptor di sini.
Gambar buruh pelabuhan inkoziev/haiku:latest tersedia untuk menjalankan generator sebagai bot telegram.
Unduh gambar dan jalankan:
sudo docker pull inkoziev/haiku:latest
sudo docker run -it inkoziev/haiku
Program akan meminta Anda memasukkan token bot telegram. Model kemudian akan dimuat (sekitar satu menit) dan Anda dapat berkomunikasi dengan bot. Masukkan benih - kata benda atau frasa. Menghasilkan beberapa pilihan pada CPU membutuhkan waktu kurang lebih 30 detik. Kemudian bot akan menampilkan opsi pertama dan menawarkan untuk mengevaluasinya, atau menampilkan opsi berikutnya.
Bot ini tersedia di telegram sebagai @haiku_guru_bot.
Karena ini adalah model generatif yang diacak, hasilnya biasanya tidak dapat ditiru hanya dengan memasukkan benih yang sama. Salin hasil yang bagus, lengkapi dengan model ilustratif, seperti ruDALLE, dan dapatkan konten yang benar-benar unik:
Contoh haiku lainnya dapat dilihat di blog saya.
Subdirektori tmp berisi file dengan bagian data pelatihan:
puisi_corpus.txt - kumpulan kuatrain yang difilter, simbol | sebagai pemisah garis; digunakan untuk pelatihan tambahan model ruGPT.
puisi_generator_dataset.dat - kumpulan data untuk pelatihan ruGPT, yang menghasilkan teks puisi berdasarkan topik (frasa kunci).
captions_generator_rugpt.dat - kumpulan data untuk pelatihan ruGPT, menghasilkan judul ayat berdasarkan isinya.
Uraian proses persiapan korps pelatihan dapat dilihat di sini.