Ringkasan
Program ini adalah generator puisi berbasis lirik Taylor Swift yang menggabungkan file data dari berbagai sumber, memprosesnya, dan kemudian menggunakan Rantai Markov untuk menghasilkan puisi. Program ini memanfaatkan berbagai perpustakaan termasuk pandas, dan NLTK untuk menangani manipulasi data, pemrosesan teks, dan pemrosesan bahasa alami.
Persyaratan Sistem
Persyaratan Perangkat Lunak
- Python (3.8 atau lebih baru).
- pip: Penginstal paket untuk Python.
Menginstal Paket yang Diperlukan
Anda dapat menginstal paket yang diperlukan menggunakan pip. Jalankan perintah berikut di terminal atau command prompt Anda:
pip install numpy pandas nltk
Instalasi
- Pastikan Anda menginstal Python 3.8 atau lebih baru di sistem Anda.
- Pastikan pip diinstal pada sistem Anda.
- Unduh kodenya atau kloning repositori ke mesin lokal Anda.
- Pastikan Anda memiliki folder yang berisi data teks ("Data", "Midnights", "TheVault").
- Arahkan ke direktori yang berisi kode di terminal atau command prompt Anda.
- Jalankan perintah pip yang disebutkan di atas untuk menginstal paket yang diperlukan.
- Unduh data NLTK yang diperlukan dengan menjalankan perintah Python berikut:
nltk.download('brown')
nltk.download('words')
nltk.download('cmudict')
Menjalankan Generator
Untuk menjalankan program, ikuti langkah-langkah berikut:
- Pastikan direktori kerja Anda disetel ke direktori yang berisi kode.
- Pastikan Anda memiliki file data dalam format yang diperlukan dan di direktori yang benar. Program mengharapkan file CSV yang berisi lirik di folder "Data", dan file teks di folder "Midnights" dan "TheVault".
- Jalankan program menggunakan perintah berikut di terminal atau command prompt Anda:
- Program ini akan mengeluarkan puisi yang dihasilkan.
File Data
Direktori
- Program mengharapkan file CSV yang berisi lirik dalam direktori "Data".
- Program ini mengharapkan file teks untuk album Midnights di direktori "Midnights".
- Program ini mengharapkan file teks untuk track vault di direktori "TheVault".
- Jalur direktori file data disimpan dalam variabel. Untuk mengubah jalur Anda dapat mengedit yang berikut:
data_path = "Data"
midnights_path = "Midnights"
vault_path = "TheVault"
- Pastikan teks dan file CSV dikodekan dalam UTF-8 untuk menghindari masalah pengkodean.
Sumber Data
- File CSV di direktori Data diambil dari kumpulan data Kaggle "Lirik Lagu Taylor Swift (Semua Album)" oleh Jan Llenzl Dagohoy. Kumpulan data ini dapat ditemukan di: https://www.kaggle.com/datasets/thespacefreak/taylor-swift-song-lyrics-all-albums
- Semua lirik adalah lirik dari Taylor Swift.