概述
該程式是一個基於泰勒·斯威夫特歌詞的詩歌生成器,它結合了多個來源的數據文件,對其進行處理,然後使用馬可夫鏈生成一首詩。該程式利用包括 pandas 和 NLTK 在內的各種函式庫來處理資料操作、文字處理和自然語言處理。
系統需求
軟體需求
- Python(3.8 或更高版本)。
- pip:Python 的套件安裝程式。
安裝所需的套件
您可以使用 pip 安裝所需的軟體包。在終端機或命令提示字元中執行以下命令:
pip install numpy pandas nltk
安裝
- 確保您的系統上安裝了 Python 3.8 或更高版本。
- 確保您的系統上安裝了 pip。
- 下載程式碼或將儲存庫克隆到本機。
- 確保您擁有包含文字資料的資料夾(“Data”、“Midnights”、“TheVault”)。
- 在終端機或命令提示字元中導覽至包含程式碼的目錄。
- 執行上面提到的 pip 指令來安裝所需的軟體包。
- 透過執行以下 Python 命令下載必要的 NLTK 資料:
nltk.download('brown')
nltk.download('words')
nltk.download('cmudict')
運行生成器
若要執行程序,請按照下列步驟操作:
- 確保您的工作目錄設定為包含程式碼的目錄。
- 確保您的資料檔案採用所需的格式並位於正確的目錄中。程式需要在「Data」資料夾中包含包含歌詞的 CSV 文件,在「Midnights」和「TheVault」資料夾中包含文字檔案。
- 在終端機或命令提示字元中使用以下命令執行程式:
- 程式將輸出一首生成的詩。
資料檔案
目錄
- 程式需要在「Data」目錄中包含包含歌詞的 CSV 檔案。
- 該程式需要“Midnights”目錄中的 Midnights 專輯的文本檔案。
- 程式需要「TheVault」目錄中的 Vault 軌道文字檔。
- 資料檔案的目錄路徑儲存在變數中。若要變更路徑,您可以編輯以下內容:
data_path = "Data"
midnights_path = "Midnights"
vault_path = "TheVault"
- 確保文字和 CSV 檔案採用 UTF-8 編碼以避免編碼問題。
數據來源
- Data 目錄中的 CSV 檔案是從 Jan Llenzl Dagohoy 的「Taylor Swift Song Lyrics (All Albums)」Kaggle 資料集中檢索的。此資料集可在以下位置找到:https://www.kaggle.com/datasets/thespacefreak/taylor-swift-song-lyrics-all-albums
- 所有歌詞均為泰勒·斯威夫特的歌詞。