Überblick
Bei diesem Programm handelt es sich um einen lyrikbasierten Gedichtgenerator von Taylor Swift, der Datendateien aus mehreren Quellen kombiniert, verarbeitet und dann mithilfe einer Markov-Kette ein Gedicht generiert. Das Programm nutzt verschiedene Bibliotheken, darunter Pandas und NLTK, um Datenmanipulation, Textverarbeitung und Verarbeitung natürlicher Sprache durchzuführen.
Systemanforderungen
Softwareanforderungen
- Python (3.8 oder höher).
- pip: Ein Paketinstallationsprogramm für Python.
Erforderliche Pakete installieren
Sie können die erforderlichen Pakete mit pip installieren. Führen Sie den folgenden Befehl in Ihrem Terminal oder Ihrer Eingabeaufforderung aus:
pip install numpy pandas nltk
Installation
- Stellen Sie sicher, dass Python 3.8 oder höher auf Ihrem System installiert ist.
- Stellen Sie sicher, dass pip auf Ihrem System installiert ist.
- Laden Sie den Code herunter oder klonen Sie das Repository auf Ihren lokalen Computer.
- Stellen Sie sicher, dass Sie über die Ordner verfügen, die die Textdaten enthalten („Data“, „Midnights“, „TheVault“).
- Navigieren Sie in Ihrem Terminal oder Ihrer Eingabeaufforderung zu dem Verzeichnis, das den Code enthält.
- Führen Sie den oben genannten pip-Befehl aus, um die erforderlichen Pakete zu installieren.
- Laden Sie die erforderlichen NLTK-Daten herunter, indem Sie die folgenden Python-Befehle ausführen:
nltk.download('brown')
nltk.download('words')
nltk.download('cmudict')
Den Generator betreiben
Um das Programm auszuführen, gehen Sie folgendermaßen vor:
- Stellen Sie sicher, dass Ihr Arbeitsverzeichnis auf das Verzeichnis eingestellt ist, das den Code enthält.
- Stellen Sie sicher, dass Ihre Datendateien im erforderlichen Format und in den richtigen Verzeichnissen vorliegen. Das Programm erwartet CSV-Dateien mit Liedtexten in einem „Data“-Ordner und Textdateien in den Ordnern „Midnights“ und „TheVault“.
- Führen Sie das Programm mit dem folgenden Befehl in Ihrem Terminal oder Ihrer Eingabeaufforderung aus:
- Das Programm gibt ein generiertes Gedicht aus.
Datendateien
Verzeichnisse
- Das Programm erwartet CSV-Dateien mit Liedtexten in einem „Data“-Verzeichnis.
- Das Programm erwartet Textdateien für das Midnights-Album im Verzeichnis „Midnights“.
- Das Programm erwartet Textdateien für die Tresorspuren im Verzeichnis „TheVault“.
- Die Verzeichnispfade der Datendateien werden in Variablen gespeichert. Um den Pfad zu ändern, können Sie Folgendes bearbeiten:
data_path = "Data"
midnights_path = "Midnights"
vault_path = "TheVault"
- Stellen Sie sicher, dass die Text- und CSV-Dateien in UTF-8 kodiert sind, um Kodierungsprobleme zu vermeiden.
Datenquelle
- Die CSV-Dateien im Datenverzeichnis wurden aus dem Kaggle-Datensatz „Taylor Swift Song Lyrics (All Albums)“ von Jan Llenzl Dagohoy abgerufen. Dieser Datensatz ist zu finden unter: https://www.kaggle.com/datasets/thespacefreak/taylor-swift-song-lyrics-all-albums
- Alle Liedtexte stammen von Taylor Swift.