Aperçu
Ce programme est un générateur de poèmes basé sur des paroles de Taylor Swift qui combine des fichiers de données provenant de plusieurs sources, les traite, puis utilise une chaîne de Markov pour générer un poème. Le programme utilise diverses bibliothèques, notamment pandas et NLTK, pour gérer la manipulation des données, le traitement de texte et le traitement du langage naturel.
Configuration système requise
Configuration logicielle requise
- Python (3.8 ou version ultérieure).
- pip : un programme d'installation de package pour Python.
Installation des packages requis
Vous pouvez installer les packages requis à l'aide de pip. Exécutez la commande suivante dans votre terminal ou votre invite de commande :
pip install numpy pandas nltk
Installation
- Assurez-vous que Python 3.8 ou version ultérieure est installé sur votre système.
- Assurez-vous que pip est installé sur votre système.
- Téléchargez le code ou clonez le référentiel sur votre ordinateur local.
- Assurez-vous que vous disposez des dossiers contenant les données texte ("Data", "Midnights", "TheVault").
- Accédez au répertoire contenant le code dans votre terminal ou votre invite de commande.
- Exécutez la commande pip mentionnée ci-dessus pour installer les packages requis.
- Téléchargez les données NLTK nécessaires en exécutant les commandes Python suivantes :
nltk.download('brown')
nltk.download('words')
nltk.download('cmudict')
Faire fonctionner le générateur
Pour exécuter le programme, procédez comme suit :
- Assurez-vous que votre répertoire de travail est défini sur le répertoire contenant le code.
- Assurez-vous d'avoir vos fichiers de données au format requis et dans les répertoires appropriés. Le programme attend des fichiers CSV contenant des paroles dans un dossier « Data » et des fichiers texte dans les dossiers « Midnights » et « TheVault ».
- Exécutez le programme à l'aide de la commande suivante dans votre terminal ou invite de commande :
- Le programme produira un poème généré.
Fichiers de données
Annuaires
- Le programme attend des fichiers CSV contenant des paroles dans un répertoire "Data".
- Le programme attend les fichiers texte pour l'album Midnights dans le répertoire "Midnights".
- Le programme attend des fichiers texte pour les pistes du coffre-fort dans le répertoire "TheVault".
- Les chemins de répertoire des fichiers de données sont stockés dans des variables. Pour modifier le chemin, vous pouvez modifier ce qui suit :
data_path = "Data"
midnights_path = "Midnights"
vault_path = "TheVault"
- Assurez-vous que les fichiers texte et CSV sont encodés en UTF-8 pour éviter les problèmes d'encodage.
Source de données
- Les fichiers CSV du répertoire Data ont été extraits de l'ensemble de données Kaggle « Taylor Swift Song Lyrics (All Albums) » de Jan Llenzl Dagohoy. Cet ensemble de données peut être trouvé sur : https://www.kaggle.com/datasets/thespacefreak/taylor-swift-song-lyrics-all-albums
- Toutes les paroles sont des paroles de Taylor Swift.