Descripción general
Este programa es un generador de poemas basado en letras de Taylor Swift que combina archivos de datos de múltiples fuentes, los procesa y luego usa una cadena de Markov para generar un poema. El programa utiliza varias bibliotecas, incluidas pandas y NLTK, para manejar la manipulación de datos, el procesamiento de texto y el procesamiento del lenguaje natural.
Requisitos del sistema
Requisitos de software
- Python (3.8 o posterior).
- pip: un instalador de paquetes para Python.
Instalación de paquetes requeridos
Puede instalar los paquetes necesarios utilizando pip. Ejecute el siguiente comando en su terminal o símbolo del sistema:
pip install numpy pandas nltk
Instalación
- Asegúrese de tener Python 3.8 o posterior instalado en su sistema.
- Asegúrese de que pip esté instalado en su sistema.
- Descargue el código o clone el repositorio en su máquina local.
- Asegúrese de tener las carpetas que contienen los datos de texto ("Data", "Midnights", "TheVault").
- Navegue hasta el directorio que contiene el código en su terminal o símbolo del sistema.
- Ejecute el comando pip mencionado anteriormente para instalar los paquetes necesarios.
- Descargue los datos NLTK necesarios ejecutando los siguientes comandos de Python:
nltk.download('brown')
nltk.download('words')
nltk.download('cmudict')
Ejecutando el generador
Para ejecutar el programa, siga estos pasos:
- Asegúrese de que su directorio de trabajo esté configurado en el directorio que contiene el código.
- Asegúrese de tener sus archivos de datos en el formato requerido y en los directorios correctos. El programa espera archivos CSV que contengan letras en una carpeta "Datos" y archivos de texto en las carpetas "Midnights" y "TheVault".
- Ejecute el programa usando el siguiente comando en su terminal o símbolo del sistema:
- El programa generará un poema generado.
Archivos de datos
Directorios
- El programa espera archivos CSV que contengan letras en un directorio de "Datos".
- El programa espera archivos de texto para el álbum Midnights en el directorio "Midnights".
- El programa espera archivos de texto para las pistas de la bóveda en el directorio "TheVault".
- Las rutas de directorio de los archivos de datos se almacenan en variables. Para cambiar la ruta puedes editar lo siguiente:
data_path = "Data"
midnights_path = "Midnights"
vault_path = "TheVault"
- Asegúrese de que los archivos de texto y CSV estén codificados en UTF-8 para evitar problemas de codificación.
Fuente de datos
- Los archivos CSV en el directorio de datos fueron recuperados del conjunto de datos de Kaggle "Taylor Swift Song Lyrics (All Albums)" por Jan Llenzl Dagohoy. Este conjunto de datos se puede encontrar en: https://www.kaggle.com/datasets/thespacefreak/taylor-swift-song-lyrics-all-albums
- Todas las letras son letras de Taylor Swift.