Visão geral
Este programa é um gerador de poemas baseado em letras Taylor Swift que combina arquivos de dados de várias fontes, os processa e, em seguida, usa uma cadeia de Markov para gerar um poema. O programa utiliza várias bibliotecas, incluindo pandas e NLTK para lidar com manipulação de dados, processamento de texto e processamento de linguagem natural.
Requisitos do sistema
Requisitos de software
- Python (3.8 ou posterior).
- pip: Um instalador de pacote para Python.
Instalando pacotes necessários
Você pode instalar os pacotes necessários usando pip. Execute o seguinte comando em seu terminal ou prompt de comando:
pip install numpy pandas nltk
Instalação
- Certifique-se de ter o Python 3.8 ou posterior instalado em seu sistema.
- Certifique-se de que o pip esteja instalado em seu sistema.
- Baixe o código ou clone o repositório em sua máquina local.
- Certifique-se de ter as pastas contendo os dados de texto ("Data", "Midnights", "TheVault").
- Navegue até o diretório que contém o código em seu terminal ou prompt de comando.
- Execute o comando pip mencionado acima para instalar os pacotes necessários.
- Baixe os dados NLTK necessários executando os seguintes comandos Python:
nltk.download('brown')
nltk.download('words')
nltk.download('cmudict')
Executando o Gerador
Para executar o programa, siga estas etapas:
- Certifique-se de que seu diretório de trabalho esteja definido como o diretório que contém o código.
- Certifique-se de ter seus arquivos de dados no formato necessário e nos diretórios corretos. O programa espera arquivos CSV contendo letras em uma pasta “Data” e arquivos de texto nas pastas “Midnights” e “TheVault”.
- Execute o programa usando o seguinte comando em seu terminal ou prompt de comando:
- O programa produzirá um poema gerado.
Arquivos de dados
Diretórios
- O programa espera arquivos CSV contendo letras em um diretório “Data”.
- O programa espera arquivos de texto do álbum Midnights no diretório "Midnights".
- O programa espera arquivos de texto para as trilhas do Vault no diretório "TheVault".
- Os caminhos dos diretórios dos arquivos de dados são armazenados em variáveis. Para alterar o caminho, você pode editar o seguinte:
data_path = "Data"
midnights_path = "Midnights"
vault_path = "TheVault"
- Certifique-se de que os arquivos de texto e CSV estejam codificados em UTF-8 para evitar problemas de codificação.
Fonte de dados
- Os arquivos CSV no diretório Data foram recuperados do conjunto de dados Kaggle "Taylor Swift Song Lyrics (All Albums)" de Jan Llenzl Dagohoy. Este conjunto de dados pode ser encontrado em: https://www.kaggle.com/datasets/thespacefreak/taylor-swift-song-lyrics-all-albums
- Todas as letras são letras de Taylor Swift.