Exercícios de codificação para a concentração de Processamento de Linguagem Natural, parte do programa Nanodegree de Inteligência Artificial da Udacity.
Você precisa do Python 3.6+ e dos pacotes mencionados em requirements.txt
. Você pode instalá-los usando:
pip install -r requirements.txt
Os arquivos de dados para exercícios estão incluídos em data/
, mas algumas das bibliotecas de PNL requerem dados adicionais para executar tarefas como marcação PoS, lematização, etc. Especificamente, nltk
gerará um erro se os dados necessários não forem instalados. Você pode usar a seguinte instrução Python para abrir o downloader NLTK e selecionar os pacotes desejados para instalar:
nltk . download ()
Você também pode baixar todos os pacotes de dados NLTK disponíveis, que também incluem vários corpora de amostra, mas isso pode demorar um pouco (10+ GB).
Para executar qualquer arquivo de script, use:
python < script.py >
Para abrir um bloco de notas, use:
jupyter notebook < notebook.ipynb >
Este trabalho está licenciado sob uma Licença Creative Commons Atribuição-NãoComercial-SemDerivações 4.0 Internacional. Consulte os Termos de Serviço da Udacity para obter mais informações.