Ejercicios de codificación para la concentración de Procesamiento del lenguaje natural, parte del programa Nanogrados de Inteligencia Artificial de Udacity.
Necesita Python 3.6+ y los paquetes mencionados en requirements.txt
. Puedes instalarlos usando:
pip install -r requirements.txt
Los archivos de datos para los ejercicios se incluyen en data/
, pero algunas de las bibliotecas de PNL requieren datos adicionales para realizar tareas como etiquetado PoS, lematización, etc. Específicamente, nltk
generará un error si los datos requeridos no están instalados. Puede utilizar la siguiente instrucción de Python para abrir el descargador de NLTK y seleccionar los paquetes que desee instalar:
nltk . download ()
También puede descargar todos los paquetes de datos NLTK disponibles, que también incluyen una serie de corpus de muestra, pero eso puede llevar un tiempo (más de 10 GB).
Para ejecutar cualquier archivo de script, utilice:
python < script.py >
Para abrir un cuaderno, utilice:
jupyter notebook < notebook.ipynb >
Esta obra está bajo una licencia Creative Commons Atribución-NoComercial-SinDerivadas 4.0 Internacional. Consulte los Términos de servicio de Udacity para obtener más información.