Exercices de codage pour la concentration Traitement du langage naturel, qui fait partie du programme Nanodegree en intelligence artificielle d'Udacity.
Vous avez besoin de Python 3.6+ et des packages mentionnés dans requirements.txt
. Vous pouvez les installer en utilisant :
pip install -r requirements.txt
Les fichiers de données pour les exercices sont inclus sous data/
, mais certaines bibliothèques NLP nécessitent des données supplémentaires pour effectuer des tâches telles que le marquage PoS, la lemmatisation, etc. Plus précisément, nltk
générera une erreur si les données requises ne sont pas installées. Vous pouvez utiliser l'instruction Python suivante pour ouvrir le téléchargeur NLTK et sélectionner le(s) package(s) souhaité(s) à installer :
nltk . download ()
Vous pouvez également télécharger tous les packages de données NLTK disponibles, qui incluent également un certain nombre d'échantillons de corpus, mais cela peut prendre un certain temps (10+ Go).
Pour exécuter n'importe quel fichier de script, utilisez :
python < script.py >
Pour ouvrir un notebook, utilisez :
jupyter notebook < notebook.ipynb >
Ce travail est sous licence internationale Creative Commons Attribution-NonCommercial-NoDerivatives 4.0. Veuillez vous référer aux conditions d'utilisation d'Udacity pour plus d'informations.