Page d'accueil : https://textblob.readthedocs.io/
TextBlob est une bibliothèque Python de traitement de données textuelles. Il fournit une API simple pour se plonger dans les tâches courantes de traitement du langage naturel (NLP), telles que le marquage de parties du discours, l'extraction de phrases nominales, l'analyse des sentiments, la classification, etc.
from textblob import TextBlobtext = """La menace principale de The Blob m'a toujours semblé être le monstre ultime du cinéma : une masse insatiablement affamée, semblable à une amibe, capable de pénétrer pratiquement n'importe quelle protection, capable de - comme le décrit d'une manière effrayante un médecin condamné - " assimilant la chair au contact. Au diable les comparaisons sournoises avec la gélatine, c'est un concept avec les conséquences potentielles les plus dévastatrices, un peu comme la glu grise scénario proposé par des théoriciens de la technologie craignant une intelligence artificielle rampante."""blob = TextBlob(text)blob.tags # [('The', 'DT'), ('titular', 'JJ'),# ('menace', 'NN'), ('de', 'IN'), ...]blob.noun_phrases # WordList(['menace titulaire', 'blob',# 'monstre de cinéma ultime',# 'masse semblable à une amibe', ...])pour la phrase dans blob.sentences:print(sentence.sentiment.polarity)# 0.060# -0.341
TextBlob repose sur les épaules géantes de NLTK et de Pattern, et joue bien avec les deux.
Extraction de phrases nominales
Marquage d'une partie du discours
Analyse des sentiments
Classification (Naive Bayes, arbre de décision)
Tokenisation (divisation du texte en mots et phrases)
Fréquences des mots et des phrases
Analyse
n-grammes
Inflexion des mots (pluralisation et singularisation) et lemmatisation
Correction orthographique
Ajouter de nouveaux modèles ou langues via des extensions
Intégration WordNet
$ pip install -U textblob $ python -m textblob.download_corpora
Voir plus d’exemples dans le guide de démarrage rapide.
La documentation complète est disponible sur https://textblob.readthedocs.io/.
Documents : https://textblob.readthedocs.io/
Journal des modifications : https://textblob.readthedocs.io/en/latest/changelog.html
PyPI : https://pypi.python.org/pypi/TextBlob
Problèmes : https://github.com/sloria/TextBlob/issues
Licence MIT. Consultez le fichier LICENSE fourni pour plus de détails.