Homepage: https://textblob.readthedocs.io/
TextBlob ist eine Python-Bibliothek zur Verarbeitung von Textdaten. Es bietet eine einfache API zum Eintauchen in gängige NLP-Aufgaben (Natural Language Processing) wie Teil-of-Speech-Tagging, Nominalphrasenextraktion, Sentimentanalyse, Klassifizierung und mehr.
from textblob import TextBlobtext = """Die titelgebende Bedrohung von The Blob kam mir schon immer wie das ultimative Filmmonster vor: eine unersättlich hungrige, amöbenartige Masse, die in der Lage ist, praktisch jeden Schutz zu durchdringen, fähig - wie ein dem Untergang geweihter Arzt es erschreckend beschreibt -" assimiliert Fleisch bei Kontakt. Scheiß auf abfällige Vergleiche mit Gelatine, es ist ein Konzept mit den verheerendsten möglichen Folgen, nicht unähnlich dem grauen Glibber Szenario, vorgeschlagen von Technologietheoretikern, die Angst vor der grassierenden künstlichen Intelligenz haben. 'NN'), ('von', 'IN'), ...]blob.noun_phrases # WordList(['titeldrohung', 'blob',# 'ultimatives Filmmonster',# 'Amöbenartige Masse', ...])für Satz in blob.sentences:print(sentence.sentiment.polarity)# 0.060# -0.341
TextBlob steht auf den riesigen Schultern von NLTK und Pattern und spielt gut mit beiden.
Extraktion von Nominalphrasen
Wortart-Tagging
Stimmungsanalyse
Klassifizierung (Naive Bayes, Entscheidungsbaum)
Tokenisierung (Aufteilen von Text in Wörter und Sätze)
Wort- und Phrasenhäufigkeiten
Parsing
n-Gramm
Wortflexion (Pluralisierung und Singularisierung) und Lemmatisierung
Rechtschreibkorrektur
Fügen Sie durch Erweiterungen neue Modelle oder Sprachen hinzu
WordNet-Integration
$ pip install -U Textblob $ python -m textblob.download_corpora
Weitere Beispiele finden Sie im Quickstart-Leitfaden.
Die vollständige Dokumentation finden Sie unter https://textblob.readthedocs.io/.
Dokumente: https://textblob.readthedocs.io/
Änderungsprotokoll: https://textblob.readthedocs.io/en/latest/changelog.html
PyPI: https://pypi.python.org/pypi/TextBlob
Probleme: https://github.com/sloria/TextBlob/issues
MIT-lizenziert. Weitere Einzelheiten finden Sie in der mitgelieferten LICENSE-Datei.