Домашняя страница: https://textblob.readthedocs.io/
TextBlob — это библиотека Python для обработки текстовых данных. Он предоставляет простой API для решения общих задач обработки естественного языка (NLP), таких как разметка частей речи, извлечение именной фразы, анализ настроений, классификация и многое другое.
from textblob import TextBlobtext = """Титульная угроза The Blob всегда казалась мне величайшим киномонстром: ненасытно голодная, подобная амебе масса, способная проникнуть практически через любую защиту, способная - как ее пугающе описывает обреченный доктор -" ассимилируя плоть при контакте. К черту ехидные сравнения с желатином, это концепция с самыми разрушительными потенциальными последствиями, мало чем отличающаяся от серой слизи. сценарий, предложенный технологическими теоретиками, опасающимися безудержного распространения искусственного интеллекта."""blob = TextBlob(text)blob.tags # [('The', 'DT'), ('titular', 'JJ'),# ('threat', 'NN'), ('of', 'IN'), ...]blob.noun_phrases # WordList(['титульная угроза', 'blob',# 'абсолютный киномонстр',# 'масса, подобная амебе', ...]) для предложения в blob.sentences:print(sentence.sentiment.polarity)# 0.060# -0.341
TextBlob стоит на гигантских плечах NLTK и шаблона и прекрасно сочетается с обоими.
Извлечение существительной фразы
Маркировка частей речи
Анализ настроений
Классификация (наивный Байес, дерево решений)
Токенизация (разбиение текста на слова и предложения)
Частота слов и фраз
Разбор
n-граммы
Словоизменение (множественное число и сингуляризация) и лемматизация
Исправление орфографии
Добавляйте новые модели или языки с помощью расширений.
Интеграция с WordNet
$ pip install -U textblob $ python -m textblob.download_corpora
Дополнительные примеры см. в руководстве по быстрому запуску.
Полная документация доступна по адресу https://textblob.readthedocs.io/.
Документы: https://textblob.readthedocs.io/.
Журнал изменений: https://textblob.readthedocs.io/en/latest/changelog.html.
PyPI: https://pypi.python.org/pypi/TextBlob
Проблемы: https://github.com/sloria/TextBlob/issues.
Лицензия MIT. Дополнительную информацию см. в прилагаемом файле ЛИЦЕНЗИИ.