TextBlob
v0.7.0
主页:https://textblob.readthedocs.io/
TextBlob 是一个用于处理文本数据的 Python 库。它提供了一个简单的 API,可用于深入研究常见的自然语言处理 (NLP) 任务,例如词性标记、名词短语提取、情感分析、分类等。
from textblob import TextBlobtext = """The Blob 的名义威胁一直让我觉得是终极电影怪物:一个贪得无厌、像阿米巴原虫一样的群体,能够穿透几乎任何防护措施,能够——正如一位注定要失败的医生冷酷地描述的那样——”在接触时同化肉体。与明胶的讽刺比较是该死的,这是一个具有最具破坏性的潜在后果的概念,与提出的灰色粘液场景不同由技术理论家担心人工智能猖獗。"""blob = TextBlob(text)blob.tags # [('The', 'DT'), ('titular', 'JJ'),# ('threat', ' NN'), ('of', 'IN'), ...]blob.noun_phrases # WordList(['标题威胁', 'blob',# '终极电影怪物',# '阿米巴样质量', ...])for blob.sentences 中的句子:print(sentence.sentiment.polity)# 0.060# -0.341
TextBlob 站在 NLTK 和模式的巨人肩膀上,并且可以很好地与两者配合。
名词短语提取
词性标注
情感分析
分类(朴素贝叶斯、决策树)
标记化(将文本分割成单词和句子)
单词和短语的频率
解析
n 元语法
词形变化(复数和单数)和词形还原
拼写纠正
通过扩展添加新模型或语言
WordNet 集成
$ pip install -U textblob $ python -m textblob.download_corpora
请参阅快速入门指南中的更多示例。
完整文档可在 https://textblob.readthedocs.io/ 获取。
文档:https://textblob.readthedocs.io/
更改日志:https://textblob.readthedocs.io/en/latest/changelog.html
PyPI:https://pypi.python.org/pypi/TextBlob
问题:https://github.com/sloria/TextBlob/issues
麻省理工学院许可。有关更多详细信息,请参阅捆绑的许可证文件。