TextBlob
v0.7.0
首頁:https://textblob.readthedocs.io/
TextBlob 是一個用於處理文字資料的 Python 函式庫。它提供了一個簡單的 API,可用於深入研究常見的自然語言處理 (NLP) 任務,例如詞性標記、名詞短語提取、情緒分析、分類等。
from textblob import TextBlobtext = """The Blob 的名義威脅一直讓我覺得是終極電影怪物:一個貪得無厭、像阿米巴原蟲一樣的群體,能夠穿透幾乎任何防護措施,能夠——正如一位注定要失敗的醫生冷酷地描述的那樣——」在接觸時同化肉體。與明膠的諷刺比較是該死的,這是一個具有最具破壞性的潛在後果的概念,與擔心人工智能猖獗的技術理論家提出的灰色黏液場景不同。 , ('of', 'IN'), ...]blob.noun_phrases # WordList(['名義威脅', 'blob',# '終極電影怪物',# '阿米巴樣品質', ... ])for 句子in blob.sentences:print(sentence.sentiment.polity)# 0.060# -0.341
TextBlob 站在 NLTK 和模式的巨人肩膀上,並且可以很好地與兩者配合。
名詞片語提取
詞性標註
情緒分析
分類(樸素貝葉斯、決策樹)
標記化(將文字分割成單字和句子)
單字和片語的頻率
解析
n 元語法
詞形變化(複數和單數)和詞形還原
拼字糾正
透過擴展添加新模型或語言
WordNet 集成
$ pip install -U textblob $ python -m textblob.download_corpora
請參閱快速入門指南中的更多範例。
完整文件可在 https://textblob.readthedocs.io/ 取得。
文件:https://textblob.readthedocs.io/
更改日誌:https://textblob.readthedocs.io/en/latest/changelog.html
PyPI:https://pypi.python.org/pypi/TextBlob
問題:https://github.com/sloria/TextBlob/issues
麻省理工學院許可。有關更多詳細信息,請參閱捆綁的許可證文件。