TextBlob
v0.7.0
ホームページ: https://textblob.readthedocs.io/
TextBlob は、テキスト データを処理するための Python ライブラリです。品詞のタグ付け、名詞フレーズの抽出、センチメント分析、分類などの一般的な自然言語処理 (NLP) タスクに取り組むためのシンプルな API を提供します。
from textblob import TextBlobtext = ""「ザ・ブロブの名ばかりの脅威は、常に究極の映画の怪物であると私に印象づけました。飽くなき飢えに満ちたアメーバのような塊で、事実上あらゆる安全装置を突破することができ、――運命の医師がぞっとするように描写しています――」接触すると肉を同化する。ゼラチンと比較するのは卑劣だが、これは潜在的な結果の中で最も壊滅的な概念である。これは、人工知能の蔓延を恐れる技術理論家が提案した灰色のシナリオと似ていません。"""blob = TextBlob(text)blob.tags # [('The', 'DT'), ('titular', 'JJ'),# ('脅威', 'NN'), ('of', 'IN'), ...]blob.noun_phrases # WordList(['タイトルの脅威', 'blob',# '究極の映画モンスター',# 'アメーバのような塊', ...])blob.sentences:print(sentence.sentiment.polarity)# 0.060# -0.341 の文
TextBlob は NLTK と pattern の巨大な肩の上に立っており、両方とうまく連携します。
名詞句の抽出
品詞タグ付け
感情分析
分類 (単純ベイズ、デシジョン ツリー)
トークン化 (テキストを単語と文に分割)
単語とフレーズの頻度
解析中
Nグラム
単語の語形変化(複数化と単数化)と見出し語化
スペル修正
拡張機能を使用して新しいモデルまたは言語を追加する
WordNet の統合
$ pip install -U テキストブロブ $ python -m textblob.download_corpora
クイックスタート ガイドでその他の例を参照してください。
完全なドキュメントは https://textblob.readthedocs.io/ で入手できます。
ドキュメント: https://textblob.readthedocs.io/
変更ログ: https://textblob.readthedocs.io/en/latest/changelog.html
PyPI: https://pypi.python.org/pypi/TextBlob
問題: https://github.com/sloria/TextBlob/issues
MITライセンス取得済み。詳細については、バンドルされている LICENSE ファイルを参照してください。