TextBlob
v0.7.0
홈페이지: https://textblob.readthedocs.io/
TextBlob은 텍스트 데이터를 처리하기 위한 Python 라이브러리입니다. 품사 태깅, 명사구 추출, 감정 분석, 분류 등과 같은 일반적인 자연어 처리(NLP) 작업을 수행하기 위한 간단한 API를 제공합니다.
from textblob import TextBlobtext = """The Blob의 명목상의 위협은 항상 나를 최고의 영화 괴물로 생각했습니다. 만족할 줄 모르고 배고픈 아메바 같은 덩어리는 사실상 모든 보호 장치를 관통할 수 있으며, 불운한 의사가 냉담하게 설명하는 것처럼-" 접촉 시 살을 흡수합니다. 젤라틴에 대한 스나이드 비교는 지독합니다. 이는 제안된 회색 끈끈한 시나리오와 다르지 않고 잠재적인 결과 중 가장 파괴적인 개념입니다. 인공 지능이 만연하는 것을 두려워하는 기술 이론가들에 의해."""blob = TextBlob(text)blob.tags # [('The', 'DT'), ('titular', 'JJ'),# ('threat', ' NN'), ('of', 'IN'), ...]blob.noun_phrases # WordList(['titular Threat', 'blob',# '궁극의 영화 괴물',# '아메바 같은 덩어리', ...])blob.sentences의 문장:print(sentence.sentiment. polarity)# 0.060# -0.341
TextBlob은 NLTK와 패턴의 거대한 어깨 위에 서 있으며 두 가지 모두와 잘 어울립니다.
명사구 추출
품사 태그 지정
감성분석
분류(나이브 베이즈, 의사결정 트리)
토큰화(텍스트를 단어와 문장으로 분할)
단어 및 구문 빈도
파싱
n-그램
단어 활용(복수화 및 단수화) 및 표제어 추출
철자 교정
확장을 통해 새 모델 또는 언어 추가
워드넷 통합
$ pip 설치 -U textblob $ python -m textblob.download_corpora
빠른 시작 가이드에서 더 많은 예시를 확인하세요.
전체 문서는 https://textblob.readthedocs.io/에서 확인할 수 있습니다.
문서: https://textblob.readthedocs.io/
변경 로그: https://textblob.readthedocs.io/en/latest/changelog.html
PyPI: https://pypi.python.org/pypi/TextBlob
문제: https://github.com/sloria/TextBlob/issues
MIT 라이센스를 받았습니다. 자세한 내용은 번들로 제공되는 LICENSE 파일을 참조하세요.