Beranda: https://textblob.readthedocs.io/
TextBlob adalah perpustakaan Python untuk memproses data tekstual. Ini menyediakan API sederhana untuk menyelami tugas-tugas pemrosesan bahasa alami (NLP) yang umum seperti penandaan part-of-speech, ekstraksi frasa kata benda, analisis sentimen, klasifikasi, dan banyak lagi.
from textblob import TextBlobtext = """Ancaman utama The Blob selalu menurut saya sebagai monster film terhebat: massa yang sangat lapar, mirip amuba yang mampu menembus hampir semua perlindungan, mampu--seperti yang digambarkan dengan dingin oleh seorang dokter yang malang--" mengasimilasi daging saat bersentuhan. Terkutuklah perbandingan sinis dengan gelatin, ini adalah konsep dengan konsekuensi potensial yang paling menghancurkan, tidak seperti cairan abu-abu. skenario yang diusulkan oleh para ahli teori teknologi yang takut akan kecerdasan buatan merajalela."""blob = TextBlob(text)blob.tags # [('The', 'DT'), ('titular', 'JJ'),# ('threat', 'NN'), ('of', 'IN'), ...]blob.noun_phrases # Daftar Kata(['ancaman judul', 'blob',# 'monster film pamungkas',# 'massa mirip amuba', ...])untuk kalimat dalam gumpalan.kalimat:print(kalimat.sentimen.polaritas)# 0.060# -0.341
TextBlob berdiri di atas bahu raksasa NLTK dan pola, dan berfungsi baik dengan keduanya.
Ekstraksi frase kata benda
Penandaan bagian dari ucapan
Analisis sentimen
Klasifikasi (Naive Bayes, Pohon Keputusan)
Tokenisasi (memecah teks menjadi kata dan kalimat)
Frekuensi kata dan frase
Penguraian
n-gram
Infleksi kata (pluralisasi dan singularisasi) dan lemmatisasi
Koreksi ejaan
Tambahkan model atau bahasa baru melalui ekstensi
Integrasi WordNet
$ pip install -U gumpalan teks $ python -m textblob.download_corpora
Lihat contoh lainnya di panduan Memulai Cepat.
Dokumentasi lengkap tersedia di https://textblob.readthedocs.io/.
Dokumen: https://textblob.readthedocs.io/
Log Perubahan: https://textblob.readthedocs.io/en/latest/changelog.html
PyPI: https://pypi.python.org/pypi/TextBlob
Masalah: https://github.com/sloria/TextBlob/issues
berlisensi MIT. Lihat file LISENSI yang dibundel untuk lebih jelasnya.