Latihan pengkodean untuk konsentrasi Pemrosesan Bahasa Alami, bagian dari program Nanodegree Kecerdasan Buatan Udacity.
Anda memerlukan Python 3.6+, dan paket yang disebutkan di requirements.txt
. Anda dapat menginstalnya menggunakan:
pip install -r requirements.txt
File data untuk latihan disertakan dalam data/
, tetapi beberapa perpustakaan NLP memerlukan data tambahan untuk melakukan tugas seperti penandaan PoS, lemmatisasi, dll. Secara khusus, nltk
akan memunculkan kesalahan jika data yang diperlukan tidak diinstal. Anda dapat menggunakan pernyataan Python berikut untuk membuka pengunduh NLTK dan memilih paket yang diinginkan untuk diinstal:
nltk . download ()
Anda juga dapat mengunduh semua paket data NLTK yang tersedia, yang mencakup sejumlah contoh corpora juga, namun mungkin memerlukan waktu cukup lama (10+GB).
Untuk menjalankan file skrip apa pun, gunakan:
python < script.py >
Untuk membuka buku catatan, gunakan:
jupyter notebook < notebook.ipynb >
Karya ini dilisensikan di bawah Lisensi Internasional Creative Commons Attribution-NonCommercial-NoDerivatives 4.0. Silakan merujuk ke Ketentuan Layanan Udacity untuk informasi lebih lanjut.