Proyek ini berupaya menciptakan kembali versi Game Semantle, varian dari Game Menebak Kata Lima Lima Wordle yang memberikan kesamaan semantik dari tebakan pemain dengan kata rahasia hari itu. Versi Semantle kami memungkinkan pemain untuk memilih dari kata embeddings pretrained berikut:
Semua skrip ditempatkan di dalam buku catatan Jupyter, yang juga mencakup penulisan terperinci yang mencakup yang berikut:
Buku catatan ini dibuat menggunakan perintah Google Colab dan menggunakan perintah seperti gdown
dan wget
. Persyaratan memori memuat embedding kata pretrain mungkin juga berat untuk beberapa mesin lokal. Oleh karena itu, kami sarankan menjalankan notebook di Colab.
Ini adalah output kursus utama dalam pengantar kelas pemrosesan bahasa alami di bawah Mr. Edward P. Tighe dari Departemen Teknologi Perangkat Lunak, Universitas De La Salle.
Proyek ini adalah buku catatan Jupyter, dengan pustaka dan modul Python berikut yang digunakan:
Perpustakaan/Modul | Keterangan | Lisensi |
---|---|---|
gensim | Menyediakan fungsi untuk embeddings vektor pelatihan, pemodelan topik, pengindeksan dokumen, dan pengambilan kesamaan dengan korpora besar | GNU Lesser General Public License v2.1 |
regex | Memberikan fungsionalitas tambahan atas modul re standar sambil mempertahankan kompatibilitas ke belakang | Lisensi Apache 2.0 |
numpy | Memberikan objek array multidimensi, berbagai objek yang diturunkan, dan bermacam -macam rutinitas untuk operasi cepat pada array | Lisensi BSD 3 Clause "New" atau "Revisi" |
io | Menyediakan fasilitas utama Python untuk menangani berbagai jenis I/O | Lisensi Yayasan Perangkat Lunak Python |
random | Menyediakan fungsi untuk menghasilkan angka pseudo-acak dengan berbagai distribusi umum | Lisensi Yayasan Perangkat Lunak Python |
Deskripsi diambil dari situs web masing -masing.
Mark Edward M. Gonzales
[email protected]
[email protected]
Hylene Jules G. Lee
[email protected]
[email protected]
Phoebe Clare L. Ong
[email protected]
[email protected]