Dapat melakukan segmentasi kata pada kalimat bahasa Mandarin dan Inggris dengan campuran tanda baca lebar penuh dan lebar setengah. Anda dapat memilih panjang kata maksimum suatu frasa, panjang kata minimum suatu kalimat tanda baca, apakah akan mempertahankan satu kata dalam hasil segmentasi kata, apakah akan mempertahankan tanda baca, dan fungsi lainnya. Untuk petunjuk lebih rinci, silakan lihat Readme.txt dalam paket unduhan.
File kamus sqlite disediakan secara default. Jika host virtual Anda tidak mendukung sqlite, Anda dapat mengimpornya ke mysql atau membuat kamus lain sendiri.
Karena kemampuan saya yang terbatas, saya mungkin tidak dapat memuaskan semua orang dalam hal efisiensi, jadi harap sertakan informasi lebih lanjut.
Pemasangan, pembongkaran, dan pembuatan kueri kamus memiliki fungsi terpisah, sehingga mudah untuk dimodifikasi. Algoritme segmentasi kata inti hanya memerlukan findinDict untuk mengembalikan nilai benar atau salah untuk memberi tahu saya apakah kata tersebut ada dalam kamus.
Hal lain yang perlu diperhatikan adalah ekstensi mbstring diperlukan. Tidak mungkin. Bahasa Mandarin, Inggris, lebar penuh, dan lebar setengah digabungkan untuk mengelompokkan kata.
Program ini disediakan sebagai ekstensi ThinkPHP secara default, tetapi Anda dapat menghapus Basis perluasan dan menggunakan segmentasi kata secara langsung. Perjanjian open source Apache2, JADI, tidak masalah jika digunakan untuk sumber tertutup komersial, selama Anda tidak menyukai program saya
Memperluas