bayes
: Pengklasifikasi Naive- bayes untuk PHP bayes
mengambil dokumen (sepotong teks), dan memberi tahu Anda kategori apa yang termasuk dalam dokumen tersebut.
Perpustakaan ini porting dari lib nodejs @ https://github.com/ttezel/bayes
Anda dapat menggunakan ini untuk mengkategorikan konten teks apa pun ke dalam kumpulan kategori apa pun. Misalnya:
composer require niiknow/ bayes
$ classifier = new Niiknow bayes ();
// teach it positive phrases
$ classifier -> learn ( ' amazing, awesome movie!! Yeah!! Oh boy. ' , ' positive ' );
$ classifier -> learn ( ' Sweet, this is incredibly, amazing, perfect, great!! ' , ' positive ' );
// teach it a negative phrase
$ classifier -> learn ( ' terrible, shitty thing. Damn. Sucks!! ' , ' negative ' );
// now ask it to categorize a document it has never seen before
$ classifier -> categorize ( ' awesome, cool, amazing!! Yay. ' );
// => 'positive'
// serialize the classifier's state as a JSON string.
$ stateJson = $ classifier -> toJson ();
// load the classifier back from its JSON representation.
$ classifier -> fromJson ( $ stateJson );
$classifier = new Niiknow bayes ([options])
Mengembalikan contoh Pengklasifikasi bayes .
Masukkan objek options
opsional untuk mengonfigurasi instance. Jika Anda menentukan fungsi tokenizer
di options
, fungsi tersebut akan digunakan sebagai tokenizer instance.
$classifier->learn(text, category)
Ajari pengklasifikasi Anda category
apa yang termasuk dalam text
tersebut. Semakin banyak Anda mengajarkan pengklasifikasi Anda, semakin dapat diandalkan pengklasifikasi tersebut. Ia akan menggunakan apa yang telah dipelajarinya untuk mengidentifikasi dokumen baru yang belum pernah dilihatnya sebelumnya.
$classifier->categorize(text)
Mengembalikan category
yang menurutnya termasuk dalam text
. Penilaiannya didasarkan pada apa yang telah Anda ajarkan dengan .learn() .
$classifier->probabilities(text)
Ekstrak probabilitas untuk setiap kategori yang diketahui.
$classifier->toJson()
Mengembalikan representasi JSON dari pengklasifikasi.
$classifier->fromJson(jsonStr)
Mengembalikan instance pengklasifikasi dari representasi JSON. Gunakan ini dengan representasi JSON yang diperoleh dari $classifier->toJson()
Anda dapat meneruskan fungsi tokenizer Anda sendiri di konstruktor. Contoh:
// array containing stopwords
$stopwords = array("der", "die", "das", "the");
// escape the stopword array and implode with pipe
$s = '~^W*('.implode("|", array_map("preg_quote", $stopwords)).')W+b|bW+(?1)W*$~i';
$options['tokenizer'] = function($text) use ($s) {
// convert everything to lowercase
$text = mb_strtolower($text);
// remove stop words
$text = preg_replace($s, '', $text);
// split the words
preg_match_all('/[[:alpha:]]+/u', $text, $matches);
// first match list of words
return $matches[0];
};
$classifier = new niiknow bayes ($options);