Kode sumber ini merupakan implementasi algoritma TextRank dalam bahasa pemrograman PHP, di bawah lisensi MIT.
GPT seperti ChatGPT adalah model bahasa yang diawasi yang memahami konteks dan menghasilkan konten baru dari masukan yang diberikan menggunakan sumber daya yang besar, sementara TextRank adalah algoritme ekstraksi teks yang hemat biaya/berbiaya rendah. Algoritme TextRank juga dapat digunakan sebagai pra-pemroses model GPT untuk mengurangi ukuran teks guna menghemat konsumsi sumber daya.
Peringkasan otomatis adalah proses mereduksi dokumen teks dengan program komputer untuk membuat ringkasan yang mempertahankan poin terpenting dari dokumen asli. Teknologi yang dapat membuat ringkasan yang koheren mempertimbangkan variabel seperti panjang, gaya penulisan, dan sintaksis. Peringkasan data otomatis adalah bagian dari pembelajaran mesin dan penambangan data. Ide utama dari peringkasan adalah untuk menemukan subkumpulan data yang representatif, yang berisi informasi dari keseluruhan kumpulan. Teknologi peringkasan digunakan di sejumlah besar sektor industri saat ini. -Wikipedia
Algoritma implementasi ini adalah:
cd your-project-folder
composer require php-science/textrank
cd git-project-folder
docker-compose build
docker-compose up -d
composer install
composer test
use PhpScience TextRank Tool StopWords English ;
// String contains a long text, see the /res/sample1.txt file.
$ text = " Lorem ipsum... " ;
$ api = new TextRankFacade ();
// English implementation for stopwords/junk words:
$ stopWords = new English ();
$ api -> setStopWords ( $ stopWords );
// Array of the most important keywords:
$ result = $ api -> getOnlyKeyWords ( $ text );
// Array of the sentences from the most important part of the text:
$ result = $ api -> getHighlights ( $ text );
// Array of the most important sentences from the text:
$ result = $ api -> summarizeTextBasic ( $ text );
Contoh lainnya:
Nama | Pengguna GitHub |
---|---|
David Belicza | @DavidBelicza |
Riccardo Marton | @riccardomarton |
Sindesi | @Syndesi |
vincentsch | @vincentsch |
Andrew Welch | @khalwat |
Andrey Astashov | @mvcaaa |
Leo Toneff | @bragle |
Willy Arisky | @willyarisky |
Robert-Jan Keizer | @KeizerDev |
Morty | @evil1morty |
Sezer Fidanci | @SezerFidanci |