ซอร์สโค้ดนี้เป็นการนำอัลกอริทึม TextRank ไปใช้ในภาษาการเขียนโปรแกรม PHP ภายใต้ลิขสิทธิ์ของ MIT
GPT เช่น ChatGPT เป็นโมเดลภาษาที่ได้รับการดูแลซึ่งเข้าใจบริบทและสร้างเนื้อหาใหม่จากอินพุตที่กำหนดโดยใช้ทรัพยากรมากมาย ในขณะที่ TextRank เป็นอัลกอริธึมการแยกข้อความที่คุ้มค่า/ประหยัด อัลกอริธึม TextRank ยังสามารถใช้เป็นตัวประมวลผลล่วงหน้าสำหรับโมเดล GPT เพื่อลดขนาดข้อความเพื่อประหยัดการใช้ทรัพยากร
การสรุปอัตโนมัติเป็นกระบวนการลดขนาดเอกสารข้อความด้วยโปรแกรมคอมพิวเตอร์เพื่อสร้างการสรุปที่คงจุดที่สำคัญที่สุดของเอกสารต้นฉบับ เทคโนโลยีที่สามารถทำให้การสรุปสอดคล้องกันคำนึงถึงตัวแปรต่างๆ เช่น ความยาว รูปแบบการเขียน และไวยากรณ์ การสรุปข้อมูลอัตโนมัติเป็นส่วนหนึ่งของการเรียนรู้ของเครื่องและการขุดข้อมูล แนวคิดหลักของการสรุปคือการค้นหาชุดย่อยที่เป็นตัวแทนของข้อมูล ซึ่งมีข้อมูลของทั้งชุด เทคโนโลยีการสรุปถูกนำมาใช้ในภาคอุตสาหกรรมจำนวนมากในปัจจุบัน - วิกิพีเดีย
อัลกอริทึมของการดำเนินการนี้คือ:
cd your-project-folder
composer require php-science/textrank
cd git-project-folder
docker-compose build
docker-compose up -d
composer install
composer test
use PhpScience TextRank Tool StopWords English ;
// String contains a long text, see the /res/sample1.txt file.
$ text = " Lorem ipsum... " ;
$ api = new TextRankFacade ();
// English implementation for stopwords/junk words:
$ stopWords = new English ();
$ api -> setStopWords ( $ stopWords );
// Array of the most important keywords:
$ result = $ api -> getOnlyKeyWords ( $ text );
// Array of the sentences from the most important part of the text:
$ result = $ api -> getHighlights ( $ text );
// Array of the most important sentences from the text:
$ result = $ api -> summarizeTextBasic ( $ text );
ตัวอย่างเพิ่มเติม:
ชื่อ | ผู้ใช้ GitHub |
---|---|
เดวิด เบลิชซ่า | @เดวิดเบลิซซ่า |
ริคคาร์โด้ มาร์ตัน | @riccardomarton |
ซินเดซี่ | @ซินเดซี่ |
วินเซนต์ช | @vincentsch |
แอนดรูว์ เวลช์ | @khalwat |
อันเดรย์ อัสตาชอฟ | @mvcaaa |
ลีโอ โทเนฟฟ์ | @bragle |
วิลลี่ อาริสกี้ | @willyarisky |
โรเบิร์ต-แจน ไคเซอร์ | @KeizerDev |
มอร์ตี้ | @evil1morty |
เซเซอร์ ฟิดันชี | @SezerFidanci |