كود المصدر هذا هو تطبيق لخوارزمية TextRank في لغة برمجة PHP، بموجب ترخيص MIT.
إن GPTs مثل ChatGPT هي نماذج لغة خاضعة للإشراف تفهم السياق وتولد محتوى جديدًا من المدخلات المحددة باستخدام موارد هائلة بينما TextRank عبارة عن خوارزمية استخراج نص فعالة من حيث التكلفة/منخفضة التكلفة. يمكن أيضًا استخدام خوارزمية TextRank كمعالج مسبق لنموذج GPT لتقليل حجم النص لتوفير استهلاك الموارد.
التلخيص التلقائي هو عملية تصغير مستند نصي باستخدام برنامج كمبيوتر من أجل إنشاء ملخص يحتفظ بأهم نقاط المستند الأصلي. التقنيات التي يمكنها تقديم ملخص متماسك تأخذ في الاعتبار متغيرات مثل الطول وأسلوب الكتابة وبناء الجملة. يعد التلخيص التلقائي للبيانات جزءًا من التعلم الآلي واستخراج البيانات. الفكرة الرئيسية للتلخيص هي العثور على مجموعة فرعية تمثيلية من البيانات، والتي تحتوي على معلومات المجموعة بأكملها. تُستخدم تقنيات التلخيص في عدد كبير من القطاعات في الصناعة اليوم. - ويكيبيديا
خوارزمية هذا التنفيذ هي:
cd your-project-folder
composer require php-science/textrank
cd git-project-folder
docker-compose build
docker-compose up -d
composer install
composer test
use PhpScience TextRank Tool StopWords English ;
// String contains a long text, see the /res/sample1.txt file.
$ text = " Lorem ipsum... " ;
$ api = new TextRankFacade ();
// English implementation for stopwords/junk words:
$ stopWords = new English ();
$ api -> setStopWords ( $ stopWords );
// Array of the most important keywords:
$ result = $ api -> getOnlyKeyWords ( $ text );
// Array of the sentences from the most important part of the text:
$ result = $ api -> getHighlights ( $ text );
// Array of the most important sentences from the text:
$ result = $ api -> summarizeTextBasic ( $ text );
المزيد من الأمثلة:
اسم | مستخدم جيثب |
---|---|
ديفيد بيليتشا | @ديفيد بيليكزا |
ريكاردو مارتون | @ريكاردومارتون |
سينديسي | @Syndesi |
vincentsch | @فينسنتش |
أندرو ولش | @khalwat |
أندريه أستاشوف | @mvcaaa |
ليو تونيف | @bragle |
ويلي أريسكي | @willyarisky |
روبرت جان كيزر | @KeizerDev |
مورتي | @evil1morty |
سيزر فيدانسي | @SezerFidanci |