Ce code source est une implémentation de l'algorithme TextRank en langage de programmation PHP, sous licence MIT.
Les GPT comme ChatGPT sont des modèles de langage supervisés qui comprennent le contexte et génèrent du nouveau contenu à partir de l'entrée donnée en utilisant de vastes ressources, tandis que TextRank est un algorithme d'extraction de texte rentable/faible coût. L'algorithme TextRank peut également être utilisé comme préprocesseur d'un modèle GPT pour réduire la taille du texte afin d'économiser sur la consommation de ressources.
Le résumé automatique est le processus de réduction d'un document texte avec un programme informatique afin de créer un résumé conservant les points les plus importants du document original. Les technologies permettant de réaliser un résumé cohérent prennent en compte des variables telles que la longueur, le style d'écriture et la syntaxe. La synthèse automatique des données fait partie de l'apprentissage automatique et de l'exploration de données. L'idée principale du résumé est de trouver un sous-ensemble représentatif des données, qui contient les informations de l'ensemble. Les technologies de synthèse sont aujourd’hui utilisées dans un grand nombre de secteurs industriels. - Wikipédia
L'algorithme de cette implémentation est :
cd your-project-folder
composer require php-science/textrank
cd git-project-folder
docker-compose build
docker-compose up -d
composer install
composer test
use PhpScience TextRank Tool StopWords English ;
// String contains a long text, see the /res/sample1.txt file.
$ text = " Lorem ipsum... " ;
$ api = new TextRankFacade ();
// English implementation for stopwords/junk words:
$ stopWords = new English ();
$ api -> setStopWords ( $ stopWords );
// Array of the most important keywords:
$ result = $ api -> getOnlyKeyWords ( $ text );
// Array of the sentences from the most important part of the text:
$ result = $ api -> getHighlights ( $ text );
// Array of the most important sentences from the text:
$ result = $ api -> summarizeTextBasic ( $ text );
Plus d'exemples :
Nom | Utilisateur GitHub |
---|---|
David Belicza | @DavidBelicza |
Riccardo Marton | @riccardomarton |
Syndesi | @Syndesi |
vincentsch | @vincentsch |
Andrew Welch | @khalwat |
Andreï Astachov | @mvcaaa |
Léo Toneff | @bragle |
Willy Ariski | @willyarisky |
Robert-Jan Keizer | @KeizerDev |
Morty | @evil1morty |
Sezer Fidanci | @SezerFidanci |