Este código fuente es una implementación del algoritmo TextRank en lenguaje de programación PHP, bajo licencia MIT.
Los GPT como ChatGPT son modelos de lenguaje supervisados que comprenden el contexto y generan contenido nuevo a partir de la entrada dada utilizando vastos recursos, mientras que TextRank es un algoritmo de extracción de texto rentable y de bajo costo. El algoritmo TextRank también se puede utilizar como preprocesador de un modelo GPT para reducir el tamaño del texto y ahorrar en el consumo de recursos.
El resumen automático es el proceso de reducir un documento de texto con un programa de computadora para crear un resumen que conserve los puntos más importantes del documento original. Las tecnologías que pueden hacer un resumen coherente tienen en cuenta variables como la extensión, el estilo de escritura y la sintaxis. El resumen automático de datos es parte del aprendizaje automático y la minería de datos. La idea principal del resumen es encontrar un subconjunto representativo de los datos, que contenga la información del conjunto completo. Las tecnologías de resumen se utilizan hoy en día en una gran cantidad de sectores de la industria. -Wikipedia
El algoritmo de esta implementación es:
cd your-project-folder
composer require php-science/textrank
cd git-project-folder
docker-compose build
docker-compose up -d
composer install
composer test
use PhpScience TextRank Tool StopWords English ;
// String contains a long text, see the /res/sample1.txt file.
$ text = " Lorem ipsum... " ;
$ api = new TextRankFacade ();
// English implementation for stopwords/junk words:
$ stopWords = new English ();
$ api -> setStopWords ( $ stopWords );
// Array of the most important keywords:
$ result = $ api -> getOnlyKeyWords ( $ text );
// Array of the sentences from the most important part of the text:
$ result = $ api -> getHighlights ( $ text );
// Array of the most important sentences from the text:
$ result = $ api -> summarizeTextBasic ( $ text );
Más ejemplos:
Nombre | Usuario de GitHub |
---|---|
David Belicza | @DavidBelicza |
Ricardo Marton | @riccardomarton |
Síndesi | @Syndesi |
vincentsch | @vincentsch |
Andres Welch | @khalwat |
Andrei Astashov | @mvcaaa |
Leo Toneff | @bragle |
Willy Arisky | @willyarisky |
Robert-Jan Keizer | @KeizerDev |
Morty | @evil1morty |
Sezer Fidanci | @SezerFidanci |