PHP Science TextRank
Arabic & Turkish languages support
このソース コードは、MIT ライセンスに基づいて PHP プログラミング言語で TextRank アルゴリズムを実装したものです。
ChatGPT のような GPT は、コンテキストを理解し、膨大なリソースを使用して指定された入力から新しいコンテンツを生成する教師あり言語モデルですが、TextRank はコスト効率の高い/低コストのテキスト抽出アルゴリズムです。 TextRank アルゴリズムは、テキスト サイズを削減してリソース消費を節約する GPT モデルのプリプロセッサとしても使用できます。
自動要約は、元の文書の最も重要な点を保持した要約を作成するために、コンピューター プログラムを使用してテキスト文書を縮小するプロセスです。一貫した要約を作成できるテクノロジーでは、長さ、書き方、構文などの変数が考慮されます。自動データ要約は、機械学習とデータ マイニングの一部です。要約の主な考え方は、セット全体の情報を含む、データの代表的なサブセットを見つけることです。要約テクノロジーは、今日の産業界の多くの分野で使用されています。 - ウィキペディア
この実装のアルゴリズムは次のとおりです。
cd your-project-folder
composer require php-science/textrank
cd git-project-folder
docker-compose build
docker-compose up -d
composer install
composer test
use PhpScience TextRank Tool StopWords English ;
// String contains a long text, see the /res/sample1.txt file.
$ text = " Lorem ipsum... " ;
$ api = new TextRankFacade ();
// English implementation for stopwords/junk words:
$ stopWords = new English ();
$ api -> setStopWords ( $ stopWords );
// Array of the most important keywords:
$ result = $ api -> getOnlyKeyWords ( $ text );
// Array of the sentences from the most important part of the text:
$ result = $ api -> getHighlights ( $ text );
// Array of the most important sentences from the text:
$ result = $ api -> summarizeTextBasic ( $ text );
その他の例:
名前 | GitHub ユーザー |
---|---|
デビッド・ベリツァ | @DavidBelicza |
リカルド・マートン | @リカルドマートン |
シンデシ | @シンデシ |
ヴィンセントシュ | @vincentsch |
アンドリュー・ウェルチ | @カルワット |
アンドレイ・アスタショフ | @mvcaaa |
レオ・トネフ | @ブラグル |
ウィリー・アリスキー | @willyarisky |
ロバート・ヤン・カイザー | @KeizerDev |
モーティ | @evil1morty |
セゼル・フィダンジュ | @SezerFidanci |