Arxiv で私を支持していただければ、とても嬉しいです https://arxiv.org/auth/endorse?x=FRBB89 ありがとうございます このリポジトリは、テキストの要約に対処するための抽象的なアプローチの複数の実装を収集するために構築されています。言語 (ヒンディー語、アムハラ語、英語、そして間もなくアラビア語になります)
このプロジェクトが役に立ったと思われた場合は、私たちの仕事を引用することを検討してください。それは私にとって本当に大きな意味があります
@INPROCEEDINGS{9068171,
author={A. M. {Zaki} and M. I. {Khalil} and H. M. {Abbas}},
booktitle={2019 14th International Conference on Computer Engineering and Systems (ICCES)},
title={Deep Architectures for Abstractive Text Summarization in Multiple Languages},
year={2019},
volume={},
number={},
pages={22-27},}
@misc{zaki2020amharic,
title={Amharic Abstractive Text Summarization},
author={Amr M. Zaki and Mahmoud I. Khalil and Hazem M. Abbas},
year={2020},
eprint={2003.13721},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
1 つのノートブックで Google Colab 上で簡単に実行できるように構築されているため、これらのサンプルを実行するにはインターネット接続のみが必要で、強力なマシンは必要ありません。そのため、すべてのコードサンプルは Jupiter 形式になります。これらの Jupiter ノートブックは Google ドライブに接続されているため、デバイスにデータをダウンロードする必要はありません
このリポジトリは一連のブログで説明されています
この Web サイト (eazymind) でこのテキストの要約を試してみてください。これにより、テキストを要約することができます。
curl -X POST
http://eazymind.herokuapp.com/arabic_sum/eazysum
-H 'cache-control: no-cache'
-H 'content-type: application/x-www-form-urlencoded'
-d "eazykey={eazymind api key}&sentence={your sentence to be summarized}"
pip install eazymind
from eazymind.nlp.eazysum import Summarizer
#---key from eazymind website---
key = "xxxxxxxxxxxxxxxxxxxxx"
#---sentence to be summarized---
sentence = """(CNN)The White House has instructed former
White House Counsel Don McGahn not to comply with a subpoena
for documents from House Judiciary Chairman Jerry Nadler,
teeing up the latest in a series of escalating oversight
showdowns between the Trump administration and congressional Democrats."""
summarizer = Summarizer(key)
print(summarizer.run(sentence))
seq2seq ネットワークの概念を実装する 3 つの異なるモデルが含まれています。機能豊富な単語表現などの概念も追加されています。この作品は、これらの素晴らしいリポジトリの続きです。
David Currie の https://github.com/Currie32/Text-Summarization-with-Amazon-Reviews seq2seq の修正です
https://github.com/dongjun-Lee/text-summarization-tensorflow への変更
http://www.aclweb.org/anthology/K16-1028 の概念を使用した Model 2.ipynb への変更
フォルダーには、検証テキスト サンプルからの 2 つのモデル両方の結果が zaksum 形式で含まれています。
https://github.com/thomasschmied/Text_Summarization_with_Tensorflow/blob/master/summarizer_amazon_reviews.ipynb への変更
これは https://github.com/abisee/pointer-generator の素晴らしい成果の継続です https://arxiv.org/abs/1704.04368 この実装では、ポインター ジェネレーター ネットワークの概念を使用して、発生するいくつかの問題を軽減します。通常の seq2seq ネットワークの場合
python2.7を使用して構築されていることに注意して、seq2seqでポインタジェネレータを使用します
評価用に python3 でビルド
私はまだカバレッジメカニズムの実装に取り組んでいます。神のご意志なら、多くの作業はまだこれからです。
この実装は、https://github.com/yaserkl/RLSeq2Seq https://arxiv.org/abs/1805.09461 によって行われた素晴らしい作業の継続です。
@article{keneshloo2018deep,
title={Deep Reinforcement Learning For Sequence to Sequence Models},
author={Keneshloo, Yaser and Shi, Tian and Ramakrishnan, Naren and Reddy, Chandan K.},
journal={arXiv preprint arXiv:1805.09461},
year={2018}
}
これは seq2seq による強化学習を使用して複数のアプローチを構築するためのライブラリです。jupiter ノートブックで実行し、Python 2.7 用に構築された Google ドライブにアクセスするためのコードを集めました。
評価用に python3 でビルド