如果您能夠在Arxiv 上認可我,我將非常高興https://arxiv.org/auth/endorse?x=FRBB89 謝謝這個存儲庫旨在收集用於解決文本摘要的抽象方法的多種實現,針對不同的情境語言(印地語、阿姆哈拉語、英語,很快就會出現阿拉伯語)
如果您發現這個專案有幫助,請考慮引用我們的工作,這對我來說確實意義重大
@INPROCEEDINGS{9068171,
author={A. M. {Zaki} and M. I. {Khalil} and H. M. {Abbas}},
booktitle={2019 14th International Conference on Computer Engineering and Systems (ICCES)},
title={Deep Architectures for Abstractive Text Summarization in Multiple Languages},
year={2019},
volume={},
number={},
pages={22-27},}
@misc{zaki2020amharic,
title={Amharic Abstractive Text Summarization},
author={Amr M. Zaki and Mahmoud I. Khalil and Hazem M. Abbas},
year={2020},
eprint={2003.13721},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
它是為了在一台筆記本上簡單地在google colab 上運行而構建的,因此您只需要互聯網連接即可運行這些示例,而無需擁有強大的機器,因此所有代碼示例都將採用jupiter 格式,並且您不需要當我們將這些 jupiter 筆記本連接到 Google Drive 時,無需將資料下載到您的設備
該存儲庫已在一系列部落格中進行了解釋
透過此網站 (eazymind) 嘗試此文本摘要,該網站使您能夠透過以下方式總結您的文本
curl -X POST
http://eazymind.herokuapp.com/arabic_sum/eazysum
-H 'cache-control: no-cache'
-H 'content-type: application/x-www-form-urlencoded'
-d "eazykey={eazymind api key}&sentence={your sentence to be summarized}"
pip install eazymind
from eazymind.nlp.eazysum import Summarizer
#---key from eazymind website---
key = "xxxxxxxxxxxxxxxxxxxxx"
#---sentence to be summarized---
sentence = """(CNN)The White House has instructed former
White House Counsel Don McGahn not to comply with a subpoena
for documents from House Judiciary Chairman Jerry Nadler,
teeing up the latest in a series of escalating oversight
showdowns between the Trump administration and congressional Democrats."""
summarizer = Summarizer(key)
print(summarizer.run(sentence))
包含 3 個不同的模型,它們實現了 seq2seq 網路的概念,同時還添加了具有豐富特徵的單字表示等概念。
是 David Currie 的 https://github.com/Currie32/Text-Summarization-with-Amazon-Reviews seq2seq 的修改
對 https://github.com/dongjun-Lee/text-summarization-tensorflow 的修改
使用 http://www.aclweb.org/anthology/K16-1028 中的概念對模型 2.ipynb 進行修改
一個資料夾包含這兩個模型的結果,來自 zaksum 格式的驗證文字樣本,它結合了所有的
對 https://github.com/thomasschmied/Text_Summarization_with_Tensorflow/blob/master/summarizer_amazon_reviews.ipynb 的修改
它是 https://github.com/abisee/pointer-generator https://arxiv.org/abs/1704.04368 的驚人工作的延續,此實現使用指針生成器網絡的概念來減少出現的一些問題與正常的seq2seq 網路
使用帶有 seq2seq 的指標產生器,注意它是使用 python2.7 建構的
由 python3 建構用於評估
我仍然會致力於他們的覆蓋機制的實施,如果上帝願意的話,還有很多工作要做。
這個實作是 https://github.com/yaserkl/RLSeq2Seq https://arxiv.org/abs/1805.09461 所做的令人驚嘆的工作的延續
@article{keneshloo2018deep,
title={Deep Reinforcement Learning For Sequence to Sequence Models},
author={Keneshloo, Yaser and Shi, Tian and Ramakrishnan, Naren and Reddy, Chandan K.},
journal={arXiv preprint arXiv:1805.09461},
year={2018}
}
這是一個使用強化學習和 seq2seq 構建多種方法的庫,我收集了他們的程式碼以在 jupiter 筆記本中運行,並訪問為 python 2.7 構建的 google 驅動器
由 python3 建構用於評估