如果您能够在 Arxiv 上认可我,我将非常高兴 https://arxiv.org/auth/endorse?x=FRBB89 谢谢 这个存储库旨在收集用于解决文本摘要的抽象方法的多种实现,针对不同的情况语言(印地语、阿姆哈拉语、英语,很快就会出现阿拉伯语)
如果您发现这个项目有帮助,请考虑引用我们的工作,这对我来说确实意义重大
@INPROCEEDINGS{9068171,
author={A. M. {Zaki} and M. I. {Khalil} and H. M. {Abbas}},
booktitle={2019 14th International Conference on Computer Engineering and Systems (ICCES)},
title={Deep Architectures for Abstractive Text Summarization in Multiple Languages},
year={2019},
volume={},
number={},
pages={22-27},}
@misc{zaki2020amharic,
title={Amharic Abstractive Text Summarization},
author={Amr M. Zaki and Mahmoud I. Khalil and Hazem M. Abbas},
year={2020},
eprint={2003.13721},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
它是为了在一台笔记本上简单地在 google colab 上运行而构建的,因此您只需要互联网连接即可运行这些示例,而无需拥有强大的机器,因此所有代码示例都将采用 jupiter 格式,并且您不需要当我们将这些 jupiter 笔记本连接到 Google Drive 时,无需将数据下载到您的设备
该存储库已在一系列博客中进行了解释
通过此网站 (eazymind) 尝试此文本摘要,该网站使您能够通过以下方式总结您的文本
curl -X POST
http://eazymind.herokuapp.com/arabic_sum/eazysum
-H 'cache-control: no-cache'
-H 'content-type: application/x-www-form-urlencoded'
-d "eazykey={eazymind api key}&sentence={your sentence to be summarized}"
pip install eazymind
from eazymind.nlp.eazysum import Summarizer
#---key from eazymind website---
key = "xxxxxxxxxxxxxxxxxxxxx"
#---sentence to be summarized---
sentence = """(CNN)The White House has instructed former
White House Counsel Don McGahn not to comply with a subpoena
for documents from House Judiciary Chairman Jerry Nadler,
teeing up the latest in a series of escalating oversight
showdowns between the Trump administration and congressional Democrats."""
summarizer = Summarizer(key)
print(summarizer.run(sentence))
包含 3 个不同的模型,它们实现了 seq2seq 网络的概念,同时还添加了具有丰富特征的单词表示等概念。这项工作是这些令人惊叹的存储库的延续
是 David Currie 的 https://github.com/Currie32/Text-Summarization-with-Amazon-Reviews seq2seq 的修改
对 https://github.com/dongjun-Lee/text-summarization-tensorflow 的修改
使用 http://www.aclweb.org/anthology/K16-1028 中的概念对模型 2.ipynb 进行修改
一个文件夹包含这两个模型的结果,来自 zaksum 格式的验证文本样本,它结合了所有的
对 https://github.com/thomasschmied/Text_Summarization_with_Tensorflow/blob/master/summarizer_amazon_reviews.ipynb 的修改
它是 https://github.com/abisee/pointer-generator https://arxiv.org/abs/1704.04368 的惊人工作的延续,此实现使用指针生成器网络的概念来减少出现的一些问题与正常的 seq2seq 网络
使用带有 seq2seq 的指针生成器,注意它是使用 python2.7 构建的
由 python3 构建用于评估
我仍然会致力于他们的覆盖机制的实施,如果上帝愿意的话,还有很多工作要做。
这个实现是 https://github.com/yaserkl/RLSeq2Seq https://arxiv.org/abs/1805.09461 所做的令人惊叹的工作的延续
@article{keneshloo2018deep,
title={Deep Reinforcement Learning For Sequence to Sequence Models},
author={Keneshloo, Yaser and Shi, Tian and Ramakrishnan, Naren and Reddy, Chandan K.},
journal={arXiv preprint arXiv:1805.09461},
year={2018}
}
这是一个使用强化学习和 seq2seq 构建多种方法的库,我收集了他们的代码以在 jupiter 笔记本中运行,并访问为 python 2.7 构建的 google 驱动器
由 python3 构建用于评估