مكتبة بسيطة وأداة مساعدة لسطر الأوامر لاستخراج الملخص من صفحات HTML أو النصوص العادية. تحتوي الحزمة أيضًا على إطار تقييم بسيط لملخصات النص. يتم وصف طرق التلخيص المنفذة في الوثائق. أحتفظ أيضًا بقائمة من التطبيقات البديلة للملخصات في لغات البرمجة المختلفة.
هناك فرصة جيدة لذلك. ولكن إذا لم يكن الأمر كذلك فليس من الصعب إضافته.
تأكد من تثبيت Python 3.6+ وpip (Windows وLinux). تشغيل ببساطة (الطريقة المفضلة):
$ [sudo] pip install sumy
$ [sudo] pip install git+git://github.com/miso-belica/sumy.git # for the fresh version
بفضل بعض الأشخاص الطيبين، أسهل طريقة لتجربة Sumy هي في متصفحك على https://huggingface.co/spaces/issam9/sumy_space
يحتوي Sumy على أداة مساعدة لسطر الأوامر لتلخيص المستندات بسرعة.
$ sumy lex-rank --length=10 --url=https://en.wikipedia.org/wiki/Automatic_summarization # what's summarization?
$ sumy lex-rank --language=uk --length=30 --url=https://uk.wikipedia.org/wiki/Україна
$ sumy luhn --language=czech --url=https://www.zdrojak.cz/clanky/automaticke-zabezpeceni/
$ sumy edmundson --language=czech --length=3% --url=https://cs.wikipedia.org/wiki/Bitva_u_Lipan
$ sumy --help # for more info
يمكن تنفيذ طرق تقييم مختلفة لبعض طرق التلخيص من خلال الأوامر التالية:
$ sumy_eval lex-rank reference_summary.txt --url=https://en.wikipedia.org/wiki/Automatic_summarization
$ sumy_eval lsa reference_summary.txt --language=czech --url=https://www.zdrojak.cz/clanky/automaticke-zabezpeceni/
$ sumy_eval edmundson reference_summary.txt --language=czech --url=https://cs.wikipedia.org/wiki/Bitva_u_Lipan
$ sumy_eval --help # for more info
إذا كنت لا تريد أن تهتم بالتثبيت، فيمكنك تجربته كحاوية.
$ docker run --rm misobelica/sumy lex-rank --length=10 --url=https://en.wikipedia.org/wiki/Automatic_summarization
أو يمكنك استخدام sumy كمكتبة في مشروعك. قم بإنشاء ملف sumy_example.py
(لا تسميه sumy.py
) باستخدام الكود أدناه لاختباره.
# -*- coding: utf-8 -*-
from __future__ import absolute_import
from __future__ import division , print_function , unicode_literals
from sumy . parsers . html import HtmlParser
from sumy . parsers . plaintext import PlaintextParser
from sumy . nlp . tokenizers import Tokenizer
from sumy . summarizers . lsa import LsaSummarizer as Summarizer
from sumy . nlp . stemmers import Stemmer
from sumy . utils import get_stop_words
LANGUAGE = "english"
SENTENCES_COUNT = 10
if __name__ == "__main__" :
url = "https://en.wikipedia.org/wiki/Automatic_summarization"
parser = HtmlParser . from_url ( url , Tokenizer ( LANGUAGE ))
# or for plain text files
# parser = PlaintextParser.from_file("document.txt", Tokenizer(LANGUAGE))
# parser = PlaintextParser.from_string("Check this out.", Tokenizer(LANGUAGE))
stemmer = Stemmer ( LANGUAGE )
summarizer = Summarizer ( stemmer )
summarizer . stop_words = get_stop_words ( LANGUAGE )
for sentence in summarizer ( parser . document , SENTENCES_COUNT ):
print ( sentence )
لقد وجدت بعض المشاريع المثيرة للاهتمام أثناء تصفح الإنترنت أو في بعض الأحيان أرسل لي بعض الأشخاص رسالة بريد إلكتروني تحتوي على أسئلة، وكان لدي فضول حول كيفية استخدامهم لـ sumy :)