Bengali Plagiarism Checker pip
1.0.0
Представляем библиотеку Python для обнаружения плагиата в бенгальских текстах. Эта библиотека включает 200 бенгальских книг общим объемом около 4100 страниц, взятых из Национальной цифровой библиотеки и обработанных с помощью механизма оптического распознавания символов Tesseract. Всего двумя строками кода вы можете проверить сходство письменного контента на бенгальском языке. Если обнаружена высокая степень сходства, будет отображено название книги, имя автора и другие сведения. Установить библиотеку можно с помощью следующей команды в терминале:
pip install BengaliPlagiarismChecker
import BengaliPlagiarismChecker as bpc #importing package
#input text
text="""
বসন্তাগমে কামিনী রায় বসন্ত কি সহসা এ নির্জন আবাসে পশিয়াছ চুপি চুপি? নবীন পল্পবে
সাজিয়াছে তরুরাজি। ঝেড়ে দিলে কবে পুরাতন জীর্ণপত্র শীতল বাতাসে বাতাবি ফুলের গন্ধ ধীরে ধীরে ভেসে আসে আমার গবাক্ষপথে ঘন কুহুরবে মুখরিত আম্রবন বসন্তই হবে উদ্যান উজ্জল শত শ্বেত পুস্প হাসে আজিও ধরনি মরে রেখেছে ধরিয়া তার স্বর্ণ কারাগারে বর্ণ গন্ধ গানে রসে স্পর্শে দিতে চাহে দেহে আর চিতে নব প্রাণ, কিন্তু হায় নিঃশেষে ভরিয়া কই দিতে পারে, মধু? দূরে কোন্খানে থাকে অদেহীরা, বধু, পারো বলে দিতে?
"""
#method to find out plagiarism
bpc.check(text)
'''
OUTPUT
[[194, #BookID
'State Council of Educational Research and Training (SCERT)', #Author or Publisher
'সাহিত্য মালঞ্চ', #Book name
14, # Page number
23.88]] #Similarity Score
'''