Bengali Plagiarism Checker pip
1.0.0
Présentation d'une bibliothèque Python pour détecter le plagiat dans les textes bengali. Cette bibliothèque comprend 200 livres en bengali avec environ 4 100 pages provenant de la Bibliothèque numérique nationale, traitées à l'aide du moteur OCR Tesseract. Avec seulement deux lignes de code, vous pouvez vérifier les similitudes dans le contenu écrit en bengali. Si un degré élevé de similitude est trouvé, le titre du livre, le nom de l'auteur et d'autres détails s'afficheront. Vous pouvez installer la bibliothèque à l'aide de la commande suivante dans le terminal :
pip install BengaliPlagiarismChecker
import BengaliPlagiarismChecker as bpc #importing package
#input text
text="""
বসন্তাগমে কামিনী রায় বসন্ত কি সহসা এ নির্জন আবাসে পশিয়াছ চুপি চুপি? নবীন পল্পবে
সাজিয়াছে তরুরাজি। ঝেড়ে দিলে কবে পুরাতন জীর্ণপত্র শীতল বাতাসে বাতাবি ফুলের গন্ধ ধীরে ধীরে ভেসে আসে আমার গবাক্ষপথে ঘন কুহুরবে মুখরিত আম্রবন বসন্তই হবে উদ্যান উজ্জল শত শ্বেত পুস্প হাসে আজিও ধরনি মরে রেখেছে ধরিয়া তার স্বর্ণ কারাগারে বর্ণ গন্ধ গানে রসে স্পর্শে দিতে চাহে দেহে আর চিতে নব প্রাণ, কিন্তু হায় নিঃশেষে ভরিয়া কই দিতে পারে, মধু? দূরে কোন্খানে থাকে অদেহীরা, বধু, পারো বলে দিতে?
"""
#method to find out plagiarism
bpc.check(text)
'''
OUTPUT
[[194, #BookID
'State Council of Educational Research and Training (SCERT)', #Author or Publisher
'সাহিত্য মালঞ্চ', #Book name
14, # Page number
23.88]] #Similarity Score
'''