Bengali Plagiarism Checker pip
1.0.0
Apresentando uma biblioteca Python para detectar plágio em textos bengalis. Esta biblioteca compreende 200 livros bengalis com aproximadamente 4.100 páginas provenientes da Biblioteca Digital Nacional, processados usando o mecanismo Tesseract OCR. Com apenas duas linhas de código, você pode verificar semelhanças no conteúdo escrito em bengali. Se for encontrado um alto grau de semelhança, o título do livro, o nome do autor e outros detalhes serão exibidos. Você pode instalar a biblioteca usando o seguinte comando no terminal:
pip install BengaliPlagiarismChecker
import BengaliPlagiarismChecker as bpc #importing package
#input text
text="""
বসন্তাগমে কামিনী রায় বসন্ত কি সহসা এ নির্জন আবাসে পশিয়াছ চুপি চুপি? নবীন পল্পবে
সাজিয়াছে তরুরাজি। ঝেড়ে দিলে কবে পুরাতন জীর্ণপত্র শীতল বাতাসে বাতাবি ফুলের গন্ধ ধীরে ধীরে ভেসে আসে আমার গবাক্ষপথে ঘন কুহুরবে মুখরিত আম্রবন বসন্তই হবে উদ্যান উজ্জল শত শ্বেত পুস্প হাসে আজিও ধরনি মরে রেখেছে ধরিয়া তার স্বর্ণ কারাগারে বর্ণ গন্ধ গানে রসে স্পর্শে দিতে চাহে দেহে আর চিতে নব প্রাণ, কিন্তু হায় নিঃশেষে ভরিয়া কই দিতে পারে, মধু? দূরে কোন্খানে থাকে অদেহীরা, বধু, পারো বলে দিতে?
"""
#method to find out plagiarism
bpc.check(text)
'''
OUTPUT
[[194, #BookID
'State Council of Educational Research and Training (SCERT)', #Author or Publisher
'সাহিত্য মালঞ্চ', #Book name
14, # Page number
23.88]] #Similarity Score
'''