Bengali Plagiarism Checker pip
1.0.0
벵골어 텍스트의 표절을 탐지하기 위한 Python 라이브러리를 소개합니다. 이 라이브러리는 Tesseract OCR 엔진을 사용하여 처리된 국립 디지털 도서관에서 가져온 약 4,100페이지의 벵골어 서적 200권으로 구성되어 있습니다. 단 두 줄의 코드만으로 벵골어로 작성된 콘텐츠의 유사성을 확인할 수 있습니다. 높은 수준의 유사성이 발견되면 책 제목, 저자 이름 및 기타 세부정보가 표시됩니다. 터미널에서 다음 명령을 사용하여 라이브러리를 설치할 수 있습니다.
pip install BengaliPlagiarismChecker
import BengaliPlagiarismChecker as bpc #importing package
#input text
text="""
বসন্তাগমে কামিনী রায় বসন্ত কি সহসা এ নির্জন আবাসে পশিয়াছ চুপি চুপি? নবীন পল্পবে
সাজিয়াছে তরুরাজি। ঝেড়ে দিলে কবে পুরাতন জীর্ণপত্র শীতল বাতাসে বাতাবি ফুলের গন্ধ ধীরে ধীরে ভেসে আসে আমার গবাক্ষপথে ঘন কুহুরবে মুখরিত আম্রবন বসন্তই হবে উদ্যান উজ্জল শত শ্বেত পুস্প হাসে আজিও ধরনি মরে রেখেছে ধরিয়া তার স্বর্ণ কারাগারে বর্ণ গন্ধ গানে রসে স্পর্শে দিতে চাহে দেহে আর চিতে নব প্রাণ, কিন্তু হায় নিঃশেষে ভরিয়া কই দিতে পারে, মধু? দূরে কোন্খানে থাকে অদেহীরা, বধু, পারো বলে দিতে?
"""
#method to find out plagiarism
bpc.check(text)
'''
OUTPUT
[[194, #BookID
'State Council of Educational Research and Training (SCERT)', #Author or Publisher
'সাহিত্য মালঞ্চ', #Book name
14, # Page number
23.88]] #Similarity Score
'''