การใช้งาน Python ของฟังก์ชันการจัดอันดับ BM25
โปรแกรมมี 4 โมดูลหลัก: parser, ตัวประมวลผลคิวรี, ฟังก์ชันการจัดอันดับ และโครงสร้างข้อมูล โมดูลตัวแยกวิเคราะห์แยกวิเคราะห์ไฟล์แบบสอบถามและไฟล์คลังข้อมูลเพื่อสร้างรายการและพจนานุกรมตามลำดับ ตัวประมวลผลแบบสอบถามจะรับแต่ละแบบสอบถามในรายการแบบสอบถามและให้คะแนนเอกสารตามเงื่อนไข ฟังก์ชั่นการจัดอันดับคือการนำฟังก์ชั่นการจัดอันดับ BM25 ไปใช้ ใช้ลอการิทึมธรรมชาติในการคำนวณ สุดท้ายนี้ โมดูลโครงสร้างข้อมูลประกอบด้วยดัชนีกลับด้านและตารางความยาวของเอกสาร ดัชนีกลับหัวใช้พจนานุกรมเพื่อแมปแต่ละคำกับพจนานุกรม พจนานุกรมรองนี้จะจับคู่รหัสเอกสารแต่ละรายการกับความถี่ของคำในพจนานุกรมภายนอก ตารางความยาวเอกสารประกอบด้วยความยาวของเอกสารแต่ละฉบับ และยังมีฟังก์ชันคำนวณความยาวเอกสารโดยเฉลี่ยของคอลเลกชันอีกด้วย
หากต้องการเรียกใช้ เพียงเรียกใช้ $ python main.py
ในโฟลเดอร์ src