Mini Site Searcher เป็นตัวสร้างดัชนีเว็บไซต์และเครื่องมือค้นหาที่เรียบง่าย ซึ่งจะรวบรวมข้อมูลและแคชเนื้อหาในเว็บไซต์ของคุณโดยอัตโนมัติ และจัดให้มีฟังก์ชันการค้นหาผ่าน REST API
สามารถใช้เพื่อจัดเตรียมฟังก์ชันการค้นหาสำหรับบล็อกไซต์แบบคงที่ หรือเพื่อสร้างฐานความรู้ส่วนบุคคลที่สามารถค้นหาได้...
ขั้นแรก คุณต้องสร้างไฟล์ .env
เพื่ออธิบายวิธีการตั้งค่าโปรแกรมรวบรวมข้อมูล
ตัวอย่างเช่น ด้วยการกำหนดค่าต่อไปนี้ เราต้องการตั้งค่าตัวสร้างดัชนีสำหรับเว็บไซต์ที่ https://my.blog
โปรแกรมรวบรวมข้อมูลจะเริ่มดูที่หน้า https://my.blog/index.html
และค้นหาทั้งหมด ลิงก์ที่มี /posts
ใน URL ดังนั้นตัวเลือก CSS ควรเป็น a[href*=/posts]
และเมื่อติดตามแต่ละลิงก์ โปรแกรมรวบรวมข้อมูลจะได้รับเนื้อหาข้อความของแท็ก <article class="main-content">
BASE_URL="https://my.blog"
ENTRY_POINT="https://my.blog/index.html"
LINK_SEARCH_PATTERN="a[href*='/posts']"
MAIN_CONTENT_PATTERN="article.main-content"
จากนั้นรันเซิร์ฟเวอร์:
cargo run
หลังจากเริ่มต้น โปรแกรมรวบรวมข้อมูลจะเริ่มทำงานและอาจใช้เวลาสักครู่ในการจัดทำดัชนีให้เสร็จสิ้น REST API จะถูกให้บริการที่พอร์ตเริ่มต้น 3366
หรืออะไรก็ตามในตัวแปรสภาพแวดล้อม PORT
ของคุณ หากต้องการค้นหา ให้ส่งคำขอ GET
ดังนี้:
GET /?keyword=<something>
โปรแกรมมีสององค์ประกอบ: