Mini Site Searcher هو مفهرس مواقع بسيط ومحرك بحث، والذي سيقوم تلقائيًا بالزحف إلى محتوى موقع الويب الخاص بك وتخزينه مؤقتًا وتوفير وظيفة البحث عبر REST API.
ويمكن استخدامه لتوفير وظيفة البحث لمدونات الموقع الثابتة، أو لبناء قاعدة معارف شخصية قابلة للبحث،...
أولاً، تحتاج إلى إنشاء ملف .env
، لوصف الطريقة التي تريد بها إعداد الزاحف.
على سبيل المثال، باستخدام التكوين التالي، نريد إعداد مفهرس لموقع ويب على https://my.blog
، وسيبدأ الزاحف في النظر إلى صفحة https://my.blog/index.html
، وسيجد كل الرابط الذي يحتوي على /posts
في عنوان URL الخاص به، وبالتالي، يجب أن يكون محدد CSS له هو a[href*=/posts]
. وعند اتباع كل رابط، سيحصل الزاحف على المحتوى النصي لأي علامة <article class="main-content">
.
BASE_URL="https://my.blog"
ENTRY_POINT="https://my.blog/index.html"
LINK_SEARCH_PATTERN="a[href*='/posts']"
MAIN_CONTENT_PATTERN="article.main-content"
ثم قم بتشغيل الخادم:
cargo run
بعد البدء، سيبدأ الزاحف وقد يستغرق الأمر بعض الوقت لإنهاء الفهرسة، وسيتم أيضًا تقديم REST API على المنفذ الافتراضي 3366
، أو أي شيء في متغير بيئة PORT
الخاص بك. للبحث، قم بإجراء طلب GET
مثل هذا:
GET /?keyword=<something>
يتكون البرنامج من عنصرين: