nanosearch
1.0.0
Nanosearch هو محرك بحث داخل الذاكرة مصمم لمواقع الويب الصغيرة (<10000 عنوان URL).
باستخدام Nanosearch، يمكنك إنشاء محرك بحث باستخدام بضعة أسطر من التعليمات البرمجية.
يدعم Nanosearch خوارزميات BM25 وTF/IDF.
يقوم Nanosearch أيضًا بحساب الرسم البياني للارتباط ويستخدم عدد الروابط الداخلية للصفحة كعامل تصنيف. يعد هذا مفيدًا لترتيب نتائج الاستعلامات حيث توجد صفحات متعددة ذات صلة حسب الكلمة الرئيسية.
pip install nanosearch
from nanosearch import NanoSearchBM25
engine = NanoSearchBM25 (). from_sitemap (
"https://jamesg.blog/sitemap.xml" ,
title_transforms = [ lambda x : x . split ( "|" )[ 0 ]]
)
results = engine . search ( "coffee" )
print ( results )
from nanosearch import NanoSearchBM25
urls = [
"https://jamesg.blog/" ,
"https://jamesg.blog/coffee" ,
]
engine = NanoSearchBM25 (). from_urls ( urls )
results = engine . search ( "coffee" )
print ( results )
يمكنك حفظ فهرس على القرص وتحميله لاحقًا باستخدام:
engine . to_nanosearch_json ( "index.json" )
engine = NanoSearchBM25 (). from_nanosearch_json ( "index.json" )
يدعم Nanosearch خوارزميات البحث التالية:
هذا المشروع مرخص بموجب ترخيص MIT.