تنزيل bulksearch - تنزيل كود مصدر bulksearch

bulksearch

شفرة المصدر الأخرى

1.0.0

تنزيل

البحث بالجملة

مكتبة بحث عن النص الكامل خفيفة الوزن ومُحسَّنة للقراءة والكتابة.

عندما يتعلق الأمر بالسرعة الإجمالية ، يتفوق BulkSearch في الأداء على كل مكتبة بحث موجودة ويوفر أيضًا إمكانات بحث مرنة مثل مطابقة الكلمات المتعددة أو التحويلات الصوتية أو المطابقة الجزئية. يعتمد بشكل أساسي على كيفية قيام محرك الأقراص الثابتة بإدارة الملفات في نظام الملفات. تتم إضافة العناصر أو تحديثها أو إزالتها بنفس سرعة البحث عنها، ولكنها تستهلك أيضًا بعض الذاكرة الإضافية. عندما لا يحتاج الفهرس الخاص بك إلى التحديث بشكل متكرر، فقد يكون FlexSearch خيارًا أفضل. يوفر لك BulkSearch أيضًا نموذج معالجة غير متزامن لإجراء الاستعلامات في الخلفية.

المعيار:

المقارنة: https://jsperf.com/compare-search-libraries
بالتفصيل: https://jsperf.com/bulksearch

المنصات المدعومة:

المتصفح
Node.js

تعريفات الوحدة المدعومة:

AMD (RequireJS)
CommonJS (Node.js)
الإغلاق (Xone)
عالمي (المتصفح)

جميع الميزات:

كلمات جزئية
كلمات متعددة
ترتيب الكلمات المرن
البحث الصوتي
الحد من النتائج
ترقيم الصفحات
التخزين المؤقت
الوضع غير المتزامن
المطابقات المخصصة
برامج التشفير المخصصة

تثبيت

HTML / جافا سكريبت

 < html >
< head >
    < script src =" js/bulksearch.min.js " > </ script >
</ head >
...

ملاحظة: استخدم Bulksearch.min.js للإنتاج و bulksearch.js للتطوير.

استخدم الأحدث من CDN:

 < script src =" https://cdn.rawgit.com/nextapps-de/bulksearch/master/bulksearch.min.js " > </ script >

Node.js

 npm install bulksearch

في التعليمات البرمجية الخاصة بك تشمل ما يلي:

 var BulkSearch = require ( "bulksearch" ) ;

أو قم بتمرير الخيارات عند الحاجة:

 var index = require ( "bulksearch" ) . create ( { /* options */ } ) ;

أيه إم دي

 var BulkSearch = require ( "./bulksearch.js" ) ;

قارن بين البحث الشامل والبحث المرن

وصف	البحث بالجملة	بحث فليكس
وصول	مؤشر القراءة والكتابة الأمثل	مؤشر ذاكرة القراءة الأمثل
ذاكرة	كبير (~ 90 بايت لكل كلمة)	صغير جدًا (~ 2 بايت لكل كلمة)
الاستخدام	محتوى محدود تحديثات الفهرس بشكل مستمر	أسرع بحث ممكن تحديثات نادرة على الفهرس قدرات الذاكرة منخفضة
الحد من النتائج	نعم	نعم
ترقيم الصفحات	نعم	لا

نظرة عامة على واجهة برمجة التطبيقات

الأساليب العالمية:

البحث بالجملة. إنشاء (<خيارات>)
البحث بالجملة. addMatcher ({ المفتاح: القيمة })
البحث بالجملة. التسجيل (الاسم، التشفير)
البحث بالجملة. ترميز (الاسم، السلسلة)

طرق الفهرس:

فِهرِس. إضافة (معرف، سلسلة)
فِهرِس. البحث (سلسلة، <limit>، <callback>)
فِهرِس. البحث (سلسلة، <صفحة>، <رد الاتصال>)
فِهرِس. بحث (خيارات، <رد الاتصال>)
فِهرِس. التحديث (المعرف، السلسلة)
فِهرِس. إزالة (المعرف)
فِهرِس. إعادة ضبط ()
فِهرِس. تدمير ()
فِهرِس. الحرف الأول (<خيارات>)
فِهرِس. تحسين ()
فِهرِس. معلومات ()
فِهرِس. addMatcher ({ المفتاح: القيمة })
فِهرِس. ترميز (سلسلة)

الاستخدام

إنشاء فهرس

البحث بالجملة. إنشاء (<خيارات>)

 var index = new BulkSearch ( ) ;

بدلا من ذلك يمكنك أيضا استخدام:

 var index = BulkSearch . create ( ) ;

إنشاء فهرس مع خيارات مخصصة

 var index = new BulkSearch ( {

    // default values:

    type : "integer" ,
    encode : "icase" ,
    boolean : "and" ,
    size : 4000 ,
    multi : false ,
    strict : false ,
    ordered : false ,
    paging : false ,
    async : false ,
    cache : false
} ) ;

اقرأ المزيد: البحث الصوتي، المقارنة الصوتية، تحسين استخدام الذاكرة

إضافة عناصر إلى الفهرس

فِهرِس. إضافة (معرف، سلسلة)

 index . add ( 10025 , "John Doe" ) ;

عناصر البحث

فِهرِس. بحث (سلسلة | خيارات، <limit|page>، <callback>)

 index . search ( "John" ) ;

الحد من النتيجة:

 index . search ( "John" , 10 ) ;

تنفيذ الاستعلامات بشكل غير متزامن:

 index . search ( "John" , function ( result ) {
    
    // array of results
} ) ;

تمرير المعلمة ككائن:

 index . search ( {

    query : "John" , 
    page : '1:1234' ,
    limit : 10 ,
    callback : function ( result ) {
        
        // async
    }
} ) ;

تحديث العنصر من فهرس

فِهرِس. التحديث (المعرف، السلسلة)

 index . update ( 10025 , "Road Runner" ) ;

إزالة العنصر من الفهرس

فِهرِس. إزالة (المعرف)

 index . remove ( 10025 ) ;

إعادة تعيين الفهرس

 index . reset ( ) ;

تدمير الفهرس

 index . destroy ( ) ;

إعادة تهيئة الفهرس

فِهرِس. الحرف الأول(<خيارات>)

ملاحظة: ستؤدي إعادة التهيئة أيضًا إلى تدمير الفهرس القديم!

التهيئة (بنفس الخيارات):

 index . init ( ) ;

التهيئة بخيارات جديدة:

 index . init ( {

    /* options */
} ) ;

أضف مُطابقًا مخصصًا

البحث بالجملة. addMatcher({ REGEX: استبدال })

إضافة المطابقات العامة لجميع المثيلات:

 BulkSearch . addMatcher ( {

    'ä' : 'a' , // replaces all 'ä' to 'a'
    'ó' : 'o' ,
    '[ûúù]' : 'u' // replaces multiple
} ) ;

إضافة مطابقات خاصة لمثيل محدد:

 index . addMatcher ( {

    'ä' : 'a' , // replaces all 'ä' to 'a'
    'ó' : 'o' ,
    '[ûúù]' : 'u' // replaces multiple
} ) ;

إضافة برنامج تشفير مخصص

تحديد برنامج تشفير مخصص خاص أثناء الإنشاء/التهيئة:

 var index = new BulkSearch ( {

    encode : function ( str ) {
    
        // do something with str ...
        
        return str ;
    }
} ) ;

قم بتسجيل برنامج تشفير عالمي لاستخدامه في جميع الحالات

البحث بالجملة. التسجيل (الاسم، التشفير)

 BulkSearch . register ( 'whitespace' , function ( str ) {

    return str . replace ( / / g , '' ) ;
} ) ;

استخدم برامج التشفير العالمية:

 var index = new BulkSearch ( { encode : 'whitespace' } ) ;

استدعاء التشفير مباشرة

التشفير الخاص:

 var encoded = index . encode ( "sample text" ) ;

التشفير العالمي:

 var encoded = BulkSearch . encode ( "whitespace" , "sample text" ) ;

خلط/توسيع برامج تشفير متعددة

 BulkSearch . register ( 'mixed' , function ( str ) {
  
    str = this . encode ( "icase" , str ) ;  // built-in
    str = this . encode ( "whitespace" , str ) ; // custom
    
    return str ;
} ) ;

 BulkSearch . register ( 'extended' , function ( str ) {
  
    str = this . encode ( "custom" , str ) ;
    
    // do something additional with str ...

    return str ;
} ) ;

احصل على معلومات

 index . info ( ) ;

إرجاع معلومات حول الفهرس، على سبيل المثال:

{
    "bytes" : 103600 ,
    "chunks" : 9 ,
    "fragmentation" : 0 ,
    "fragments" : 0 ,
    "id" : 0 ,
    "length" : 7798 ,
    "matchers" : 0 ,
    "size" : 10000 ,
    "status" : false
}

ملاحظة: عندما تكون قيمة التجزئة حوالي 50% أو أعلى، يجب أن تفكر في استخدام cleanup() .

تحسين / تنظيف الفهرس

سيؤدي تحسين الفهرس إلى تحرير كافة الذاكرة المجزأة وإعادة بناء الفهرس أيضًا عن طريق التسجيل.

 index . optimize ( ) ;

ترقيم الصفحات

ملاحظة: يمكن أن يؤدي ترقيم الصفحات ببساطة إلى تقليل وقت الاستعلام بعامل 100.

تمكين ترقيم الصفحات عند التهيئة:

 var index = BulkSearch . create ( { paging : true } ) ;

تنفيذ الاستعلام وتمرير الحد (العناصر لكل صفحة):

 index . search ( "John" , 10 ) ;

ستتضمن الاستجابة كائن ترقيم الصفحات مثل هذا:

{
    "current" : " 0:0 " ,
    "prev" : null ,
    "next" : " 1:16322 " ,
    "results" : []
}

توضيح:

"حاضِر"	يتضمن المؤشر إلى الصفحة الحالية.
"السابق"	يتضمن المؤشر إلى الصفحة السابقة. عندما تكون قيمة هذا الحقل فارغة، فلن يكون هناك المزيد من الصفحات السابقة المتاحة.
"التالي"	يتضمن المؤشر إلى الصفحة التالية. عندما تكون قيمة هذا الحقل فارغة، فلن يكون هناك أي صفحات متبقية.
"نتائج"	مجموعة من العناصر المتطابقة.

تنفيذ الاستعلام وتمرير مؤشر إلى صفحة معينة:

 index . search ( "John" , {
    
    page : "1:16322" , // pointer
    limit : 10
} ) ;

خيارات

خيار	قيم	وصف
يكتب	"بايت" "قصير" "عدد صحيح" "يطفو" "خيط"	يجب تحديد نوع بيانات المعرفات التي تم تمريرها عند الإنشاء. من المستحسن استخدام أقل نطاق ممكن من البيانات هنا، على سبيل المثال، استخدم "قصير" عندما لا تكون المعرفات أعلى من 65,535.
ترميز	خطأ شنيع "إيكيس" "بسيط" "متقدم" "إضافي" الوظيفة (السلسلة): السلسلة	نوع الترميز. اختر أحد العناصر المضمنة أو قم بتمرير وظيفة ترميز مخصصة.
منطقية	"و" "أو"	النموذج المنطقي المطبق عند مقارنة كلمات متعددة. ملحوظة: عند استخدام "أو" تتم مقارنة الكلمة الأولى أيضًا بـ "و". مثال: استعلام مكون من 3 كلمات، وكانت النتائج إما: الكلمة المطابقة 1 و2 والكلمة المطابقة 1 و3.
مقاس	2500 - 10000	حجم القطع. يعتمد ذلك على طول المحتوى، أي قيمة تناسبك بشكل أفضل. يكون طول المحتوى القصير (مثل أسماء المستخدمين) أسرع عندما يصل حجم القطعة إلى 2500. يتم تشغيل النص الأكبر حجمًا بشكل أسرع بحجم قطعة يصل إلى 10000. ملاحظة: يوصى باستخدام الحد الأدنى لحجم القطعة والحد الأقصى لطول المحتوى الذي يجب فهرسته لمنع التجزئة.
متعدد	حقيقي خطأ شنيع	تمكين معالجة النصوص المتعددة.
أمر	حقيقي خطأ شنيع	يجب أن تكون الكلمات المتعددة بنفس ترتيب الإدخال المطابق.
حازم	حقيقي خطأ شنيع	يجب أن تبدأ المطابقات بالضبط مع الاستعلام.
مخبأ	حقيقي خطأ شنيع	تمكين التخزين المؤقت.

الترميز الصوتي

التشفير	وصف	إيجابيات كاذبة	مستوى الضغط
خطأ شنيع	قم بإيقاف تشغيل الترميز	لا	لا
"إيكيس"	ترميز حساس لحالة الأحرف	لا	لا
"بسيط"	التطبيع الصوتي	لا	~ 3%
"متقدم"	التطبيع الصوتي + التحولات الحرفية	لا	~ 25%
"إضافي"	التطبيع الصوتي + تحويلات Soundex	نعم	~ 50%

قارن البحث الصوتي

السلسلة المرجعية: "بيورن فيليب ماير"

استفسار	بحث مرن	البحث المجمع (iCase)	البحث المجمع (بسيط)	البحث المجمع (متقدم)	البحث المجمع (إضافي)
بيورن	نعم	نعم	نعم	نعم	نعم
بجور	لا	نعم	نعم	نعم	نعم
بيورن	لا	لا	نعم	نعم	نعم
بيورن	لا	لا	لا	نعم	نعم
فيليب	لا	لا	لا	نعم	نعم
فيليب	لا	لا	لا	نعم	نعم
björnphillip	لا	لا	نعم	نعم	نعم
ماير	لا	لا	لا	نعم	نعم
بيورن ماير	لا	لا	لا	نعم	نعم
ماير فيليب	لا	لا	لا	نعم	نعم
بيورن ماير	لا	لا	لا	لا	نعم
(إيجابيات كاذبة)	نعم	لا	لا	لا	نعم

استخدام الذاكرة

ملاحظة: يجب تحديد نوع بيانات المعرفات التي تم تمريرها عند الإنشاء. من المستحسن استخدام أقل نطاق ممكن من البيانات هنا، على سبيل المثال، استخدم "قصير" عندما لا تكون المعرفات أعلى من 65,535.

نوع الهوية	مجموعة من القيم	استخدام الذاكرة لكل ~ 100000 كلمة مفهرسة
بايت	0 - 255	4.5 ميجا بايت
قصير	0 - 65,535	5.3 ميجا بايت
عدد صحيح	0 - 4,294,967,295	6.8 ميجا بايت
يطفو	0 - * (16 رقمًا)	10 ميغابايت
خيط	* (غير محدود)	28.2 ميجابايت

البحث الشامل للمؤلف: توماس ويكرلينج
الترخيص: ترخيص أباتشي 2.0

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2024-12-25
الحجم 245.46KB
من Github

تطبيقات ذات صلة

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
MySchedule.py

2024-12-15
viptools for eslam

2024-12-15
VITAident

2024-12-15

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
SmartTube

شفرة المصدر الأخرى

24.71 Stable
Sunamu

شفرة المصدر الأخرى

Release 2.2.0
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
wp functions

فئات أخرى

1.0.0
termwind

فئات أخرى

v2.3.0

أخبار ذات صلة الكل