datasketch
v1.6.5
يمنحك datasketch هياكل بيانات احتمالية يمكنها معالجة كمية كبيرة جدًا من البيانات والبحث فيها بسرعة فائقة، مع فقدان القليل من الدقة.
تحتوي هذه الحزمة على رسومات البيانات التالية:
رسم البيانات | الاستخدام |
---|---|
مينهاش | تقدير تشابه Jaccard والأصلية |
مينهاش المرجح | تقدير التشابه جاكارد المرجح |
HyperLogLog | تقدير العلاقة الأساسية |
هايبرلوجلوج++ | تقدير العلاقة الأساسية |
يتم توفير الفهارس التالية لرسومات البيانات لدعم وقت الاستعلام الخطي الفرعي:
فِهرِس | لرسم البيانات | نوع الاستعلام المدعوم |
---|---|---|
مينهاش إل إس إتش | مينهاش، مينهاش المرجح | عتبة جاكارد |
غابة مينهاش إل إس إتش | مينهاش، مينهاش المرجح | جاكارد توب-ك |
فرقة مينهاش LSH | مينهاش | عتبة الاحتواء |
HNSW | أي | متري مخصص Top-K |
يجب استخدام datasketch مع Python 3.7 أو أعلى، وNumPy 1.11 أو أعلى، وScipy.
لاحظ أن MinHash LSH وMinHash LSH Ensemble يدعمان أيضًا طبقة تخزين Redis وCassandra (انظر MinHash LSH على نطاق واسع).
لتثبيت datasketch باستخدام pip
:
نقطة تثبيت datasketch
سيؤدي هذا أيضًا إلى تثبيت NumPy باعتباره تبعية.
للتثبيت باستخدام تبعية Redis:
رسم بيانات تثبيت النقطة[redis]
للتثبيت باستخدام تبعية Cassandra:
نقطة تثبيت البيانات[كاساندرا]