تنزيل vaex - تنزيل كود مصدر vaex

vaex

بايثون

Version linked to the paper

تنزيل

ما هو فايكس؟

Vaex هي مكتبة Python عالية الأداء لإطارات البيانات البطيئة خارج النواة (على غرار Pandas)، لتصور مجموعات البيانات الجدولية الكبيرة واستكشافها. يقوم بحساب الإحصائيات مثل المتوسط والمجموع والعدد والانحراف المعياري وما إلى ذلك، على شبكة ذات أبعاد N لأكثر من مليار ( 10^9 ) عينة/صف في الثانية . يتم التصور باستخدام الرسوم البيانية ومخططات الكثافة وعرض الحجم ثلاثي الأبعاد ، مما يسمح بالاستكشاف التفاعلي للبيانات الضخمة. يستخدم Vaex تعيين الذاكرة وسياسة نسخ الذاكرة الصفرية والحسابات البطيئة للحصول على أفضل أداء (دون إهدار الذاكرة).

التثبيت

مع النقطة:

 $ pip install vaex

أو كوندا:

 $ conda install -c conda-forge vaex

لمزيد من التفاصيل، راجع الوثائق

الميزات الرئيسية

الفتح الفوري لملفات البيانات الضخمة (رسم خرائط الذاكرة)

دعم HDF5 وApache Arrow.

open1a

open1b

اقرأ الوثائق حول كيفية تحويل بياناتك بكفاءة من ملفات CSV أو Pandas DataFrames أو مصادر أخرى.

يتم دعم البث البطيء من S3 مع تعيين الذاكرة.

الافتتاح 1 ج

نظام التعبير

لا تضيع الذاكرة أو الوقت في هندسة الميزات، فنحن نقوم (بتكاسل) بتحويل بياناتك عند الحاجة.

تعبير

إطار بيانات خارج النواة

لن تؤدي تصفية التعبيرات وتقييمها إلى إضاعة الذاكرة عن طريق عمل نسخ؛ يتم الاحتفاظ بالبيانات دون تغيير على القرص، وسيتم بثها فقط عند الحاجة إليها. قم بتأخير الوقت قبل أن تحتاج إلى مجموعة.

الرسوم المتحركة

التجميع/التجمعات السريعة

تنفذ Vaex عمليات groupby متوازية وعالية الأداء، خاصة عند استخدام الفئات (> 1 مليار/ثانية).

com.groupby

انضمام سريع وفعال

لا يقوم Vaex بنسخ/تجسيد الجدول "الصحيح" عند الانضمام، مما يوفر غيغابايت من الذاكرة. مع انضمام أقل من ثانية إلى مليار صف، يكون الأمر سريعًا جدًا!

ينضم

المساهمة

انظر صفحة المساهمة.

الركود

انضم إلى المناقشة في قناة Slack الخاصة بنا!

اعرف المزيد عن فايكس

مقالات
- ما وراء الباندا: Spark وDask وVaex وغيرها من تقنيات البيانات الضخمة التي تتنافس وجهاً لوجه (بما في ذلك المعايير)
- 7 أسباب تجعلني أحب Vaex لعلم البيانات (نصائح وحيل)
- تعلم الآلة المستحيل: قم بتدريب مليار عينة في 5 دقائق على الكمبيوتر المحمول الخاص بك باستخدام Vaex وScikit-Learn
- كيفية تحليل 100 جيجابايت من البيانات على جهاز الكمبيوتر المحمول الخاص بك باستخدام لغة بايثون
- التحليق عاليًا باستخدام Vaex: تحليل أكثر من 30 عامًا من بيانات الطيران في Python
- Vaex: إطار بيانات مزود بسلاسل فائقة - يعمل على تسريع معالجة النص لديك بما يصل إلى 1000x
- Vaex: خارج إطارات البيانات الأساسية لـ Python والتصور السريع - مليار مجموعة بيانات صفية على الكمبيوتر المحمول الخاص بك
اتبع الدروس لدينا
شاهد أحدث محادثاتنا:
- باي داتا لندن 2019
- سيبي 2019
اتصل بنا للحصول على حلول علوم البيانات أو التدريب أو دعم المؤسسات على https://vaex.io/

يوسع

معلومات إضافية