اختبار | |
طَرد | |
ميتا |
pandas عبارة عن حزمة Python توفر هياكل بيانات سريعة ومرنة ومعبرة مصممة لجعل العمل مع البيانات "العلائقية" أو "المسمى" أمرًا سهلاً وبديهيًا. ويهدف إلى أن يكون لبنة البناء الأساسية عالية المستوى لإجراء تحليل عملي وحقيقي لبيانات العالم في بايثون. بالإضافة إلى ذلك، فإن لديها هدفًا أوسع يتمثل في أن تصبح أداة تحليل/معالجة البيانات مفتوحة المصدر الأقوى والأكثر مرونة المتاحة بأي لغة . وهي بالفعل في طريقها نحو تحقيق هذا الهدف.
الميزات الرئيسية
أين يمكن الحصول عليه
التبعيات
التثبيت من المصادر
رخصة
التوثيق
خلفية
الحصول على المساعدة
المناقشة والتطوير
المساهمة في الباندا
فيما يلي بعض الأشياء التي يقوم بها الباندا بشكل جيد:
سهولة التعامل مع البيانات المفقودة (الممثلة بـ NaN
أو NA
أو NaT
) في بيانات النقطة العائمة وكذلك بيانات النقطة غير العائمة
قابلية تغيير الحجم: يمكن إدراج الأعمدة وحذفها من DataFrame والكائنات ذات الأبعاد الأعلى
محاذاة البيانات التلقائية والصريحة: يمكن محاذاة الكائنات بشكل صريح مع مجموعة من التصنيفات، أو يمكن للمستخدم ببساطة تجاهل التصنيفات والسماح لـ Series
و DataFrame
وما إلى ذلك بمحاذاة البيانات تلقائيًا في العمليات الحسابية
مجموعة قوية ومرنة حسب الوظيفة لإجراء عمليات تقسيم وتطبيق وجمع على مجموعات البيانات، لكل من تجميع البيانات وتحويلها
اجعل من السهل تحويل البيانات المتعرجة والمفهرسة بشكل مختلف في هياكل بيانات Python وNumPy الأخرى إلى كائنات DataFrame
التقطيع الذكي القائم على الملصقات والفهرسة الرائعة والإعدادات الفرعية لمجموعات البيانات الكبيرة
بديهية دمج والانضمام إلى مجموعات البيانات
إعادة تشكيل مرنة وتمحور مجموعات البيانات
وضع العلامات الهرمية للمحاور (من الممكن الحصول على تسميات متعددة لكل علامة)
أدوات إدخال وإخراج قوية لتحميل البيانات من الملفات المسطحة (CSV والمحددة)، وملفات Excel ، وقواعد البيانات ، وحفظ/تحميل البيانات من تنسيق HDF5 فائق السرعة
وظائف محددة للسلاسل الزمنية : إنشاء النطاق الزمني وتحويل التردد وإحصائيات النافذة المتحركة وتبديل التاريخ والتأخير
الكود المصدري مستضاف حاليًا على GitHub على: https://github.com/pandas-dev/pandas
تتوفر أدوات التثبيت الثنائية لأحدث إصدار تم إصداره في Python Package Index (PyPI) وعلى Conda.
# تثبيت condaconda -c conda-forge pandas
# أو تثبيت PyPIpip الباندا
يمكن العثور على قائمة التغييرات التي تم إجراؤها على الباندا بين كل إصدار هنا. للحصول على التفاصيل الكاملة، راجع سجلات الالتزام على https://github.com/pandas-dev/pandas.
NumPy - يضيف دعمًا للمصفوفات الكبيرة ومتعددة الأبعاد والمصفوفات والوظائف الرياضية عالية المستوى للعمل على هذه المصفوفات
python-dateutil - يوفر امتدادات قوية لوحدة التاريخ والوقت القياسية
pytz - يجلب قاعدة بيانات Olson tz إلى Python مما يسمح بحسابات المنطقة الزمنية الدقيقة والمتعددة المنصات
راجع تعليمات التثبيت الكاملة للتعرف على الحد الأدنى من الإصدارات المدعومة من التبعيات المطلوبة والموصى بها والاختيارية.
لتثبيت الباندا من المصدر، تحتاج إلى Cython بالإضافة إلى التبعيات العادية المذكورة أعلاه. يمكن تثبيت Cython من PyPI:
نقطة تثبيت سايثون
في دليل pandas
(نفس الدليل الذي وجدت فيه هذا الملف بعد استنساخ git repo)، قم بتنفيذ:
تثبيت النقطة .
أو للتثبيت في وضع التطوير:
بايثون -m تثبيت النقطة -ve . --no-build-isolation -Ceditable-verbose=true
راجع التعليمات الكاملة للتثبيت من المصدر.
بي إس دي 3
تتم استضافة الوثائق الرسمية على PyData.org.
بدأ العمل على pandas
في AQR (صندوق التحوط الكمي) في عام 2008 وكان قيد التطوير النشط منذ ذلك الحين.
بالنسبة لأسئلة الاستخدام، أفضل مكان للذهاب إليه هو StackOverflow. علاوة على ذلك، يمكن أيضًا إجراء الأسئلة والمناقشات العامة على القائمة البريدية لبيانات pydata.
تتم معظم مناقشات التطوير على GitHub في هذا الريبو، عبر أداة تعقب مشكلات GitHub.
علاوة على ذلك، يمكن أيضًا استخدام القائمة البريدية لـ pandas-dev للمناقشات المتخصصة أو مشكلات التصميم، وتتوفر قناة Slack للأسئلة المتعلقة بالتطوير السريع.
هناك أيضًا اجتماعات مجتمعية متكررة لمشرفي المشروع مفتوحة للمجتمع بالإضافة إلى اجتماعات شهرية للمساهمين الجدد للمساعدة في دعم المساهمين الجدد.
يمكن العثور على معلومات إضافية حول قنوات الاتصال على صفحة مجتمع المساهمين.
نرحب بجميع المساهمات وتقارير الأخطاء وإصلاحات الأخطاء وتحسينات التوثيق والتحسينات والأفكار.
يمكن العثور على نظرة عامة مفصلة حول كيفية المساهمة في دليل المساهمة .
إذا كنت تتطلع ببساطة إلى بدء العمل مع قاعدة بيانات الباندا، فانتقل إلى علامة التبويب "مشكلات" GitHub وابدأ في البحث عن المشكلات المثيرة للاهتمام. هناك عدد من المشكلات المدرجة ضمن المستندات والإصدار الأول الجيد حيث يمكنك البدء.
يمكنك أيضًا فرز المشكلات التي قد تتضمن إعادة إنتاج تقارير الأخطاء، أو طلب معلومات حيوية مثل أرقام الإصدارات أو تعليمات إعادة الإنتاج. إذا كنت ترغب في بدء فرز المشكلات، فإحدى الطرق السهلة للبدء هي الاشتراك في الباندا على CodeTriage.
أو ربما من خلال استخدام الباندا يكون لديك فكرة خاصة بك أو تبحث عن شيء ما في الوثائق وتفكر "يمكن تحسين هذا"... يمكنك فعل شيء حيال ذلك!
لا تتردد في طرح الأسئلة على القائمة البريدية أو على Slack.
باعتبارك مساهمين ومشرفين على هذا المشروع، يُتوقع منك الالتزام بقواعد سلوك الباندا. يمكن العثور على مزيد من المعلومات على: قواعد سلوك المساهم
اذهب إلى الأعلى