يعد هذا المستودع جزءًا من مشروع مخزن البيانات الاصطناعية، وهو مشروع من DataCebo.
Copulas هي مكتبة بايثون لنمذجة التوزيعات متعددة المتغيرات وأخذ العينات منها باستخدام وظائف copula. في ضوء جدول البيانات الرقمية، استخدم Copulas لمعرفة التوزيع وإنشاء بيانات تركيبية جديدة تتبع نفس الخصائص الإحصائية.
الميزات الرئيسية:
نموذج البيانات متعددة المتغيرات. اختر من بين مجموعة متنوعة من التوزيعات والكوبولا أحادية المتغير - بما في ذلك كوبولا أرخميدس، وكوبولا غاوسي، وكوبولا فاين.
قارن بين البيانات الحقيقية والاصطناعية بشكل مرئي بعد إنشاء النموذج الخاص بك. تتوفر المرئيات في صورة رسوم بيانية أحادية الأبعاد، ومخططات مبعثرة ثنائية الأبعاد، ومخططات مبعثرة ثلاثية الأبعاد.
الوصول إلى المعلمات المستفادة ومعالجتها. مع إمكانية الوصول الكامل إلى الأجزاء الداخلية للنموذج، يمكنك ضبط المعلمات أو ضبطها حسب اختيارك.
قم بتثبيت مكتبة Copulas باستخدام النقطة أو conda.
pip install copulas
conda install -c conda-forge copulas
ابدأ باستخدام مجموعة بيانات تجريبية. تحتوي مجموعة البيانات هذه على 3 أعمدة رقمية.
from copulas . datasets import sample_trivariate_xyz
real_data = sample_trivariate_xyz ()
real_data . head ()
قم بنمذجة البيانات باستخدام الكوبولا واستخدمها لإنشاء بيانات تركيبية. توفر مكتبة Copulas العديد من الخيارات بما في ذلك Gaussian Copula وVine Copulas وArchimedian Copulas.
from copulas . multivariate import GaussianMultivariate
copula = GaussianMultivariate ()
copula . fit ( real_data )
synthetic_data = copula . sample ( len ( real_data ))
تصور البيانات الحقيقية والاصطناعية جنبا إلى جنب. لنقم بذلك بشكل ثلاثي الأبعاد، لذا شاهد مجموعة البيانات الكاملة لدينا.
from copulas . visualization import compare_3d
compare_3d ( real_data , synthetic_data )
انقر أدناه لتشغيل الكود بنفسك على Colab Notebook واكتشاف الميزات الجديدة.
تعرف على المزيد حول مكتبة Copulas من موقع التوثيق الخاص بنا.
أسئلة أو قضايا؟ انضم إلى قناة Slack الخاصة بنا لمناقشة المزيد حول Copulas والبيانات الاصطناعية. إذا وجدت خطأ ما أو كان لديك طلب ميزة، فيمكنك أيضًا فتح مشكلة على GitHub الخاص بنا.
هل أنت مهتم بالمساهمة في Copulas؟ اقرأ دليل المساهمة الخاص بنا للبدء.
بدأ مشروع Copulas مفتوح المصدر لأول مرة في Data to AI Lab في معهد ماساتشوستس للتكنولوجيا في عام 2018. شكرًا لفريق المساهمين لدينا الذين قاموا ببناء المكتبة وصيانتها على مر السنين!
عرض المساهمين
تم إنشاء مشروع مخزن البيانات الاصطناعية لأول مرة في مختبر البيانات إلى الذكاء الاصطناعي التابع لمعهد ماساتشوستس للتكنولوجيا في عام 2016. وبعد 4 سنوات من البحث والتعاون مع المؤسسة، أنشأنا DataCebo في عام 2020 بهدف تنمية المشروع. اليوم، تعد DataCebo المطور الفخور لـ SDV، وهو أكبر نظام بيئي لتوليد البيانات الاصطناعية وتقييمها. فهي موطن لمكتبات متعددة تدعم البيانات الاصطناعية، بما في ذلك:
ابدأ باستخدام حزمة SDV - وهو حل متكامل تمامًا ومتجرك الشامل للبيانات الاصطناعية. أو استخدم المكتبات المستقلة لتلبية احتياجات محددة.