التحليل البصري وأدوات التشخيص لتسهيل اختيار نموذج التعلم الآلي.
Yellowbrick عبارة عن مجموعة من أدوات التشخيص المرئية تسمى "Visualizers" والتي تعمل على توسيع واجهة برمجة تطبيقات scikit-Learn للسماح بالتوجيه البشري لعملية اختيار النموذج. باختصار، يجمع Yellowbrick بين scikit-Learn وmatplotlib في أفضل تقاليد توثيق scikit-Learn، ولكن لإنتاج تصورات لسير عمل التعلم الآلي الخاص بك !
للحصول على الوثائق الكاملة حول Yellowbrick API، ومعرض أدوات العرض المرئي المتاحة، ودليل المساهم، والبرامج التعليمية والموارد التعليمية، والأسئلة الشائعة، والمزيد، يرجى زيارة الوثائق الخاصة بنا على www.scikit-yb.org.
Yellowbrick متوافق مع Python 3.4 أو الأحدث ويعتمد أيضًا على scikit-learn وmatplotlib. إن أبسط طريقة لتثبيت Yellowbrick وتبعياته هي من PyPI مع pip، وهو مثبت الحزمة المفضل لدى Python.
$ pip install yellowbrick
لاحظ أن Yellowbrick هو مشروع نشط وينشر بشكل روتيني إصدارات جديدة مع المزيد من أدوات التصوير والتحديثات. من أجل ترقية Yellowbrick إلى الإصدار الأحدث، استخدم النقطة كما يلي.
$ pip install -U yellowbrick
يمكنك أيضًا استخدام العلامة -U
لتحديث scikit-learn أو matplotlib أو أي أدوات مساعدة أخرى تابعة لجهات خارجية تعمل بشكل جيد مع Yellowbrick إلى أحدث إصداراتها.
إذا كنت تستخدم Anaconda (موصى به لمستخدمي Windows)، فيمكنك الاستفادة من الأداة المساعدة conda لتثبيت Yellowbrick:
conda install -c districtdatalabs yellowbrick
تم تصميم واجهة برمجة تطبيقات Yellowbrick خصيصًا لتعمل بشكل جيد مع scikit-learn. فيما يلي مثال لتسلسل سير العمل النموذجي باستخدام scikit-Learn وYellowbrick:
في هذا المثال، نرى كيف يقوم Rank2D بإجراء مقارنات زوجية لكل ميزة في مجموعة البيانات باستخدام مقياس أو خوارزمية محددة ثم إرجاعها مرتبة كمخطط مثلث أيسر سفلي.
from yellowbrick . features import Rank2D
visualizer = Rank2D (
features = features , algorithm = 'covariance'
)
visualizer . fit ( X , y ) # Fit the data to the visualizer
visualizer . transform ( X ) # Transform the data
visualizer . show () # Finalize and render the figure
في هذا المثال، نقوم بإنشاء مثيل لمصنف scikit-Learn ثم نستخدم فئة ROCAUC الخاصة بـ Yellowbrick لتصور المفاضلة بين حساسية المصنف وخصوصيته.
from sklearn . svm import LinearSVC
from yellowbrick . classifier import ROCAUC
model = LinearSVC ()
visualizer = ROCAUC ( model )
visualizer . fit ( X , y )
visualizer . score ( X , y )
visualizer . show ()
للحصول على معلومات إضافية حول بدء استخدام Yellowbrick، راجع دليل البدء السريع في الوثائق وراجع دفتر الأمثلة الخاص بنا.
Yellowbrick هو مشروع مفتوح المصدر يدعمه مجتمع سيقبل بامتنان وتواضع أي مساهمات قد تقدمها للمشروع. مهما كانت صغيرة أو كبيرة، فإن أي مساهمة تُحدث فرقًا كبيرًا؛ وإذا لم تساهم مطلقًا في مشروع مفتوح المصدر من قبل، نأمل أن تبدأ مع Yellowbrick!
إذا كنت مهتمًا بالمساهمة، فاطلع على دليل المساهمين الخاص بنا. بالإضافة إلى إنشاء أدوات تصور، هناك العديد من الطرق للمساهمة:
كما ترون، هناك الكثير من الطرق للمشاركة وسنكون سعداء جدًا بانضمامك إلينا! الشيء الوحيد الذي نطلبه منك هو الالتزام بمبادئ الانفتاح والاحترام ومراعاة الآخرين كما هو موضح في قواعد السلوك الخاصة بمؤسسة Python Software Foundation.
لمزيد من المعلومات، قم بمراجعة ملف CONTRIBUTING.md
في جذر المستودع أو الوثائق التفصيلية في Contributing to Yellowbrick
يوفر Yellowbrick وصولاً سهلاً إلى العديد من مجموعات البيانات المستخدمة للأمثلة الموجودة في الوثائق والاختبار. تتم استضافة مجموعات البيانات هذه في CDN الخاصة بنا ويجب تنزيلها للاستخدام. عادةً، عندما يستدعي المستخدم إحدى وظائف تحميل البيانات، على سبيل المثال load_bikeshare()
، يتم تنزيل البيانات تلقائيًا إذا لم تكن موجودة بالفعل على جهاز الكمبيوتر الخاص بالمستخدم. ومع ذلك، بالنسبة للتطوير والاختبار، أو إذا كنت تعلم أنك ستعمل دون الوصول إلى الإنترنت، فقد يكون من الأسهل تنزيل جميع البيانات مرة واحدة.
يمكن تشغيل البرنامج النصي لتنزيل البيانات كما يلي:
$ python -m yellowbrick.download
سيؤدي هذا إلى تنزيل البيانات إلى دليل المباريات داخل حزم موقع Yellowbrick. يمكنك تحديد موقع التنزيل إما كوسيطة للبرنامج النصي لبرنامج التنزيل (استخدم --help
لمزيد من التفاصيل) أو عن طريق تعيين متغير البيئة $YELLOWBRICK_DATA
. هذه هي الآلية المفضلة لأنها ستؤثر أيضًا على كيفية تحميل البيانات في Yellowbrick.
ملاحظة: قد يواجه المطورون الذين قاموا بتنزيل البيانات من إصدارات Yellowbrick الأقدم من الإصدار 1.0 بعض المشكلات في تنسيق البيانات الأقدم. في حالة حدوث ذلك، يمكنك مسح ذاكرة التخزين المؤقت للبيانات الخاصة بك على النحو التالي:
$ python -m yellowbrick.download --cleanup
سيؤدي هذا إلى إزالة مجموعات البيانات القديمة وتنزيل المجموعات الجديدة. يمكنك أيضًا استخدام علامة --no-download
لمسح ذاكرة التخزين المؤقت دون إعادة تنزيل البيانات. يمكن أيضًا للمستخدمين الذين يواجهون صعوبة في التعامل مع مجموعات البيانات استخدام هذا أو يمكنهم إلغاء تثبيت Yellowbrick وإعادة تثبيته باستخدام pip
.
سنكون سعداء إذا استخدمت Yellowbrick في منشوراتك العلمية! إذا قمت بذلك، يرجى الاستشهاد بنا باستخدام إرشادات الاقتباس.