River هي مكتبة Python للتعلم الآلي عبر الإنترنت. يهدف إلى أن تكون المكتبة الأكثر سهولة في الاستخدام للقيام بالتعلم الآلي على بيانات الدفق. النهر هو نتيجة اندماج بين كريم و Scikit-Multiflow.
كمثال سريع ، سنقوم بتدريب الانحدار اللوجستي لتصنيف مجموعة بيانات التصيد. إليك نظرة على الملاحظة الأولى في مجموعة البيانات.
>>> من pprint import pprint >>> من مجموعات بيانات استيراد River >>> Dataset = datasets.phishing () >>> for x ، y في مجموعة البيانات: ... pprint (x) ... طباعة (ص) ... break {'age_of_domain': 1 ، 'anchor_from_other_domain': 0.0 ، 'fmare_server_form_handler': 0.0 ، 'https': 0.0 ، 'ip_in_url': 1 ، 'is_popular': 0.5 ، 'long_url': 1.0 ، 'popup_window' : 0.0 ، 'request_from_other_domain': 0.0} صحيح
الآن دعنا ندير النموذج على مجموعة البيانات بطريقة تدفق. نحن نتداخل بالتتابع التنبؤات وتحديثات النماذج. وفي الوقت نفسه ، نقوم بتحديث مقياس الأداء لمعرفة مدى جودة أداء النموذج.
>>> من River Import Compose >>> من River Import Linear_Model >>> من مقاييس استيراد النهر >>> من المعالجة المسبقة لـ River Import >>> = compose.pipeline ( ... قبل المعالجة. standardscaler () ، ... linear_model.logisticregression () ...) >>> metric = metrics.Accuracy () >>> for x ، y في مجموعة البيانات: ... y_pred = model.predict_one (x) # قم بتنبؤ ... metric.update (y ، y_pred) : 89.28 ٪
بالطبع ، هذا مجرد مثال مفتعل. نرحب بكم للتحقق من قسم المقدمة في الوثائق للحصول على برنامج تعليمي أكثر شمولاً.
يهدف النهر إلى العمل مع بيثون 3.8 وما فوق . يمكن أن يتم التثبيت مع pip
:
بيب تثبيت نهر
هناك عجلات متاحة لـ Linux و MacOS و Windows. هذا يعني أنك على الأرجح لن تضطر إلى بناء النهر من المصدر.
يمكنك تثبيت أحدث إصدار تطوير من Github على النحو التالي:
PIP تثبيت git+https: //github.com/online-ml/river-الترقية PIP تثبيت GIT+SSH: //[email protected]/online-ml/river.git-الترقية # باستخدام SSH
تتطلب هذه الطريقة تثبيت Cython و Rust على جهازك.
يوفر River تطبيقات عبر الإنترنت لعائلة الخوارزميات التالية:
النماذج الخطية ، مع مجموعة واسعة من المُحسّنات
أشجار القرار والغابات العشوائية
(تقريبي) أقرب الجيران
اكتشاف الشذوذ
اكتشاف الانجراف
أنظمة التوصية
السلسلة الزمنية التنبؤ
قطاع الطرق
آلات العوامل
التعلم غير متوازن
التجميع
تعبئة/تعزيز/تكديس
التعلم النشط
يوفر River أيضًا المرافق الأخرى عبر الإنترنت:
استخراج الميزة والاختيار
الإحصاءات والمقاييس عبر الإنترنت
المعالجة المسبقة
مجموعات بيانات مدمجة
التحقق من صحة النموذج التدريجي
خطوط الأنابيب النموذجية
تحقق من واجهة برمجة التطبيقات للحصول على نظرة عامة شاملة
يجب أن تسأل نفسك إذا كنت بحاجة إلى تعلم آلي عبر الإنترنت. الجواب على الأرجح لا. معظم الوقت التعلم الدُفعات يفعل المهمة على ما يرام. قد يناسب النهج عبر الإنترنت الفاتورة إذا:
تريد نموذجًا يمكن أن يتعلم من بيانات جديدة دون الحاجة إلى إعادة النظر في البيانات السابقة.
تريد نموذجًا قويًا لمفهوم الانجراف.
تريد تطوير النموذج الخاص بك بطريقة أقرب إلى ما يحدث في سياق الإنتاج ، والذي يعتمد عادة على الأحداث.
بعض خصائص النهر هي:
إنه يركز على الوضوح وتجربة المستخدم ، أكثر من الأداء.
إنه سريع جدًا في معالجة عينة واحدة في وقت واحد. جربه ، سترى.
يلعب بشكل جيد مع بقية النظام الإيكولوجي في بيثون.
الوثائق
إصدارات الحزمة
رهيبة على التعلم الآلات
2022 عرض في غايا
التجميع عبر الإنترنت: الخوارزميات والتقييم والمقاييس والتطبيقات والمعايير من KDD'22.
لا تتردد في المساهمة بأي طريقة تريدها ، فنحن دائمًا منفتحون على الأفكار والمناهج الجديدة.
افتح مناقشة إذا كان لديك أي سؤال أو استفسار على الإطلاق. من المفيد أن تطرح سؤالك في الأماكن العامة بدلاً من إرسال بريد إلكتروني خاص لنا. كما أنه يتم تشجيعه على فتح مناقشة قبل المساهمة ، بحيث يتم تجنب العمل غير الضروري ، بحيث يتم تجنب العمل غير الضروري.
أشعر مرحبًا بكم لفتح مشكلة إذا كنت تعتقد أنك رصدت مشكلة أو مشكلة في الأداء.
خارطة الطريق الخاصة بنا العامة. لا تتردد في العمل على أي شيء يلفت انتباهك ، أو تقديم اقتراحات.
يرجى مراجعة إرشادات المساهمة إذا كنت ترغب في تقديم تعديلات إلى قاعدة التعليمات البرمجية.
إذا كان النهر مفيدًا لك ، وكنت ترغب في الاستشهاد به في منشور علمي ، فيرجى الرجوع إلى الورقة المنشورة في JMLR:
article {montiel2021river ، title = {River: Machine Learning for Treaming Data في Python} ، المؤلف = {Montiel ، Jacob and Halford ، Max and Mastelini ، Saulo Martiello and Bolmier ، Geoffrey and Sourty ، Raphael and Vaysse ، Robin and Zouitine ، Adil ، و Gomes و Heitor Murilo و Read و Jesse و Abdessalem و Talel وغيرها} ، السنة = {2021}}
River هو برنامج مجاني ومفتوح المصدر مرخص له بموجب ترخيص BSD 3 بنقص.