SQLFLOW هو برنامج التحويل البرمجي الذي يجمع برنامج SQL إلى سير عمل يعمل على Kubernetes. المدخلات هو برنامج SQL الذي كتب في قواعد SQL الممتدة لدينا لدعم وظائف الذكاء الاصطناعي بما في ذلك التدريب والتنبؤ وتقييم النموذج وشرح النموذج والوظائف المخصصة والبرمجة الرياضية. الناتج هو سير عمل ARGO الذي يعمل على مجموعة Kubernetes الموزعة.
يدعم SQLFLOW أنظمة قواعد البيانات المختلفة مثل MySQL و Mariadb و Tidb و Hive و MaxCompute والعديد من مجموعات أدوات التعلم الآلي مثل TensorFlow و Keras و XgBoost.
جرب sqlflow الآن في ملعبنا https://playground.sqlflow.tech/ وتحقق من البرامج التعليمية المفيدة فيه.
تتطلب التجربة الحالية للتطبيقات المستندة إلى ML فريقًا من مهندسي البيانات وعلماء البيانات ومحللي الأعمال بالإضافة إلى انتشار اللغات المتقدمة وأدوات البرمجة مثل Python و SQL و SAS و SASS و Julia و R. تجزئة الأدوات والبيئة التنمية تجلب صعوبات إضافية في الهندسة على النماذج النموذجية. ماذا لو تزوجنا من أكثر لغة إدارة البيانات/معالجة البيانات الأكثر استخدامًا مع إمكانيات ML/System ودعوا المهندسين الذين يتمتعون بمهارات SQL تطوير تطبيقات متقدمة تستند إلى ML؟
هناك بالفعل بعض العمل قيد التقدم في الصناعة. يمكننا كتابة خوارزميات التنبؤ بالتعلم الآلي البسيط (أو التسجيل) في SQL باستخدام مشغلي مثل DOT_PRODUCT
. ومع ذلك ، فإن هذا يتطلب معلمات نموذج COPY-N-Pasting من البرنامج التدريبي إلى عبارات SQL. في العالم التجاري ، نرى بعض محركات SQL الخاصة التي توفر ملحقات لدعم قدرات التعلم الآلي.
CREATE MODEL
.لا يحل أي من الحل الحالي نقطة الألم الخاصة بنا ، وبدلاً من ذلك نريد أن يكون قابلاً للتوسعة تمامًا.
فيما يلي أمثلة لتدريب نموذج DNNClassifier Tensorflow باستخدام نموذج بيانات Data Iris.train ، وتشغيل التنبؤ باستخدام النموذج المدرب. يمكنك أن ترى كم هو رائع لكتابة بعض رمز ML الأنيق باستخدام SQL:
sqlflow > SELECT *
FROM iris . train
TO TRAIN DNNClassifier
WITH model . n_classes = 3 , model . hidden_units = [ 10 , 20 ]
COLUMN sepal_length, sepal_width, petal_length, petal_width
LABEL class
INTO sqlflow_models . my_dnn_model ;
...
Training set accuracy: 0 . 96721
Done training
sqlflow > SELECT *
FROM iris . test
TO PREDICT iris . predict .class
USING sqlflow_models . my_dnn_model ;
...
Done predicting. Predict table : iris . predict
سيحب SQLFLOW دعم أكبر عدد ممكن من أطر ML ML ومصادر البيانات ، لكننا نشعر بأن التوسع سيكون من الصعب القيام به فقط بمفردنا ، لذلك نود أن نسمع خياراتك بشأن أطر ML ومصادر البيانات التي تستخدمها حاليًا وبناءها. يرجى الرجوع إلى خريطة الطريق الخاصة بنا للحصول على جداول زمنية محددة ، وأيضًا إخبارنا بالسيناريوهات والاهتمامات الحالية حول مشروع SQLFlow حتى نتمكن من تحديد الأولويات بناءً على ردود الفعل من المجتمع.
ملاحظاتك هي دافعنا للمضي قدمًا. يرجى إعلامنا على أسئلتك ومخاوفك وقضاياك من خلال تقديم مشكلات github.
ترخيص Apache 2.0