SQLflow - это компилятор, который компилирует программу SQL для рабочего процесса, который работает на Kubernetes. Ввод - это программа SQL, которая написана в нашей расширенной грамматике SQL для поддержки заданий искусственного интеллекта, включая обучение, прогнозирование, оценку модели, модель объяснения, пользовательские задания и математическое программирование. Выход - это рабочий процесс Argo, который работает на распределенном кластере Kubernetes.
SQLFLOW поддерживает различные системы баз данных, такие как MySQL, MariaDB, TIDB, Hive, MaxCompute и многие наборы инструментов машинного обучения, такие как TensorFlow, Keras, XGBOOST.
Попробуйте SQLflow Теперь на нашей игровой площадке https://playground.sqlflow.tech/ и проверьте удобные учебники в ней.
Текущий опыт приложений на основе разработки ML требует команды инженеров данных, ученых данных, бизнес -аналитиков, а также распространения передовых языков и инструментов программирования, таких как Python, SQL, SAS, SASS, Julia, R. Фрагментация среды инструментов и развития приносит дополнительные трудности в инженерном обучении/настройке. Что если мы женим на наиболее широко используемом языке управления данными/обработкой SQL с возможностями ML/систем и позволите инженерам с навыками SQL разрабатывать расширенные приложения на основе ML?
В отрасли уже есть какая -то работа. Мы можем написать простые алгоритмы прогнозирования машинного обучения (или оценки) в SQL, используя такие операторы, как DOT_PRODUCT
. Тем не менее, для этого требуются параметры модели Copy-N-Pasty от учебной программы до операторов SQL. В коммерческом мире мы видим некоторые запатентованные двигатели SQL, предоставляющие расширения для поддержки возможностей машинного обучения.
CREATE MODEL
.Ни одно из существующих решений не решает нашу болезненную точку, вместо этого мы хотим, чтобы оно было полностью расширяемым.
Вот примеры для обучения модели TensorFlow DNNClassifier с использованием образца данных Iris.train и выполнения прогнозирования с использованием обученной модели. Вы можете увидеть, как круто написать какой -то элегантный код ML с помощью SQL:
sqlflow > SELECT *
FROM iris . train
TO TRAIN DNNClassifier
WITH model . n_classes = 3 , model . hidden_units = [ 10 , 20 ]
COLUMN sepal_length, sepal_width, petal_length, petal_width
LABEL class
INTO sqlflow_models . my_dnn_model ;
...
Training set accuracy: 0 . 96721
Done training
sqlflow > SELECT *
FROM iris . test
TO PREDICT iris . predict .class
USING sqlflow_models . my_dnn_model ;
...
Done predicting. Predict table : iris . predict
SQLFLOW будет любить поддерживать как можно больше основных структур ML и источников данных, но мы чувствуем, что расширение будет трудно сделать просто самостоятельно, поэтому мы хотели бы услышать ваши варианты о том, какие структуры ML и источники данных, которые вы в настоящее время используете и наращиваете. Пожалуйста, обратитесь к нашей дорожной карте для конкретных сроков, также сообщите нам о ваших текущих сценариях и интересах в рамках проекта SQLFLOW, чтобы мы могли расставить приоритеты на основе отзывов сообщества.
Ваш отзыв - наша мотивация двигаться дальше. Пожалуйста, сообщите нам о ваших вопросах, проблемах и проблемах, подав вопросы GitHub.
Apache License 2.0