Téléchargement sqlflow - Téléchargement du code source sqlflow

sqlflow

Autre code source

1.0.0

Télécharger

Sqlflow

Qu'est-ce que Sqlflow

SQLFlow est un compilateur qui compile un programme SQL vers un workflow qui s'exécute sur Kubernetes. La contribution est un programme SQL qui a écrit dans notre grammaire SQL étendue pour soutenir les emplois d'IA, notamment la formation, la prédiction, l'évaluation du modèle, l'explication du modèle, les emplois personnalisés et la programmation mathématique. La sortie est un flux de travail ARGO qui s'exécute sur un cluster Kubernetes distribué.

SQLFlow prend en charge divers systèmes de bases de données comme MySQL, MARIADB, TIDB, Hive, MaxCompute et de nombreuses boîtes d'outils d'apprentissage automatique comme TensorFlow, Keras, XGBOost.

Essayez Sqlflow maintenant dans notre terrain de jeu https://playground.sqlflow.tech/ et consultez les tutoriels pratiques.

Motivation

L'expérience actuelle des applications basées sur la ML de développement nécessite une équipe d'ingénieurs de données, de scientifiques des données, d'analystes commerciaux ainsi qu'une prolifération de langages avancés et d'outils de programmation comme Python, SQL, SAS, SASS, Julia, R. La fragmentation de l'outillage et de l'environnement de développement apporte des difficultés supplémentaires en matière d'ingénierie pour modéliser la formation / le paramètre. Que se passe-t-il si nous épousons les SQL de gestion des données / traitements les plus utilisés avec les capacités ML / système et permettons aux ingénieurs de compétences SQL développer des applications avancées basées sur ML?

Il y a déjà des travaux en cours dans l'industrie. Nous pouvons écrire des algorithmes de prédiction (ou de notation) simples d'apprentissage automatique dans SQL à l'aide d'opérateurs comme DOT_PRODUCT . Cependant, cela nécessite des paramètres de modèle Copy-N-Pasting du programme de formation aux instructions SQL. Dans le monde commercial, nous voyons des moteurs SQL propriétaires offrant des extensions pour soutenir les capacités d'apprentissage automatique.

Microsoft SQL Server: Microsoft SQL Server a le service d'apprentissage automatique qui exécute des programmes d'apprentissage automatique dans R ou Python en tant que script externe.
Teradata SQL pour DL: Teradata fournit également un service RESTful, qui est appelable à partir de la syntaxe SQL Select étendue.
Google BigQuery: Google BigQuery permet l'apprentissage automatique dans SQL en introduisant l'instruction CREATE MODEL .

Aucune des solutions existantes ne résout notre point de douleur, nous voulons plutôt qu'il soit entièrement extensible.

Cette solution doit être compatible avec de nombreux moteurs SQL, au lieu d'une version ou d'un type spécifique.
Il devrait prendre en charge les modèles d'apprentissage automatique sophistiqués, y compris Tensorflow pour l'apprentissage en profondeur et XGBOost pour les arbres.
Nous voulons également que la flexibilité de configurer et d'exécuter des algorithmes ML de pointe, y compris la spécification des croisements de fonctionnalités, au moins, pas de code Python ou R intégré dans les instructions SQL, et entièrement intégrée à l'estimation de l'hyperparamètre.

Aperçu rapide

Voici des exemples de formation d'un modèle DNNCLassifier TensorFlow à l'aide de l'échantillon de données IRIS.Train et de la prédiction à l'aide du modèle formé. Vous pouvez voir à quel point il est cool d'écrire un code ML élégant à l'aide de SQL:

sqlflow > SELECT *
FROM iris . train
TO TRAIN DNNClassifier
WITH model . n_classes = 3 , model . hidden_units = [ 10 , 20 ]
COLUMN sepal_length, sepal_width, petal_length, petal_width
LABEL class
INTO sqlflow_models . my_dnn_model ;

...
Training set accuracy: 0 . 96721
Done training

sqlflow > SELECT *
FROM iris . test
TO PREDICT iris . predict .class
USING sqlflow_models . my_dnn_model ;

...
Done predicting. Predict table : iris . predict

Comment utiliser sqlflow

Démarrage rapide
Guide
Exemples interactifs
- Exemple de classification DNN sur l'ensemble de données IRIS
- Exemple de classification DNN sur la détection de fraude
- Prédiction des prix du logement avec xgboost
- Explication de prédiction des prix du logement
- Guide d'optimisation mathématique

Lignes directrices contributives

Construire et tester
Procédure pas à pas le projet

Feuille de route

SQLFlow adorera prendre en charge autant de frameworks et de sources de données ML traditionnels que possible, mais nous pensons que l'expansion serait difficile à faire uniquement, nous aimerions donc entendre vos options sur les cadres ML et les sources de données que vous utilisez actuellement. Veuillez vous référer à notre feuille de route pour des délais spécifiques, faites-nous également savoir vos scénarios et intérêts actuels autour du projet SQLFlow afin que nous puissions prioriser en fonction des commentaires de la communauté.

Retour

Vos commentaires sont notre motivation à passer à autre chose. Veuillez nous faire part de vos questions, préoccupations et problèmes en déposant les problèmes de GitHub.

Licence

Licence Apache 2.0

Publié

Un papier arxiv sur https://arxiv.org/abs/2001.06846
Vidéos de démonstration
1. 19/01/2020: https://www.youtube.com/watch?v=qujqn7epbto
2. 10/04/2019: https://www.youtube.com/watch?v=zikwoq_davw
3. 04/01/2019: https://www.youtube.com/watch?v=zikwoq_davw

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2025-02-27
taille 20.66MB
Provenant de Github

Applications connexes

waymo open dataset

2024-11-18
Sunamu

2024-12-14
MySchedule.py

2024-12-15
SmartTube

2024-12-14
chat.petals.dev

2024-11-30
viptools for eslam

2024-12-15

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
waymo open dataset

Autre code source

December 2023 Update
Sunamu

Autre code source

Release 2.2.0
MySchedule.py

Autre code source

Updates to the fetching of week codes
waymo open dataset

Autre code source

December 2023 Update
termwind

Autres catégories

v2.3.0
wp functions

Autres catégories

1.0.0

Actualités connexes Tout