Ce référentiel public est en lecture seule et n'est plus maintenu.
Data Hub INteractive Education (DINE) est un contenu éducatif pour SAP Data Hub. Nos exercices pratiques sont développés pour vous montrer comment utiliser les fonctionnalités de SAP Data Hub. SAP Data Hub vous permet de vous connecter à différentes sources de données telles que SAP HANA, SAP ERP, SAP BW, Oracle DB2, SQL Server et bien d'autres et peut traiter différents types de données ; structuré, semi-structuré et non structuré à l'aide de Kafka, d'un moteur de streaming, d'analyses de texte et d'images, etc. SAP Data Hub peut rassembler toutes vos données afin que vous puissiez les utiliser de manière transparente. Vous pouvez développer rapidement votre prototype sur SAP Data Hub et le résultat peut être facilement transformé en système de production puisque SAP Data Hub s'occupe de l'exécution, de l'orchestration, de la planification et de la surveillance. SAP Data Hub est développé sur Kubernetes et est donc déployable sur site ou dans le cloud. Il fonctionne sur un moteur d'exécution distribué et est conçu pour le monde du Big Data en prouvant sa compréhension des métadonnées dans un paysage Big Data.
Parcourez également la documentation officielle de SAP Data Hub
DINE permet d'apprendre facilement à créer des pipelines dans SAP Data Hub à l'aide de ses opérateurs. Il sert de référence pour les développeurs d'applications et présente les fonctionnalités de Data Hub dans un scénario commercial facile à comprendre. Ce contenu de démonstration est livré avec :
Exemples de données
Extraits de code
Tutoriels
Configuration de SAP Data Hub - Suivez le guide d'installation de SAP Data Hub et configurez votre environnement SAP Data Hub.
Vous pouvez également utiliser SAP Data Hub Developer Edition ou SAP Data Hub Trial Edition.
Nous apprendrons SAP Data Hub à travers les scénarios ci-dessous qui sont basés sur une entité factice appelée SAP Data Hub Market Place, une plate-forme de commerce électronique développée à des fins de démonstration et d'apprentissage, où des clients du monde entier effectuent des milliers d'achats chaque jour. .
Les scénarios sont détaillés ci-dessous :
Prédiction de retour client : ce scénario est utilisé pour identifier les produits qui peuvent fréquemment être retournés par le client en fonction de différents paramètres. Ce scénario est implémenté en Python et utilise la bibliothèque sklearn pour implémenter l'algorithme de classificateur d'arbre de décision. Ici, dans ce scénario, nous lisons les données de différentes sources de données et utilisons le cloud SAP Analytics pour visualiser l'ensemble de données de résultats. Suivez le tutoriel pour mettre en œuvre ce scénario.
Plus de scénarios peuvent être trouvés dans la branche teched-2018.
Notre ensemble de données pour les scénarios ci-dessus comprend 6 fichiers contenant des informations sur les clients , les produits et les ventes .
La table CUSTOMER contient les détails des clients, cette table a ADDRESSID qui est mappée à la table ADDRESS où les détails de l'adresse des clients sont stockés.
Lorsqu'un client achète un produit, une commande client est générée ( SO_HEADER ) et chaque commande client comporte plusieurs articles de commande ( SO_ITEM ).
SO_HEADER a PARTNERID , une clé étrangère qui renvoie à la table CUSTOMER .
SO_ITEM a SALESORDERID, une clé étrangère qui renvoie à SO_HEADER .
Chaque SO_ITEM aura PRODUCTID qui est mappé à la table PRODUCT où les détails des produits sont stockés.
Les avis des clients sur les produits sont stockés dans la table REVIEW .
Les informations sur les retours effectués par les clients sont stockées dans la table RETURN .
Nous avons donc en gros 7 tables.
Il s'agit d'un ensemble de données synthétiques dérivé de SHINE et enrichi pour répondre à nos cas d'utilisation.
Pour accéder aux ensembles de données, explorez le dossier de données dans ce référentiel.
Aucun
Veuillez utiliser les problèmes GitHub pour signaler tout bug.
Copyright (c) 2017-2020 SAP SE ou une société affiliée SAP. Tous droits réservés. Ce projet est sous licence Apache Software License, version 2.0, sauf indication contraire dans le fichier LICENSE.