Este repositorio público es de solo lectura y ya no se mantiene.
Data Hub INteractive Education (DINE) es un contenido educativo para SAP Data Hub. Nuestros ejercicios prácticos están desarrollados para mostrarle cómo utilizar las funciones de SAP Data Hub. SAP Data Hub le permite conectarse a diferentes fuentes de datos como SAP HANA, SAP ERP, SAP BW, Oracle DB2, SQL Server y muchos más y puede procesar varios tipos de datos; estructurados, semiestructurados y no estructurados usando Kafka, motor de transmisión, análisis de texto e imágenes, etc. SAP Data Hub puede reunir todos sus datos para que pueda trabajar con ellos sin problemas. Puede desarrollar rápidamente su prototipo en SAP Data Hub y el resultado se puede convertir fácilmente en un sistema de nivel de producción, ya que SAP Data Hub se encarga de la ejecución, orquestación, programación y monitoreo. SAP Data Hub está desarrollado en Kubernetes y, por lo tanto, se puede implementar localmente o en la nube. Se ejecuta en un motor de ejecución distribuida y está diseñado para el mundo de Big Data al demostrar comprensión de los metadatos en un panorama de Big Data.
Consulte también la documentación oficial de SAP Data Hub.
DINE facilita el aprendizaje sobre cómo crear canalizaciones en SAP Data Hub utilizando sus operadores. Actúa como referencia para los desarrolladores de aplicaciones y muestra las características de Data Hub en un escenario empresarial fácil de entender. Este contenido de demostración viene completo con:
Datos de muestra
Fragmentos de código
Tutoriales
Configuración de SAP Data Hub: siga la Guía de instalación de SAP Data Hub y configure su entorno de SAP Data Hub.
También puede utilizar SAP Data Hub Developer Edition o SAP Data Hub Trial Edition
Aprenderemos SAP Data Hub a través de los siguientes escenarios que se basan en una entidad ficticia llamada SAP Data Hub Market Place, una plataforma de comercio electrónico desarrollada con fines de demostración y aprendizaje, donde clientes de todo el mundo realizan miles de compras todos los días. .
Los escenarios se detallan a continuación:
Predicción de devolución del cliente: este escenario se utiliza para identificar los productos que el cliente puede devolver con frecuencia en función de diferentes parámetros. Este escenario se implementa en Python y utiliza la biblioteca sklearn para implementar el algoritmo clasificador de árbol de decisión. Aquí, en este escenario, leemos datos de diferentes fuentes de datos y utilizamos la nube de SAP Analytics para visualizar el conjunto de datos de resultados. Siga el tutorial para implementar este escenario.
Se pueden encontrar más escenarios en la rama teched-2018.
Nuestro conjunto de datos para los escenarios anteriores se compone de 6 archivos, que contienen clientes , productos e información de ventas .
La tabla CLIENTE tiene detalles de los clientes, esta tabla tiene ADDRESSID que está asignada a la tabla DIRECCIÓN donde se almacenan los detalles de la dirección de los clientes.
Cuando un Cliente compra un Producto, se genera una Orden de venta ( SO_HEADER ) y cada orden de venta tiene varios artículos de pedido ( SO_ITEM ).
SO_HEADER tiene PARTNERID , una clave externa que vincula a la tabla CLIENTE .
SO_ITEM tiene SALESORDERID, una clave externa que vincula a SO_HEADER .
Cada SO_ITEM tendrá PRODUCTID que se asigna a la tabla PRODUCT donde se almacenan los detalles de los productos.
Las opiniones de los clientes sobre los productos se almacenan en la tabla REVISIÓN .
La información sobre las devoluciones realizadas por los clientes se almacena en la tabla RETURN .
Básicamente tenemos 7 mesas.
Es un conjunto de datos sintético derivado de SHINE y está enriquecido para adaptarse a nuestros casos de uso.
Para acceder a los conjuntos de datos, explore la carpeta de datos en este repositorio.
Ninguno
Utilice los problemas de GitHub para informar cualquier error.
Copyright (c) 2017-2020 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Este proyecto tiene la licencia de software Apache, versión 2.0, salvo que se indique lo contrario en el archivo de LICENCIA.