Este repositório público é somente leitura e não é mais mantido.
Data Hub INteractive Education (DINE) é um conteúdo educacional para SAP Data Hub. Nossos exercícios práticos são desenvolvidos para mostrar como usar os recursos do SAP Data Hub. SAP Data Hub permite que você se conecte a diferentes fontes de dados, como SAP HANA, SAP ERP, SAP BW, Oracle DB2, SQL Server e muito mais, e pode processar vários tipos de dados; estruturado, semiestruturado e não estruturado usando Kafka, mecanismo de streaming, análise de texto e imagem, etc. SAP Data Hub pode reunir todos os seus dados para que você possa trabalhar com eles perfeitamente. Você pode desenvolver rapidamente seu protótipo no SAP Data Hub e o resultado pode ser facilmente transformado em um sistema de nível de produção, já que o SAP Data Hub cuida da execução, orquestração, agendamento e monitoramento. SAP Data Hub é desenvolvido em Kubernetes e, portanto, pode ser implementado no local ou na nuvem. Ele é executado em um mecanismo de execução distribuído e foi projetado para o mundo do Big Data, comprovando a compreensão dos metadados em um cenário de Big Data.
Consulte também a documentação oficial do SAP Data Hub
DINE facilita aprender como construir pipelines no SAP Data Hub usando seus operadores. Ele atua como referência para desenvolvedores de aplicativos e apresenta os recursos do Data Hub em um cenário de negócios fácil de entender. Este conteúdo de demonstração vem completo com:
Dados de amostra
Trechos de código
Tutoriais
Configuração do SAP Data Hub - Siga o Guia de instalação do SAP Data Hub e configure seu ambiente SAP Data Hub.
Você também pode usar o SAP Data Hub Developer Edition ou o SAP Data Hub Trial Edition
Aprenderemos o SAP Data Hub por meio dos cenários abaixo, baseados em uma entidade fictícia chamada SAP Data Hub Market Place, uma plataforma de comércio eletrônico desenvolvida para fins de demonstração e aprendizado, onde clientes em todo o mundo fazem milhares de compras todos os dias .
Os cenários são detalhados abaixo:
Previsão de devolução do cliente: este cenário é usado para identificar os produtos que podem ser devolvidos frequentemente pelo cliente com base em diferentes parâmetros. Este cenário é implementado em Python e usa a biblioteca sklearn para implementar o algoritmo classificador de árvore de decisão. Aqui neste cenário estamos lendo dados de diferentes fontes de dados e usando a nuvem SAP Analytics para visualizar o conjunto de dados resultante. Siga o tutorial para implementar este cenário.
Mais cenários podem ser encontrados na filial teched-2018.
Nosso conjunto de dados para os cenários acima é composto por 6 arquivos, que contêm clientes , produtos e informações de vendas .
A tabela CUSTOMER possui detalhes de clientes, esta tabela possui ADDRESSID que é mapeado para a tabela ADDRESS onde os detalhes do endereço dos clientes são armazenados.
Quando um Cliente compra um Produto, é gerado um Pedido de Venda ( SO_HEADER ) e cada pedido de venda possui vários itens de pedido ( SO_ITEM ).
SO_HEADER possui PARTNERID , uma chave estrangeira que se vincula à tabela CUSTOMER .
SO_ITEM possui SALESORDERID, uma chave estrangeira vinculada a SO_HEADER .
Cada SO_ITEM terá PRODUCTID que é mapeado para a tabela PRODUCT onde os detalhes dos produtos são armazenados.
As avaliações dos clientes sobre os produtos são armazenadas na tabela REVIEW .
As informações sobre devoluções feitas pelos clientes são armazenadas na tabela RETURN .
Então basicamente temos 7 mesas.
É um conjunto de dados sintético derivado do SHINE e enriquecido para se adequar aos nossos casos de uso
Para acessar os conjuntos de dados, explore a pasta de dados neste repositório.
Nenhum
Use os problemas do GitHub para que quaisquer bugs sejam relatados.
Copyright (c) 2017-2020 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Este projeto está licenciado sob a Licença de Software Apache, versão 2.0, exceto quando indicado de outra forma no arquivo LICENSE.