Этот общедоступный репозиторий доступен только для чтения и больше не поддерживается.
Data Hub INteractive Education(DINE) — это образовательный контент для SAP Data Hub. Наши практические упражнения разработаны, чтобы показать вам, как использовать функции SAP Data Hub. SAP Data Hub позволяет подключаться к различным источникам данных, таким как SAP HANA, SAP ERP, SAP BW, Oracle DB2, SQL Server и многим другим, и может обрабатывать различные типы данных; структурированные, полуструктурированные и неструктурированные с использованием Kafka, механизма потоковой передачи, анализа текста и изображений и т. д. SAP Data Hub может объединить все ваши данные, чтобы вы могли легко с ними работать. Вы можете быстро разработать свой прототип в SAP Data Hub, а результат можно легко перенести в систему производственного уровня, поскольку SAP Data Hub берет на себя выполнение, оркестрацию, планирование и мониторинг. SAP Data Hub разработан на базе Kubernetes и поэтому может быть развернут как локально, так и в облаке. Он работает на механизме распределенного выполнения и предназначен для мира больших данных, обеспечивая понимание метаданных в среде больших данных.
Также просмотрите официальную документацию SAP Data Hub.
DINE позволяет легко научиться строить конвейеры в SAP Data Hub с помощью своих операторов. Он служит справочником для разработчиков приложений и демонстрирует возможности Data Hub в простом для понимания бизнес-сценарии. Этот демонстрационный контент поставляется в комплекте с:
Пример данных
Фрагменты кода
Учебники
Настройка SAP Data Hub. Следуйте руководству по установке SAP Data Hub и настройте среду SAP Data Hub.
Вы также можете использовать SAP Data Hub Developer Edition или SAP Data Hub Trial Edition.
Мы изучим SAP Data Hub с помощью приведенных ниже сценариев, основанных на фиктивной сущности под названием SAP Data Hub Market Place, платформе электронной коммерции, разработанной для целей демонстрации и обучения, где клиенты по всему миру ежедневно совершают тысячи покупок. .
Сценарии подробно описаны ниже:
Прогнозирование возврата клиента: этот сценарий используется для определения продуктов, которые клиент может часто возвращать, на основе различных параметров. Этот сценарий реализован на Python и использует библиотеку sklearn для реализации алгоритма классификатора дерева решений. В этом сценарии мы читаем данные из разных источников данных и используем облако SAP Analytics для визуализации набора данных результатов. Следуйте инструкциям, чтобы реализовать этот сценарий.
Больше сценариев можно найти в ветке teched-2018.
Наш набор данных для вышеуказанных сценариев состоит из 6 файлов, которые содержат информацию о клиентах , продуктах и продажах .
Таблица CUSTOMER содержит сведения о клиентах, эта таблица имеет ADDRESSID , который сопоставлен с таблицей ADDRESS , где хранятся сведения об адресах клиентов.
Когда клиент покупает продукт, создается заказ на продажу ( SO_HEADER ), и каждый заказ на продажу имеет несколько позиций заказа ( SO_ITEM ).
SO_HEADER имеет PARTNERID , внешний ключ, который ссылается на таблицу CUSTOMER .
SO_ITEM имеет SALESORDERID, внешний ключ, который ссылается на SO_HEADER .
Каждый SO_ITEM будет иметь PRODUCTID , который сопоставлен с таблицей PRODUCT , где хранятся сведения о продуктах.
Отзывы покупателей о продукции хранятся в таблице ОБЗОР .
Информация о возвратах клиентов хранится в таблице RETURN .
Итак, в основном у нас есть 7 столов.
Это синтетический набор данных, полученный из SHINE и дополненный для наших сценариев использования.
Чтобы получить доступ к наборам данных, изучите папку данных в этом репозитории.
Никто
Пожалуйста, используйте вопросы GitHub, чтобы сообщать о любых ошибках.
Авторские права (c) принадлежат SAP SE или аффилированной компании SAP, 2017–2020 гг. Все права защищены. Этот проект лицензируется в соответствии с лицензией на программное обеспечение Apache версии 2.0, если иное не указано в файле ЛИЦЕНЗИИ.