這個公共儲存庫是唯讀的,不再維護。
Data Hub Interactive Education(DINE) 是 SAP Data Hub 的教育內容。我們開發的實務練習是為了向您展示如何使用 SAP Data Hub 功能。 SAP Data Hub 可讓您連接到不同的資料來源,例如 SAP HANA、SAP ERP、SAP BW、Oracle DB2、SQL Server 等,並且可以處理各種資料類型;使用 Kafka、串流引擎、文字和圖像分析等進行結構化、半結構化和非結構化。您可以在 SAP Data Hub 上快速開發原型,結果可以輕鬆轉變為生產級系統,因為 SAP Data Hub 負責執行、編排、排程和監控。 SAP Data Hub 是在 Kubernetes 上開發的,因此它可以部署在本地或雲端。它在分散式執行引擎上運行,專為大數據世界而設計,透過證明對大數據環境中元資料的理解。
另請參閱 SAP Data Hub 的官方文檔
DINE 讓您可以輕鬆學習如何使用其運算子在 SAP Data Hub 中建立管道。它為應用程式開發人員提供參考,並以易於理解的業務場景展示了Data Hub的功能。此演示內容包括:
樣本數據
程式碼片段
教學
SAP Data Hub 設定 - 依照 SAP Data Hub 安裝指南並設定 SAP Data Hub 環境。
您也可以使用 SAP Data Hub Developer Edition 或 SAP Data Hub Trial Edition
我們將透過以下場景學習 SAP Data Hub,這些場景基於名為 SAP Data Hub Market Place 的虛擬實體,這是一個為了演示和學習而開發的電子商務平台,全球各地的客戶每天都會進行數千次購買。
場景詳述如下:
客戶退貨預測:此場景用於根據不同的參數來識別客戶可以頻繁退貨的產品。該場景是用Python實現的,並使用sklearn庫來實作決策樹分類器演算法。在此場景中,我們從不同資料來源讀取數據,並使用 SAP Analytics Cloud 視覺化結果資料集。按照教程來實現此場景。
更多場景可以在 teched-2018 分支中找到。
我們針對上述場景的資料集由 6 個文件組成,其中包含客戶、產品和銷售資訊。
CUSTOMER表包含客戶的詳細信息,該表具有ADDRESSID ,它會對應到儲存客戶地址詳細資料的ADDRESS表。
當客戶購買產品時,會產生銷售訂單 ( SO_HEADER ),每個銷售訂單都有多個訂單項目 ( SO_ITEM )。
SO_HEADER有PARTNERID ,一個連結到CUSTOMER表的外鍵。
SO_ITEM有 SALESORDERID,一個連結到SO_HEADER的外鍵。
每個SO_ITEM都會有PRODUCTID ,它會對應到儲存產品詳細資料的PRODUCT表。
客戶對產品的評論儲存在REVIEW表中。
有關客戶退貨的資訊儲存在RETURN表中。
所以基本上我們有 7 張桌子。
它是源自 SHINE 的合成資料集,並進行了豐富以適應我們的用例
若要存取資料集,請瀏覽此儲存庫中的資料資料夾。
沒有任何
請使用 GitHub issues 回報任何錯誤。
版權所有 (c) 2017-2020 SAP SE 或 SAP 附屬公司。版權所有。除非 LICENSE 檔案另有說明,該專案已根據 Apache 軟體授權 2.0 版獲得許可。