このパブリック リポジトリは読み取り専用であり、現在は管理されていません。
Data Hub INTERACTIVE Education(DINE) は、SAP Data Hub の教育コンテンツです。実践的な演習は、SAP Data Hub 機能の使用方法を示すために開発されました。 SAP Data Hub を使用すると、SAP HANA、SAP ERP、SAP BW、Oracle DB2、SQL Server などのさまざまなデータ ソースに接続し、さまざまなデータ タイプを処理できます。 Kafka、ストリーミング エンジン、テキストおよび画像分析などを使用して、構造化、半構造化、および非構造化を実現します。SAP Data Hub では、すべてのデータを 1 つにまとめて、シームレスに作業できるようにします。 SAP Data Hub でプロトタイプを迅速に開発でき、SAP Data Hub が実行、オーケストレーション、スケジューリング、監視を担当するため、その結果を実稼働レベルのシステムに簡単に変換できます。 SAP Data Hub は Kubernetes 上で開発されているため、オンプレミスまたはクラウドに展開できます。これは分散実行エンジン上で実行され、ビッグ データ環境におけるメタデータの理解を証明することでビッグ データの世界向けに設計されています。
SAP Data Hub の公式ドキュメントにも目を通してください。
DINE を使用すると、演算子を使用して SAP Data Hub でパイプラインを構築する方法を簡単に学習できます。これはアプリケーション開発者向けのリファレンスとして機能し、理解しやすいビジネス シナリオでデータ ハブの機能を紹介します。このデモ コンテンツには次のものが含まれています。
サンプルデータ
コードスニペット
チュートリアル
SAP Data Hub のセットアップ - SAP Data Hub のインストール ガイドに従って、SAP Data Hub 環境をセットアップします。
SAP Data Hub Developer Edition または SAP Data Hub Trial Edition を使用することもできます。
SAP Data Hub については、SAP Data Hub Market Place と呼ばれるダミー エンティティに基づいた以下のシナリオを通じて学習します。SAP Data Hub Market Place は、デモと学習を目的として開発された e コマース プラットフォームであり、世界中の顧客が毎日数千件の購入を行っています。 。
シナリオについては以下で詳しく説明します。
顧客返品予測 : このシナリオは、さまざまなパラメーターに基づいて、顧客によって頻繁に返品される可能性のある製品を特定するために使用されます。このシナリオは Python で実装され、sklearn ライブラリを使用してデシジョン ツリー分類子アルゴリズムを実装します。このシナリオでは、さまざまなデータ ソースからデータを読み取り、SAP Analytics クラウドを使用して結果のデータセットを視覚化します。このシナリオを実装するには、チュートリアルに従ってください。
その他のシナリオは、teched-2018 ブランチにあります。
上記のシナリオのデータセットは、顧客、製品、販売情報を含む 6 つのファイルで構成されています。
CUSTOMERテーブルには顧客の詳細があり、このテーブルにはADDRESSIDがあり、顧客の住所の詳細が保存されるADDRESSテーブルにマップされます。
顧客が製品を購入すると、販売注文が生成され ( SO_HEADER )、各販売注文には複数の注文品目 ( SO_ITEM ) が含まれます。
SO_HEADER には、 CUSTOMERテーブルにリンクする外部キーであるPARTNERIDがあります。
SO_ITEM には、 SO_HEADERにリンクする外部キーである SALESORDERID があります。
各SO_ITEM にはPRODUCTIDがあり、製品の詳細が保存されるPRODUCTテーブルにマップされます。
製品に関する顧客レビューはREVIEWテーブルに保存されます。
顧客による返品に関する情報はRETURNテーブルに保存されます。
基本的にテーブルは 7 つあります。
これは SHINE から派生した合成データセットであり、ユースケースに合わせて強化されています
データセットにアクセスするには、このリポジトリ内のデータ フォルダーを調べます。
なし
バグを報告するには、GitHub の問題を使用してください。
Copyright (c) 2017-2020 SAP SE または SAP 関連会社。無断転載を禁じます。このプロジェクトは、LICENSE ファイルに別段の記載がある場合を除き、Apache ソフトウェア ライセンス バージョン 2.0 に基づいてライセンスされています。