Repositori publik ini bersifat hanya-baca dan tidak lagi dikelola.
Data Hub INteractive Education(DINE) adalah konten pendidikan untuk SAP Data Hub. Latihan praktis kami dikembangkan untuk menunjukkan kepada Anda cara menggunakan fitur SAP Data Hub. SAP Data Hub memungkinkan Anda terhubung ke berbagai sumber data seperti SAP HANA, SAP ERP, SAP BW, Oracle DB2, SQL Server, dan masih banyak lagi serta dapat memproses berbagai tipe data; terstruktur, semi-terstruktur, dan tidak terstruktur menggunakan Kafka, mesin streaming, analisis teks dan gambar, dll. SAP Data Hub dapat menyatukan semua data Anda sehingga Anda dapat mengerjakannya dengan lancar. Anda dapat dengan cepat mengembangkan prototipe Anda di SAP Data Hub dan hasilnya dapat dengan mudah diubah ke sistem tingkat produksi karena SAP Data Hub menangani eksekusi, orkestrasi, penjadwalan, dan pemantauan. SAP Data Hub dikembangkan di Kubernetes dan oleh karena itu dapat diterapkan di lokasi atau di cloud. Ini berjalan pada mesin eksekusi terdistribusi dan dirancang untuk dunia Big Data dengan membuktikan pemahaman tentang metadata dalam lanskap Big Data.
Baca juga dokumentasi resmi SAP Data Hub
DINE memudahkan mempelajari cara membangun saluran pipa di SAP Data Hub menggunakan operatornya. Ini bertindak sebagai referensi bagi pengembang aplikasi dan menampilkan fitur Data Hub dalam skenario bisnis yang mudah dipahami. Konten demo ini dilengkapi dengan:
Contoh data
Cuplikan kode
Tutorial
Pengaturan SAP Data Hub - Ikuti Panduan Instalasi untuk SAP Data Hub dan atur lingkungan SAP Data Hub Anda.
Anda juga dapat menggunakan SAP Data Hub Developer Edition atau SAP Data Hub Trial Edition
Kita akan mempelajari SAP Data Hub melalui skenario di bawah ini yang didasarkan pada entitas dummy yang disebut sebagai SAP Data Hub Market Place, sebuah platform e-commerce yang dikembangkan untuk tujuan demo dan pembelajaran, di mana pelanggan di seluruh dunia melakukan ribuan pembelian setiap hari. .
Skenarionya dirinci di bawah ini:
Prediksi Pengembalian Pelanggan : Skenario ini digunakan untuk mengidentifikasi produk yang sering dikembalikan oleh pelanggan berdasarkan parameter yang berbeda. Skenario ini diimplementasikan dengan Python dan menggunakan perpustakaan sklearn untuk mengimplementasikan algoritma pengklasifikasi pohon keputusan. Di sini, dalam skenario ini kami membaca data dari sumber data yang berbeda dan menggunakan cloud SAP Analytics untuk memvisualisasikan kumpulan data hasil. Ikuti tutorial untuk menerapkan skenario ini.
Skenario lebih lanjut dapat ditemukan di cabang teched-2018.
Dataset kami untuk skenario di atas terdiri dari 6 file, yang berisi informasi pelanggan , produk , dan penjualan .
Tabel CUSTOMER mempunyai rincian pelanggan, tabel ini mempunyai ADDRESSID yang dipetakan ke tabel ADDRESS dimana rincian alamat pelanggan disimpan.
Ketika Pelanggan membeli Produk, Pesanan Penjualan dibuat ( SO_HEADER ) dan setiap pesanan penjualan memiliki beberapa item pesanan ( SO_ITEM ).
SO_HEADER memiliki PARTNERID , kunci asing yang terhubung ke tabel CUSTOMER .
SO_ITEM memiliki SALESORDERID, kunci asing yang tertaut ke SO_HEADER .
Setiap SO_ITEM akan memiliki PRODUKID yang dipetakan ke tabel PRODUK tempat detail produk disimpan.
Ulasan Pelanggan tentang produk disimpan dalam tabel REVIEW .
Informasi tentang pengembalian yang dilakukan oleh pelanggan disimpan dalam tabel RETURN .
Jadi pada dasarnya kami memiliki 7 tabel.
Ini adalah kumpulan data sintetis yang berasal dari SHINE dan diperkaya agar sesuai dengan kasus penggunaan kami
Untuk mengakses kumpulan data, jelajahi folder data di repositori ini.
Tidak ada
Silakan gunakan masalah GitHub untuk melaporkan bug apa pun.
Hak Cipta (c) 2017-2020 SAP SE atau perusahaan afiliasi SAP. Semua hak dilindungi undang-undang. Proyek ini dilisensikan di bawah Lisensi Perangkat Lunak Apache, versi 2.0 kecuali sebagaimana dinyatakan lain dalam file LISENSI.