Ecclesiastical Latin IPA: /ˈʃi.o/, [ˈʃiː.o], [ˈʃi.i̯o] kata kerja: Saya dapat, tahu, memahami, memiliki pengetahuan.
Scio adalah API Scala untuk Apache Beam dan Google Cloud Dataflow yang terinspirasi oleh Apache Spark dan Scring.
* Disediakan oleh Google Cloud Dataflow
Unduh dan instal Java Development Kit (JDK) versi 8.
Instal SBT.
Gunakan template giter8 kami untuk dengan cepat membuat repositori pekerjaan scio baru:
sbt new spotify/scio.g8
Beralih ke repo baru ( scio-job
default) dan bangun:
cd scio-job
sbt stage
Jalankan contoh jumlah kata yang disertakan:
target/universal/stage/bin/scio-job --output=wc
Daftar file hasil dan periksa konten:
ls -l wc
cat wc/part-00000-of-00004.txt
Memulai adalah tempat terbaik untuk memulai dengan Scio. Jika Anda baru mengenal Apache Beam dan pemrosesan data terdistribusi, periksa panduan pemrograman balok terlebih dahulu untuk penjelasan terperinci tentang model dan konsep pemrograman balok. Jika Anda memiliki pengalaman dengan pustaka pemrosesan data scala lainnya, lihat perbandingan antara SCIO, Scring dan Spark.
Contoh pipa scio dan tes dapat ditemukan di bawah scio-excles. Banyak dari mereka adalah port langsung dari contoh Java Beam. Lihat halaman ini untuk beberapa dari mereka dengan penjelasan berdampingan. Juga lihat Big Data Rosetta Code untuk cuplikan kode pemrosesan data umum di SCIO, SCHINDING dan SPARK.
Scio termasuk artefak berikut:
scio-avro
: Add-on untuk Avro, juga dapat digunakan mandiriscio-cassandra*
: add-on untuk cassandrascio-core
: Perpustakaan intiscio-elasticsearch*
: Add-On untuk Elasticsearchscio-extra
: Utilitas tambahan untuk bekerja dengan koleksi, angin, dll., Dukungan Upaya Terbaikscio-google-cloud-platform
: Add-on untuk Google Cloud IO: BigQuery, BigTable, Pub/Sub, Datastore, Spannerscio-grpc
: add-on untuk panggilan layanan GRPCscio-jdbc
: add-on untuk jdbc ioscio-neo4j
: add-on untuk neo4j ioscio-parquet
: Add-on untuk parketscio-redis
: add-on untuk redisscio-repl
: Perpanjangan SCala REPL dengan operasi spesifik SCIOscio-smb
: add-on untuk mengurutkan operasi ember gabunganscio-tensorflow
: add-on untuk tensorflow tfrecords io dan prediksiscio-test
: Semua utilitas tes berikut. Tambahkan ke proyek Anda sebagai ketergantungan "tes"scio-test-core
: utilitas inti ujiscio-test-google-cloud-platform
: Utilitas Uji untuk Google Cloud IOscio-test-parquet
: Uji Utilitas untuk ParketHak Cipta 2024 Spotify AB.
Lisensi di bawah lisensi Apache, Versi 2.0: http://www.apache.org/licenses/license-2.0