Latin IPA ของสงฆ์: /ˈʃi.o/, [ˈʃiː.o], [ˈʃi.i̯o] คำกริยา: ฉันสามารถรู้เข้าใจเข้าใจมีความรู้
SCIO เป็น Scala API สำหรับ Apache Beam และ Google Cloud Dataflow ที่ได้รับแรงบันดาลใจจาก Apache Spark และ Scalding
* จัดทำโดย Google Cloud DataFlow
ดาวน์โหลดและติดตั้ง Java Development Kit (JDK) เวอร์ชัน 8
ติดตั้ง SBT
ใช้เทมเพลต GITER8 ของเราเพื่อสร้างที่เก็บงาน SCIO ใหม่อย่างรวดเร็ว:
sbt new spotify/scio.g8
เปลี่ยนเป็น repo ใหม่ ( scio-job
เริ่มต้น) และสร้าง:
cd scio-job
sbt stage
เรียกใช้ตัวอย่างจำนวนคำที่รวมอยู่:
target/universal/stage/bin/scio-job --output=wc
รายการไฟล์ผลลัพธ์และตรวจสอบเนื้อหา:
ls -l wc
cat wc/part-00000-of-00004.txt
การเริ่มต้นใช้งานเป็นสถานที่ที่ดีที่สุดในการเริ่มต้นด้วย SCIO หากคุณยังใหม่กับ Apache Beam และการประมวลผลข้อมูลแบบกระจายให้ตรวจสอบคู่มือการเขียนโปรแกรมลำแสงก่อนสำหรับคำอธิบายโดยละเอียดเกี่ยวกับรูปแบบการเขียนโปรแกรมลำแสงและแนวคิด หากคุณมีประสบการณ์กับไลบรารีการประมวลผลข้อมูล SCALA อื่น ๆ ให้ตรวจสอบการเปรียบเทียบนี้ระหว่าง SCIO, Scalding และ Spark
ตัวอย่างท่อ SCIO และการทดสอบสามารถพบได้ภายใต้ตัวอย่างของ SCIO ส่วนใหญ่เป็นพอร์ตโดยตรงจากตัวอย่าง Java ของ Beam ดูหน้านี้สำหรับบางคนพร้อมคำอธิบายเคียงข้างกัน ดูรหัส Big Data Rosetta สำหรับตัวอย่างรหัสการประมวลผลข้อมูลทั่วไปใน Scio, Scalding และ Spark
SCIO รวมสิ่งประดิษฐ์ต่อไปนี้:
scio-avro
: Add-on for avro สามารถใช้แบบสแตนด์อโลนได้scio-cassandra*
: Add-ons สำหรับ Cassandrascio-core
: Core Libraryscio-elasticsearch*
: ADD-ONS สำหรับ ELASTICSEARCHscio-extra
: ยูทิลิตี้พิเศษสำหรับการทำงานกับคอลเลกชัน, สายลม, ฯลฯ การสนับสนุนที่ดีที่สุดscio-google-cloud-platform
: ADD-ON สำหรับ Google Cloud IO's: BigQuery, BigTable, Pub/Sub, Datastore, Spannerscio-grpc
: ADD-ON สำหรับการโทร GRPCscio-jdbc
: ADD-ON สำหรับ JDBC IOscio-neo4j
: Add-on for neo4j ioscio-parquet
: Add-on สำหรับ Parquetscio-redis
: Add-on for redisscio-repl
: ส่วนขยายของ Scala REPL ด้วยการดำเนินการเฉพาะของ SCIOscio-smb
: Add-on สำหรับการเรียงลำดับการดำเนินการของ Bucket Mergescio-tensorflow
: ADD-ON สำหรับ TENSORFLOW TFRECORDS IO และการทำนายscio-test
: ยูทิลิตี้ทดสอบทั้งหมด เพิ่มโครงการของคุณเป็นการพึ่งพา "ทดสอบ"scio-test-core
: ทดสอบยูทิลิตี้หลักscio-test-google-cloud-platform
: ทดสอบยูทิลิตี้สำหรับ Google Cloud IO'sscio-test-parquet
: ทดสอบยูทิลิตี้สำหรับ Parquetลิขสิทธิ์ 2024 Spotify AB
ได้รับใบอนุญาตภายใต้ใบอนุญาต Apache เวอร์ชัน 2.0: http://www.apache.org/licenses/license-2.0