الكنسي اللاتيني IPA: /ˈʃi.o/ ، [ˈʃiː.o] ، [ˈʃi.i̯o] الفعل: يمكنني ، أعرف ، فهم ، معرفة.
SCIO هي API Scala لـ Apache Beam و Google Cloud Dataflow مستوحاة من Apache Spark و Scalding.
* المقدمة بواسطة Google Cloud DataFlow
قم بتنزيل وتثبيت Java Development Kit (JDK) الإصدار 8.
تثبيت SBT.
استخدم قالب GITER8 الخاص بنا لإنشاء مستودع جديد للتشكيك في SCIO:
sbt new spotify/scio.g8
قم بالتبديل إلى الريبو الجديد ( scio-job
الافتراضي) وقم بإنشائه:
cd scio-job
sbt stage
قم بتشغيل مثال عدد الكلمات المضمّن:
target/universal/stage/bin/scio-job --output=wc
قائمة ملفات النتائج وفحص المحتوى:
ls -l wc
cat wc/part-00000-of-00004.txt
البدء هو أفضل مكان للبدء مع SCIO. إذا كنت جديدًا على Apache Beam ومعالجة البيانات الموزعة ، تحقق من دليل برمجة الشعاع أولاً للحصول على شرح مفصل لنموذج برمجة الشعاع والمفاهيم. إذا كان لديك خبرة مع مكتبات معالجة بيانات Scala الأخرى ، تحقق من هذه المقارنة بين Scio و Scalding و Spark.
مثال يمكن العثور على خطوط أنابيب SCIO والاختبارات تحت أمثلة SCIO. الكثير منها هي منافذ مباشرة من أمثلة Java في Beam. انظر هذه الصفحة لبعضها مع شرح جنبًا إلى جنب. راجع أيضًا رمز Rosetta Big Data لمقتطفات رمز معالجة البيانات الشائعة في Scio و Scalding و Spark.
يتضمن SCIO القطع الأثرية التالية:
scio-avro
: الوظيفة الإضافية لـ Avro ، يمكن أيضًا استخدامها مستقلةscio-cassandra*
: الوظائف الإضافية لكاساندراscio-core
: مكتبة أساسيةscio-elasticsearch*
: الوظائف الإضافية لـ Elasticsearchscio-extra
: أدوات إضافية للعمل مع المجموعات والنسيم وما إلى ذلكscio-google-cloud-platform
: الوظيفة الإضافية لـ Google Cloud IO's: BigQuery ، BigTable ، Pub/Sub ، datastore ، spannerscio-grpc
: الوظيفة الإضافية لمكالمات خدمة GRPCscio-jdbc
: الوظيفة الإضافية لـ JDBC IOscio-neo4j
: الوظيفة الإضافية لـ Neo4j IOscio-parquet
: الوظيفة الإضافية لـ Parquetscio-redis
: إضافة لإعادة Redisscio-repl
: امتداد Scala REPL مع عمليات SCIO المحددةscio-smb
: الوظيفة الإضافية لعمليات دلو دمج الفرزscio-tensorflow
: الوظيفة الإضافية لـ Tensorflow tfrecords IO والتنبؤscio-test
: جميع الأدوات المساعدة للاختبار التالية. أضف إلى مشروعك باعتباره تبعية "اختبار"scio-test-core
: اختبار المرافق الأساسيةscio-test-google-cloud-platform
: اختبار الأدوات المساعدة لـ Google Cloud IO'sscio-test-parquet
: مرافق اختبار Parquetحقوق الطبع والنشر 2024 Spotify AB.
مرخصة بموجب ترخيص Apache ، الإصدار 2.0: http://www.apache.org/licenses/license-2.0