تحميل الإحصائيات | مخضرم | بايبي | كوندا فورج | كران | DockerHub |
---|---|---|---|---|---|
أباتشي سيدونا | 225 ألف / شهر | ||||
إصدارات GeoSpark المؤرشفة | 10 ألف/شهر |
تابع Sedona على Twitter للحصول على أخبار جديدة: Sedona@Twitter
انضم إلى مجتمع Sedona Discord:
انضم إلى ساعة مكتب مجتمع Sedona الشهرية: تقويم Google، أيام الثلاثاء من الساعة 8 صباحًا حتى 9 صباحًا بتوقيت المحيط الهادئ، كل 4 أسابيع
Sedona JIRA: الأخطاء وطلبات السحب ومشكلات أخرى مماثلة
قوائم Sedona البريدية: [email protected]: تطوير المشروع أو الأسئلة العامة أو البرامج التعليمية.
Apache Sedona™ هو محرك حوسبة مكانية يمكّن المطورين من معالجة البيانات المكانية بسهولة على أي نطاق ضمن أنظمة الحوسبة العنقودية الحديثة مثل Apache Spark وApache Flink. يمكن لمطوري Sedona التعبير عن مهام معالجة البيانات المكانية الخاصة بهم في Spatial SQL أو Spatial Python أو Spatial R. داخليًا، توفر Sedona تحميل البيانات المكانية وفهرستها وتقسيمها ووظيفة معالجة/تحسين الاستعلام التي تمكن المستخدمين من تحليل البيانات المكانية بكفاءة على أي نطاق.
تتضمن بعض الميزات الرئيسية لـ Apache Sedona ما يلي:
هذه بعض الميزات الرئيسية لـ Apache Sedona، ولكنها قد توفر إمكانات إضافية اعتمادًا على الإصدار والتكوين المحددين.
انقر وقم بتشغيل دفتر Sedona Python Jupyter التفاعلي على الفور!
يعد Apache Sedona إطارًا مستخدمًا على نطاق واسع للعمل مع البيانات المكانية، وله العديد من حالات الاستخدام والتطبيقات المختلفة. تتضمن بعض حالات الاستخدام الرئيسية لـ Apache Sedona ما يلي:
يقوم هذا المثال بتحميل سجلات رحلات سيارات الأجرة في مدينة نيويورك ومعلومات منطقة سيارات الأجرة المخزنة كملفات بتنسيق CSV على AWS S3 في إطارات بيانات Sedona المكانية. ثم يقوم بإجراء استعلام SQL مكاني على مجموعات بيانات رحلات سيارات الأجرة لتصفية جميع السجلات باستثناء تلك الموجودة في منطقة مانهاتن في نيويورك. يوضح المثال أيضًا عملية ربط مكانية تطابق سجلات رحلة سيارة الأجرة إلى المناطق بناءً على ما إذا كانت رحلة سيارة الأجرة تقع ضمن النطاقات الجغرافية للمنطقة. وأخيرًا، يدمج مقتطف الكود الأخير مخرجات Sedona مع GeoPandas ويرسم التوزيع المكاني لمجموعتي البيانات.
taxidf = sedona . read . format ( 'csv' ). option ( "header" , "true" ). option ( "delimiter" , "," ). load ( "s3a://your-directory/data/nyc-taxi-data.csv" )
taxidf = taxidf . selectExpr ( 'ST_Point(CAST(Start_Lon AS Decimal(24,20)), CAST(Start_Lat AS Decimal(24,20))) AS pickup' , 'Trip_Pickup_DateTime' , 'Payment_Type' , 'Fare_Amt' )
zoneDf = sedona . read . format ( 'csv' ). option ( "delimiter" , "," ). load ( "s3a://your-directory/data/TIGER2018_ZCTA5.csv" )
zoneDf = zoneDf . selectExpr ( 'ST_GeomFromWKT(_c0) as zone' , '_c1 as zipcode' )
taxidf_mhtn = taxidf . where ( 'ST_Contains(ST_PolygonFromEnvelope(-74.01,40.73,-73.93,40.79), pickup)' )
taxiVsZone = sedona . sql ( 'SELECT zone, zipcode, pickup, Fare_Amt FROM zoneDf, taxiDf WHERE ST_Contains(zone, pickup)' )
zoneGpd = gpd . GeoDataFrame ( zoneDf . toPandas (), geometry = "zone" )
taxiGpd = gpd . GeoDataFrame ( taxidf . toPandas (), geometry = "pickup" )
zone = zoneGpd . plot ( color = 'yellow' , edgecolor = 'black' , zorder = 1 )
zone . set_xlabel ( 'Longitude (degrees)' )
zone . set_ylabel ( 'Latitude (degrees)' )
zone . set_xlim ( - 74.1 , - 73.8 )
zone . set_ylim ( 40.65 , 40.9 )
taxi = taxiGpd . plot ( ax = zone , alpha = 0.01 , color = 'red' , zorder = 3 )
نحن نقدم صورة Docker لـ Apache Sedona مع Python JupyterLab ومجموعة أحادية العقدة. الصور متاحة على DockerHub
لتثبيت حزمة بايثون:
pip install apache-sedona
لتجميع كود المصدر، يرجى الرجوع إلى موقع Sedona
الوحدات في الكود المصدري
اسم | واجهة برمجة التطبيقات | مقدمة |
---|---|---|
شائع | جافا | منطق العمليات الهندسية الأساسية، التسلسل، الفهرس |
شرارة | شرارة RDD/DataFrame Scala/Java/SQL | معالجة البيانات الجغرافية المكانية الموزعة على Apache Spark |
رمش | Flink DataStream/Table في Scala/Java/SQL | معالجة البيانات الجغرافية المكانية الموزعة على Apache Flink |
ندفة الثلج | ندفة الثلج SQL | معالجة البيانات الجغرافية المكانية الموزعة على Snowflake |
مظللة بالشرارة | لا يوجد كود المصدر | جرة مظللة لسيدونا سبارك |
مظللة بالوميض | لا يوجد كود المصدر | جرة مظللة لسيدونا فلينك |
اختبار ندفة الثلج | جافا | برنامج اختبار لSedona Snowflake |
بيثون | شرارة RDD/DataFrame بيثون | معالجة البيانات الجغرافية المكانية الموزعة على Apache Spark |
ر | شرارة RDD/DataFrame في R | المجمع R لسيدونا |
منطاد | أباتشي زيبلين | البرنامج المساعد لأباتشي زيبلين 0.8.1+ |
يرجى زيارة موقع Apache Sedona للحصول على معلومات مفصلة