ดาวน์โหลดสถิติ | มาเวน | พีพีไอ | Conda-ฟอร์จ | แครน | นักเทียบท่าฮับ |
---|---|---|---|---|---|
อาปาเช่ เซโดน่า | 225,000 / เดือน | ||||
รุ่น GeoSpark ที่เก็บถาวร | 10,000/เดือน |
ติดตาม Sedona บน Twitter เพื่อรับข่าวสารใหม่: Sedona@Twitter
เข้าร่วมชุมชน Sedona Discord:
เข้าร่วมสำนักงานชุมชน Sedona รายเดือน: Google ปฏิทิน วันอังคาร เวลา 8.00 น. ถึง 9.00 น. ตามเวลาแปซิฟิก ทุก 4 สัปดาห์
Sedona JIRA: จุดบกพร่อง คำขอดึงข้อมูล และปัญหาอื่นๆ ที่คล้ายกัน
รายชื่อผู้รับจดหมาย Sedona: [email protected]: การพัฒนาโครงการ คำถามทั่วไป หรือบทช่วยสอน
Apache Sedona™ เป็นเครื่องมือประมวลผลเชิงพื้นที่ที่ช่วยให้นักพัฒนาสามารถประมวลผลข้อมูลเชิงพื้นที่ได้อย่างง่ายดายทุกขนาดภายในระบบประมวลผลคลัสเตอร์สมัยใหม่ เช่น Apache Spark และ Apache Flink นักพัฒนา Sedona สามารถแสดงงานการประมวลผลข้อมูลเชิงพื้นที่ของตนใน Spatial SQL, Spatial Python หรือ Spatial R ได้ ภายใน Sedona มีฟังก์ชันการโหลดข้อมูลเชิงพื้นที่ การทำดัชนี การแบ่งพาร์ติชัน และฟังก์ชันการประมวลผล/เพิ่มประสิทธิภาพแบบสอบถาม ซึ่งช่วยให้ผู้ใช้สามารถวิเคราะห์ข้อมูลเชิงพื้นที่ในทุกขนาดได้อย่างมีประสิทธิภาพ
คุณสมบัติหลักบางประการของ Apache Sedona ได้แก่:
นี่คือคุณสมบัติหลักบางประการของ Apache Sedona แต่อาจมีความสามารถเพิ่มเติม ขึ้นอยู่กับเวอร์ชันและการกำหนดค่าเฉพาะ
คลิกและเล่น Sedona Python Jupyter Notebook แบบโต้ตอบทันที!
Apache Sedona เป็นเฟรมเวิร์กที่ใช้กันอย่างแพร่หลายสำหรับการทำงานกับข้อมูลเชิงพื้นที่ และมีกรณีการใช้งานและแอปพลิเคชันต่างๆ มากมาย กรณีการใช้งานหลักบางส่วนสำหรับ Apache Sedona ได้แก่:
ตัวอย่างนี้โหลดบันทึกการเดินทางแท็กซี่ใน NYC และข้อมูลโซนแท็กซี่ที่จัดเก็บเป็นไฟล์ .CSV บน AWS S3 ลงในเฟรมข้อมูลเชิงพื้นที่ Sedona จากนั้นจะทำการสืบค้น SQL เชิงพื้นที่ในชุดข้อมูลการเดินทางด้วยแท็กซี่เพื่อกรองบันทึกทั้งหมด ยกเว้นที่อยู่ในพื้นที่แมนฮัตตันของนิวยอร์ก ตัวอย่างยังแสดงการดำเนินการรวมเชิงพื้นที่ที่จับคู่บันทึกการเดินทางของรถแท็กซี่กับโซนต่างๆ โดยขึ้นอยู่กับว่าการเดินทางของรถแท็กซี่นั้นอยู่ภายในขอบเขตทางภูมิศาสตร์ของโซนหรือไม่ สุดท้าย ข้อมูลโค้ดสุดท้ายจะรวมเอาต์พุตของ Sedona เข้ากับ GeoPandas และวางแผนการกระจายเชิงพื้นที่ของชุดข้อมูลทั้งสองชุด
taxidf = sedona . read . format ( 'csv' ). option ( "header" , "true" ). option ( "delimiter" , "," ). load ( "s3a://your-directory/data/nyc-taxi-data.csv" )
taxidf = taxidf . selectExpr ( 'ST_Point(CAST(Start_Lon AS Decimal(24,20)), CAST(Start_Lat AS Decimal(24,20))) AS pickup' , 'Trip_Pickup_DateTime' , 'Payment_Type' , 'Fare_Amt' )
zoneDf = sedona . read . format ( 'csv' ). option ( "delimiter" , "," ). load ( "s3a://your-directory/data/TIGER2018_ZCTA5.csv" )
zoneDf = zoneDf . selectExpr ( 'ST_GeomFromWKT(_c0) as zone' , '_c1 as zipcode' )
taxidf_mhtn = taxidf . where ( 'ST_Contains(ST_PolygonFromEnvelope(-74.01,40.73,-73.93,40.79), pickup)' )
taxiVsZone = sedona . sql ( 'SELECT zone, zipcode, pickup, Fare_Amt FROM zoneDf, taxiDf WHERE ST_Contains(zone, pickup)' )
zoneGpd = gpd . GeoDataFrame ( zoneDf . toPandas (), geometry = "zone" )
taxiGpd = gpd . GeoDataFrame ( taxidf . toPandas (), geometry = "pickup" )
zone = zoneGpd . plot ( color = 'yellow' , edgecolor = 'black' , zorder = 1 )
zone . set_xlabel ( 'Longitude (degrees)' )
zone . set_ylabel ( 'Latitude (degrees)' )
zone . set_xlim ( - 74.1 , - 73.8 )
zone . set_ylim ( 40.65 , 40.9 )
taxi = taxiGpd . plot ( ax = zone , alpha = 0.01 , color = 'red' , zorder = 3 )
เราจัดเตรียมอิมเมจ Docker สำหรับ Apache Sedona พร้อมด้วย Python JupyterLab และคลัสเตอร์แบบโหนดเดียว รูปภาพมีอยู่ใน DockerHub
ในการติดตั้งแพ็คเกจ Python:
pip install apache-sedona
หากต้องการรวบรวมซอร์สโค้ด โปรดดูที่เว็บไซต์ Sedona
โมดูลในซอร์สโค้ด
ชื่อ | เอพีไอ | การแนะนำ |
---|---|---|
ทั่วไป | ชวา | ตรรกะการดำเนินการทางเรขาคณิตหลัก การทำให้เป็นอนุกรม ดัชนี |
จุดประกาย | จุดประกาย RDD/DataFrame Scala/Java/SQL | การประมวลผลข้อมูลเชิงพื้นที่แบบกระจายบน Apache Spark |
สะบัด | Flink DataStream/ตารางใน Scala/Java/SQL | การประมวลผลข้อมูลเชิงพื้นที่แบบกระจายบน Apache Flink |
เกล็ดหิมะ | สโนว์เฟลก SQL | การประมวลผลข้อมูลเชิงพื้นที่แบบกระจายบน Snowflake |
มีประกายไฟ | ไม่มีซอร์สโค้ด | ขวดโหลสำหรับ Sedona Spark |
ปัดเงา | ไม่มีซอร์สโค้ด | ขวดโหลสำหรับ Sedona Flink |
เครื่องทดสอบเกล็ดหิมะ | ชวา | โปรแกรมทดสอบสำหรับ Sedona Snowflake |
หลาม | จุดประกาย RDD/DataFrame Python | การประมวลผลข้อมูลเชิงพื้นที่แบบกระจายบน Apache Spark |
ร | จุดประกาย RDD/DataFrame ใน R | กระดาษห่อ R สำหรับ Sedona |
เรือเหาะ | อาปาเช่ เซพเพลิน | ปลั๊กอินสำหรับ Apache Zeppelin 0.8.1+ |
กรุณาเยี่ยมชมเว็บไซต์ Apache Sedona สำหรับข้อมูลโดยละเอียด