sedona下載 - sedona原始碼下載

sedona

JAVA源碼

Apache Sedona 1.7.0

下載

下載統計	梅文	皮伊	康達鍛造	克蘭	DockerHub
阿帕契塞多納	22.5萬/月
已存檔的 GeoSpark 版本	1萬/月

加入社區
阿帕契塞多納是什麼？
- 特徵
何時使用塞多納？
- 使用案例
- 程式碼範例
Docker映像
建設塞多納
文件
供電

加入社區

在 Twitter 上關注 Sedona 以獲取最新消息：Sedona@Twitter

加入 Sedona Discord 社群：

加入塞多納每月社區辦公時間：Google 日曆，太平洋時間週二上午 8 點至上午 9 點，每 4 週一次

Sedona JIRA：錯誤、拉取請求和其他類似問題

Sedona 郵件清單：[email protected]：專案開發、一般問題或教學。

請先訂閱，然後發布電子郵件。如需訂閱，請發送電子郵件（主題和內容留空）至 [email protected]

阿帕契塞多納是什麼？

Apache Sedona™ 是一種空間運算引擎，可讓開發人員在 Apache Spark 和 Apache Flink 等現代叢集運算系統中輕鬆處理任何規模的空間資料。 Sedona 開發人員可以使用Spatial SQL、Spatial Python 或Spatial R 來表達他們的空間資料處理任務。空間數據。

Sedona Ecosystem

特徵

Apache Sedona 的一些主要功能包括：

支援多種地理空間資料格式，包括 GeoJSON、WKT 和 ESRI Shapefile。
大型向量和柵格資料集的可擴展分散式處理。
用於空間索引、空間查詢和空間連接操作的工具。
與流行的地理空間 Python 工具（例如 GeoPandas）整合。
與Spark、Hadoop、Hive、Flink等流行的大數據工具集成，進行資料儲存與查詢。
一個使用者友善的 API，用於使用 SQL、Python、Scala 和 Java 語言處理地理空間資料。
靈活的部署選項，包括獨立、本地和叢集模式。

這些是 Apache Sedona 的一些關鍵功能，但它可能會根據特定版本和配置提供其他功能。

點擊並立即播放互動式 Sedona Python Jupyter Notebook！

何時使用塞多納？

使用案例：

Apache Sedona 是一種廣泛使用的空間資料處理框架，它有許多不同的用例和應用程式。 Apache Sedona 的一些主要用例包括：

汽車資料分析：Apache Sedona 廣泛用於地理空間分析應用程序，用於對從車隊收集的大型複雜資料集執行空間分析和資料探勘。
城市規劃和開發：Apache Sedona 通常用於城市規劃和開發應用程序，用於分析和視覺化與城市環境相關的空間資料集，例如土地使用、交通網絡和人口密度。
基於位置的服務：Apache Sedona 通常用於基於位置的服務，例如地圖和導航應用程序，用於處理和分析空間數據，以便為用戶提供基於位置的資訊和服務。
環境建模和分析：Apache Sedona 用於許多不同的環境建模和分析應用程序，用於處理和分析與環境因素相關的空間數據，例如空氣品質、水質和天氣模式。
災難應變與管理：Apache Sedona 用於災難應變和管理應用程序，處理和分析與洪水、地震和其他自然災害等災難相關的空間數據，以支援緊急應變和復原工作。

程式碼範例：

此範例將 AWS S3 上以 .CSV 檔案形式儲存的紐約市計程車行程記錄和計程車區域資訊載入到 Sedona 空間資料幀中。然後，它對出租車旅行資料集執行空間 SQL 查詢，以過濾掉除紐約曼哈頓地區之外的所有記錄。此範例還顯示了一個空間連接操作，該操作根據計程車行程是否位於區域的地理範圍內將計程車行程記錄與區域進行匹配。最後，最後一個程式碼片段將 Sedona 與 GeoPandas 的輸出集成，並繪製兩個資料集的空間分佈。

從 AWS S3 上儲存的 CSV 檔案載入紐約市計程車行程和計程車區域數據

 taxidf = sedona . read . format ( 'csv' ). option ( "header" , "true" ). option ( "delimiter" , "," ). load ( "s3a://your-directory/data/nyc-taxi-data.csv" )
taxidf = taxidf . selectExpr ( 'ST_Point(CAST(Start_Lon AS Decimal(24,20)), CAST(Start_Lat AS Decimal(24,20))) AS pickup' , 'Trip_Pickup_DateTime' , 'Payment_Type' , 'Fare_Amt' )

 zoneDf = sedona . read . format ( 'csv' ). option ( "delimiter" , "," ). load ( "s3a://your-directory/data/TIGER2018_ZCTA5.csv" )
zoneDf = zoneDf . selectExpr ( 'ST_GeomFromWKT(_c0) as zone' , '_c1 as zipcode' )

空間 SQL 查詢僅傳回曼哈頓的計程車行程

 taxidf_mhtn = taxidf . where ( 'ST_Contains(ST_PolygonFromEnvelope(-74.01,40.73,-73.93,40.79), pickup)' )

計程車資料框和區域資料框之間的空間連接以查找每個區域中的計程車

 taxiVsZone = sedona . sql ( 'SELECT zone, zipcode, pickup, Fare_Amt FROM zoneDf, taxiDf WHERE ST_Contains(zone, pickup)' )

使用 GeoPandas 顯示載入的空間資料幀的地圖

 zoneGpd = gpd . GeoDataFrame ( zoneDf . toPandas (), geometry = "zone" )
taxiGpd = gpd . GeoDataFrame ( taxidf . toPandas (), geometry = "pickup" )

zone = zoneGpd . plot ( color = 'yellow' , edgecolor = 'black' , zorder = 1 )
zone . set_xlabel ( 'Longitude (degrees)' )
zone . set_ylabel ( 'Latitude (degrees)' )

zone . set_xlim ( - 74.1 , - 73.8 )
zone . set_ylim ( 40.65 , 40.9 )

taxi = taxiGpd . plot ( ax = zone , alpha = 0.01 , color = 'red' , zorder = 3 )

Docker映像

我們為 Apache Sedona 提供了一個帶有 Python JupyterLab 和單節點叢集的 Docker 映像。這些映像可在 DockerHub 上取得

建設塞多納

要安裝 Python 套件：
```
 pip install apache-sedona
```
編譯原始碼請參考Sedona網站
原始碼中的模組

姓名	應用程式介面	介紹
常見的	爪哇	核心幾何運算邏輯、序列化、索引
火花	Spark RDD/DataFrame Scala/Java/SQL	Apache Spark 上的分散式地理空間資料處理
弗林克	Scala/Java/SQL 中的 Flink DataStream/Table	Apache Flink 上的分散式地理空間資料處理
雪花	雪花SQL	Snowflake 上的分散式地理空間資料處理
火花陰影	沒有原始碼	Sedona Spark 的遮光罐
flink-shaded	沒有原始碼	Sedona Flink 的陰影罐子
雪花測試儀	爪哇	Sedona Snowflake 的測試程序
Python	Spark RDD/DataFrame Python	Apache Spark 上的分散式地理空間資料處理
右	R 中的 Spark RDD/DataFrame	Sedona 的 R 包裝
齊柏林飛船	阿帕契齊柏林飛艇	Apache Zeppelin 0.8.1+ 插件