下載統計 | 梅文 | 皮伊 | 康達鍛造 | 克蘭 | DockerHub |
---|---|---|---|---|---|
阿帕契塞多納 | 22.5萬/月 | ||||
已存檔的 GeoSpark 版本 | 1萬/月 |
在 Twitter 上關注 Sedona 以獲取最新消息:Sedona@Twitter
加入 Sedona Discord 社群:
加入塞多納每月社區辦公時間:Google 日曆,太平洋時間週二上午 8 點至上午 9 點,每 4 週一次
Sedona JIRA:錯誤、拉取請求和其他類似問題
Sedona 郵件清單:[email protected]:專案開發、一般問題或教學。
Apache Sedona™ 是一種空間運算引擎,可讓開發人員在 Apache Spark 和 Apache Flink 等現代叢集運算系統中輕鬆處理任何規模的空間資料。 Sedona 開發人員可以使用Spatial SQL、Spatial Python 或Spatial R 來表達他們的空間資料處理任務。空間數據。
Apache Sedona 的一些主要功能包括:
這些是 Apache Sedona 的一些關鍵功能,但它可能會根據特定版本和配置提供其他功能。
點擊並立即播放互動式 Sedona Python Jupyter Notebook!
Apache Sedona 是一種廣泛使用的空間資料處理框架,它有許多不同的用例和應用程式。 Apache Sedona 的一些主要用例包括:
此範例將 AWS S3 上以 .CSV 檔案形式儲存的紐約市計程車行程記錄和計程車區域資訊載入到 Sedona 空間資料幀中。然後,它對出租車旅行資料集執行空間 SQL 查詢,以過濾掉除紐約曼哈頓地區之外的所有記錄。此範例還顯示了一個空間連接操作,該操作根據計程車行程是否位於區域的地理範圍內將計程車行程記錄與區域進行匹配。最後,最後一個程式碼片段將 Sedona 與 GeoPandas 的輸出集成,並繪製兩個資料集的空間分佈。
taxidf = sedona . read . format ( 'csv' ). option ( "header" , "true" ). option ( "delimiter" , "," ). load ( "s3a://your-directory/data/nyc-taxi-data.csv" )
taxidf = taxidf . selectExpr ( 'ST_Point(CAST(Start_Lon AS Decimal(24,20)), CAST(Start_Lat AS Decimal(24,20))) AS pickup' , 'Trip_Pickup_DateTime' , 'Payment_Type' , 'Fare_Amt' )
zoneDf = sedona . read . format ( 'csv' ). option ( "delimiter" , "," ). load ( "s3a://your-directory/data/TIGER2018_ZCTA5.csv" )
zoneDf = zoneDf . selectExpr ( 'ST_GeomFromWKT(_c0) as zone' , '_c1 as zipcode' )
taxidf_mhtn = taxidf . where ( 'ST_Contains(ST_PolygonFromEnvelope(-74.01,40.73,-73.93,40.79), pickup)' )
taxiVsZone = sedona . sql ( 'SELECT zone, zipcode, pickup, Fare_Amt FROM zoneDf, taxiDf WHERE ST_Contains(zone, pickup)' )
zoneGpd = gpd . GeoDataFrame ( zoneDf . toPandas (), geometry = "zone" )
taxiGpd = gpd . GeoDataFrame ( taxidf . toPandas (), geometry = "pickup" )
zone = zoneGpd . plot ( color = 'yellow' , edgecolor = 'black' , zorder = 1 )
zone . set_xlabel ( 'Longitude (degrees)' )
zone . set_ylabel ( 'Latitude (degrees)' )
zone . set_xlim ( - 74.1 , - 73.8 )
zone . set_ylim ( 40.65 , 40.9 )
taxi = taxiGpd . plot ( ax = zone , alpha = 0.01 , color = 'red' , zorder = 3 )
我們為 Apache Sedona 提供了一個帶有 Python JupyterLab 和單節點叢集的 Docker 映像。這些映像可在 DockerHub 上取得
要安裝 Python 套件:
pip install apache-sedona
編譯原始碼請參考Sedona網站
原始碼中的模組
姓名 | 應用程式介面 | 介紹 |
---|---|---|
常見的 | 爪哇 | 核心幾何運算邏輯、序列化、索引 |
火花 | Spark RDD/DataFrame Scala/Java/SQL | Apache Spark 上的分散式地理空間資料處理 |
弗林克 | Scala/Java/SQL 中的 Flink DataStream/Table | Apache Flink 上的分散式地理空間資料處理 |
雪花 | 雪花SQL | Snowflake 上的分散式地理空間資料處理 |
火花陰影 | 沒有原始碼 | Sedona Spark 的遮光罐 |
flink-shaded | 沒有原始碼 | Sedona Flink 的陰影罐子 |
雪花測試儀 | 爪哇 | Sedona Snowflake 的測試程序 |
Python | Spark RDD/DataFrame Python | Apache Spark 上的分散式地理空間資料處理 |
右 | R 中的 Spark RDD/DataFrame | Sedona 的 R 包裝 |
齊柏林飛船 | 阿帕契齊柏林飛艇 | Apache Zeppelin 0.8.1+ 插件 |
請訪問 Apache Sedona 網站以了解詳細信息