sedona下载 - sedona源代码下载

sedona

JAVA源码

Apache Sedona 1.7.0

下载

下载统计	梅文	皮伊	康达锻造	克兰	DockerHub
阿帕奇塞多纳	22.5万/月
存档的 GeoSpark 版本	1万/月

加入社区
阿帕奇塞多纳是什么？
- 特征
何时使用塞多纳？
- 使用案例
- 代码示例
Docker镜像
建设塞多纳
文档
供电

加入社区

在 Twitter 上关注 Sedona 以获取最新消息：Sedona@Twitter

加入 Sedona Discord 社区：

加入塞多纳每月社区办公时间：Google 日历，太平洋时间周二上午 8 点至上午 9 点，每 4 周一次

Sedona JIRA：错误、拉取请求和其他类似问题

Sedona 邮件列表：[email protected]：项目开发、一般问题或教程。

请先订阅，然后发布电子邮件。如需订阅，请发送电子邮件（主题和内容留空）至 [email protected]

阿帕奇塞多纳是什么？

Apache Sedona™ 是一种空间计算引擎，使开发人员能够在 Apache Spark 和 Apache Flink 等现代集群计算系统中轻松处理任何规模的空间数据。 Sedona 开发人员可以使用 Spatial SQL、Spatial Python 或 Spatial R 来表达他们的空间数据处理任务。在内部，Sedona 提供空间数据加载、索引、分区和查询处理/优化功能，使用户能够高效地分析任何规模的空间数据。

Sedona Ecosystem

特征

Apache Sedona 的一些主要功能包括：

支持多种地理空间数据格式，包括 GeoJSON、WKT 和 ESRI Shapefile。
大型矢量和栅格数据集的可扩展分布式处理。
用于空间索引、空间查询和空间连接操作的工具。
与流行的地理空间 Python 工具（例如 GeoPandas）集成。
与Spark、Hadoop、Hive、Flink等流行的大数据工具集成，进行数据存储和查询。
一个用户友好的 API，用于使用 SQL、Python、Scala 和 Java 语言处理地理空间数据。
灵活的部署选项，包括独立、本地和集群模式。

这些是 Apache Sedona 的一些关键功能，但它可能会根据特定版本和配置提供其他功能。

单击并立即播放交互式 Sedona Python Jupyter Notebook！

何时使用塞多纳？

使用案例：

Apache Sedona 是一种广泛使用的空间数据处理框架，它有许多不同的用例和应用程序。 Apache Sedona 的一些主要用例包括：

汽车数据分析：Apache Sedona 广泛用于地理空间分析应用程序，用于对从车队收集的大型复杂数据集执行空间分析和数据挖掘。
城市规划和开发：Apache Sedona 通常用于城市规划和开发应用程序，用于分析和可视化与城市环境相关的空间数据集，例如土地使用、交通网络和人口密度。
基于位置的服务：Apache Sedona 通常用于基于位置的服务，例如地图和导航应用程序，用于处理和分析空间数据，以便为用户提供基于位置的信息和服务。
环境建模和分析：Apache Sedona 用于许多不同的环境建模和分析应用程序，用于处理和分析与环境因素相关的空间数据，例如空气质量、水质和天气模式。
灾难响应和管理：Apache Sedona 用于灾难响应和管理应用程序，处理和分析与洪水、地震和其他自然灾害等灾难相关的空间数据，以支持应急响应和恢复工作。

代码示例：

此示例将 AWS S3 上以 .CSV 文件形式存储的纽约市出租车行程记录和出租车区域信息加载到 Sedona 空间数据帧中。然后，它对出租车出行数据集执行空间 SQL 查询，以过滤掉除纽约曼哈顿地区之外的所有记录。该示例还显示了一个空间连接操作，该操作根据出租车行程是否位于区域的地理范围内将出租车行程记录与区域进行匹配。最后，最后一个代码片段将 Sedona 与 GeoPandas 的输出集成，并绘制两个数据集的空间分布。

从 AWS S3 上存储的 CSV 文件加载纽约市出租车行程和出租车区域数据

 taxidf = sedona . read . format ( 'csv' ). option ( "header" , "true" ). option ( "delimiter" , "," ). load ( "s3a://your-directory/data/nyc-taxi-data.csv" )
taxidf = taxidf . selectExpr ( 'ST_Point(CAST(Start_Lon AS Decimal(24,20)), CAST(Start_Lat AS Decimal(24,20))) AS pickup' , 'Trip_Pickup_DateTime' , 'Payment_Type' , 'Fare_Amt' )

 zoneDf = sedona . read . format ( 'csv' ). option ( "delimiter" , "," ). load ( "s3a://your-directory/data/TIGER2018_ZCTA5.csv" )
zoneDf = zoneDf . selectExpr ( 'ST_GeomFromWKT(_c0) as zone' , '_c1 as zipcode' )

空间 SQL 查询仅返回曼哈顿的出租车行程

 taxidf_mhtn = taxidf . where ( 'ST_Contains(ST_PolygonFromEnvelope(-74.01,40.73,-73.93,40.79), pickup)' )

出租车数据框和区域数据框之间的空间连接以查找每个区域中的出租车

 taxiVsZone = sedona . sql ( 'SELECT zone, zipcode, pickup, Fare_Amt FROM zoneDf, taxiDf WHERE ST_Contains(zone, pickup)' )

使用 GeoPandas 显示加载的空间数据帧的地图

 zoneGpd = gpd . GeoDataFrame ( zoneDf . toPandas (), geometry = "zone" )
taxiGpd = gpd . GeoDataFrame ( taxidf . toPandas (), geometry = "pickup" )

zone = zoneGpd . plot ( color = 'yellow' , edgecolor = 'black' , zorder = 1 )
zone . set_xlabel ( 'Longitude (degrees)' )
zone . set_ylabel ( 'Latitude (degrees)' )

zone . set_xlim ( - 74.1 , - 73.8 )
zone . set_ylim ( 40.65 , 40.9 )

taxi = taxiGpd . plot ( ax = zone , alpha = 0.01 , color = 'red' , zorder = 3 )

Docker镜像

我们为 Apache Sedona 提供了一个带有 Python JupyterLab 和单节点集群的 Docker 镜像。这些图像可在 DockerHub 上获取

建设塞多纳

要安装 Python 包：
```
 pip install apache-sedona
```
编译源码请参考Sedona网站
源代码中的模块

姓名	应用程序编程接口	介绍
常见的	爪哇	核心几何运算逻辑、序列化、索引
火花	Spark RDD/DataFrame Scala/Java/SQL	Apache Spark 上的分布式地理空间数据处理
弗林克	Scala/Java/SQL 中的 Flink DataStream/Table	Apache Flink 上的分布式地理空间数据处理
雪花	雪花SQL	Snowflake 上的分布式地理空间数据处理
火花阴影	没有源代码	Sedona Spark 的遮光罐
flink-shaded	没有源代码	Sedona Flink 的阴影罐子
雪花测试仪	爪哇	Sedona Snowflake 的测试程序
Python	Spark RDD/DataFrame Python	Apache Spark 上的分布式地理空间数据处理
右	R 中的 Spark RDD/DataFrame	Sedona 的 R 包装
齐柏林飞艇	阿帕奇齐柏林飞艇	Apache Zeppelin 0.8.1+ 插件