Скачать статистику | Мавен | ПиПИ | Конда-фордж | КРАН | DockerHub |
---|---|---|---|---|---|
Апач Седона | 225 тысяч в месяц | ||||
Архивные выпуски GeoSpark | 10 тысяч в месяц |
Следите за новостями Седоны в Твиттере: Sedona@Twitter
Присоединяйтесь к сообществу Sedona Discord:
Присоединяйтесь к ежемесячным часам работы сообщества Sedona: Календарь Google, по вторникам с 8:00 до 9:00 по тихоокеанскому времени, каждые 4 недели.
Sedona JIRA: ошибки, запросы на извлечение и другие подобные проблемы
Списки рассылки Sedona: [email protected]: разработка проектов, общие вопросы или учебные пособия.
Apache Sedona™ — это механизм пространственных вычислений, который позволяет разработчикам легко обрабатывать пространственные данные в любом масштабе в современных кластерных вычислительных системах, таких как Apache Spark и Apache Flink. Разработчики Sedona могут выражать свои задачи по обработке пространственных данных с помощью Spatial SQL, Spatial Python или Spatial R. Внутри Sedona обеспечивает загрузку, индексирование, секционирование пространственных данных, а также функции обработки/оптимизации запросов, которые позволяют пользователям эффективно анализировать пространственные данные в любом масштабе.
Некоторые из ключевых особенностей Apache Sedona включают в себя:
Это некоторые из ключевых функций Apache Sedona, но в зависимости от конкретной версии и конфигурации он может предлагать дополнительные возможности.
Нажмите и сразу же начните играть в интерактивный блокнот Sedona Python Jupyter!
Apache Sedona — это широко используемая платформа для работы с пространственными данными, имеющая множество различных вариантов использования и приложений. Некоторые из основных вариантов использования Apache Sedona включают в себя:
В этом примере загружаются записи о поездках на такси по Нью-Йорку и информация о зонах такси, хранящаяся в виде файлов .CSV на AWS S3, в пространственные кадры данных Sedona. Затем он выполняет пространственный SQL-запрос к наборам данных о поездках на такси, чтобы отфильтровать все записи, кроме тех, которые находятся в районе Манхэттена в Нью-Йорке. В примере также показана операция пространственного соединения, которая сопоставляет записи о поездках на такси с зонами в зависимости от того, находится ли поездка на такси в пределах географических границ зоны. Наконец, последний фрагмент кода объединяет выходные данные Sedona с GeoPandas и отображает пространственное распределение обоих наборов данных.
taxidf = sedona . read . format ( 'csv' ). option ( "header" , "true" ). option ( "delimiter" , "," ). load ( "s3a://your-directory/data/nyc-taxi-data.csv" )
taxidf = taxidf . selectExpr ( 'ST_Point(CAST(Start_Lon AS Decimal(24,20)), CAST(Start_Lat AS Decimal(24,20))) AS pickup' , 'Trip_Pickup_DateTime' , 'Payment_Type' , 'Fare_Amt' )
zoneDf = sedona . read . format ( 'csv' ). option ( "delimiter" , "," ). load ( "s3a://your-directory/data/TIGER2018_ZCTA5.csv" )
zoneDf = zoneDf . selectExpr ( 'ST_GeomFromWKT(_c0) as zone' , '_c1 as zipcode' )
taxidf_mhtn = taxidf . where ( 'ST_Contains(ST_PolygonFromEnvelope(-74.01,40.73,-73.93,40.79), pickup)' )
taxiVsZone = sedona . sql ( 'SELECT zone, zipcode, pickup, Fare_Amt FROM zoneDf, taxiDf WHERE ST_Contains(zone, pickup)' )
zoneGpd = gpd . GeoDataFrame ( zoneDf . toPandas (), geometry = "zone" )
taxiGpd = gpd . GeoDataFrame ( taxidf . toPandas (), geometry = "pickup" )
zone = zoneGpd . plot ( color = 'yellow' , edgecolor = 'black' , zorder = 1 )
zone . set_xlabel ( 'Longitude (degrees)' )
zone . set_ylabel ( 'Latitude (degrees)' )
zone . set_xlim ( - 74.1 , - 73.8 )
zone . set_ylim ( 40.65 , 40.9 )
taxi = taxiGpd . plot ( ax = zone , alpha = 0.01 , color = 'red' , zorder = 3 )
Мы предоставляем образ Docker для Apache Sedona с Python JupyterLab и одноузловым кластером. Изображения доступны на DockerHub.
Чтобы установить пакет Python:
pip install apache-sedona
Чтобы скомпилировать исходный код, посетите сайт Sedona.
Модули в исходном коде
Имя | API | Введение |
---|---|---|
общий | Ява | Основная логика геометрических операций, сериализация, индекс |
искра | Spark RDD/DataFrame Scala/Java/SQL | Распределенная обработка геопространственных данных на Apache Spark |
мигать | Flink DataStream/Table в Scala/Java/SQL | Распределенная обработка геопространственных данных на Apache Flink |
снежинка | Снежинка SQL | Распределенная обработка геопространственных данных на Snowflake |
искристый | Нет исходного кода | затененная баночка для Sedona Spark |
затененный | Нет исходного кода | затененная баночка для Sedona Flink |
снежинка-тестер | Ява | программа-тестер для Sedona Snowflake |
питон | Spark RDD/DataFrame Python | Распределенная обработка геопространственных данных на Apache Spark |
Р | Spark RDD/DataFrame в R | Обертка R для Седоны |
Цеппелин | Апач Цеппелин | Плагин для Apache Zeppelin 0.8.1+ |
Пожалуйста, посетите веб-сайт Apache Sedona для получения подробной информации.