Apache Sedona(孵化)是一个用于处理大规模空间数据的集群计算系统。Sedona扩展了Apache Spark / SparkSQL,提供了一套开箱即用的空间弹性分布式数据集/ SpatialSQL,可以跨机器有效地加载、处理和分析大规模空间数据。
使用Maven和SBT在5分钟内设置Scala和Java API。
Python和R API也可

系统架构

Apache Sedona是基于geospark改造的高可用的分布式处理平台,属于商业专项孵化项目。

学习网站链接:

Overview - Apache Sedona™ (incubating)

github源码

https://github.com/apache/incubator-sedona/

Aapche Sedona具有以下优点:

高速
根据我们的基准和第三方研究论文,在计算密集型查询负载上,Sedona的运行速度比其他基于spark的地理空间数据系统快2X - 10X。

图 1 多边形连接面图形时间消耗情况

低内存消耗
根据我们的基准和第三方研究论文,对于大规模内存查询处理,Sedona比其他基于spark的地理空间数据系统的峰值内存消耗少50%。以在PyPi和CRAN上使用。

图2 多边形空间连接的最大内存消耗

易用性
Sedona提供Scala、Java、Python和Spatial SQL api,并小心地将它们集成到Apache Spark中。您可以简单地创建空间分析和数据挖掘应用程序并在任何Spark环境中运行它们。

Apache Sedona相关推荐

  1. Apache Sedona(GeoSpark) spatial join 源码解析

    文章目录 Apache Sedona(GeoSpark) Spatial Join Range join Distance join 源码解析 SedonSQLRegistrator.register ...

  2. Apache Sedona 常见问题解答 (FAQ)

    Apache Sedona是一个分布式空间分析平台,提供在分布式计算环境中处理地理空间数据的工具.它是 Apache 软件基金会的一个开源项目.Apache Sedona 提供用于使用 Scala.J ...

  3. 使用 Apache Spark 和 Apache Sedona 的地理空间流简介

    使用 Apache Spark 和 Apache Sedona 的地理空间流简介 如今,我们正在生成越来越多的地理空间数据.许多公司都在努力分析和处理此类数据,其中很多数据来自物联网设备.自动驾驶汽车 ...

  4. 空间数据计算引擎GeoSpark调研

    什么是空间数据 空间数据(Spatial Data) 空间数据又称几何数据,它用来表示物体的位置.形态.大小分布等各方面的信息,是对 现实世界中存在的具有定位意义的事物和现象的定量描述.根据在计算机系 ...

  5. 空间大数据相关的技术

    编者荐语: 以前推过GeoSpark,现在已经被Apache孵化了,叫做Sedona,请做空间大数据的同学,不要放过,好好拉练拉练--另外,有写关于Sedona的,欢迎投稿和公众号互白. 以下文章来源 ...

  6. Docker安装Apache与运行简单的web服务——httpd helloworld

    Docker运行简单的web服务--httpd helloworld目录[阅读时间:约5分钟] 一.Docker简介 二.Docker的安装与配置[CentOS环境] 三.Docker运行简单的web ...

  7. Apache Maven 安装与配置-修改源

    Maven配置,强大的Java包管理器 Maven介绍 Apache Maven 下载 Apache Maven 安装 要求 启动 解压到适当的文件夹 添加环境变量 修改配置 启动测试 Maven介绍 ...

  8. debian10 简单的bash脚本监控apache运行状态

    需求: 在Rserver上编写脚本监控公司的网站运行情况: 脚本可以在后台持续运行: 每隔3S检查一次网站的运行状态,如果发现异常尝试3次: 如果确定网站无法访问,则返回用户"网站正在维护中 ...

  9. Apache POI:解决数据库和Excel之间相互转换的烦恼~

    目录 引言 一.简介 二.POI-Excel 写 1.创建项目 2.引入依赖 3.步骤 1. 创建工作簿 2. 创建工作表 3. 创建行 4. 创建单元格 5. 单元格中填入数据 6. 通过IO流生成 ...

最新文章

  1. Android菜单详解——理解android中的Menu
  2. 六级单词pdf_雅思提高词汇量是背单词还是大量刷题
  3. easyPR源码解析之plate_judge.h
  4. Spring Data说明
  5. SAP License:SAP ECC6安装系列一:安装前硬件和软件准备
  6. turtle画动态时钟
  7. IT公司内推 互联网内推 bat内推
  8. 检索报告计算机类,计算机检索报告.docx
  9. Random Walk 随机游走算法
  10. shader拖尾_插件(一)武器拖尾效果
  11. Nim博弈和威佐夫博弈 Return of the Nim
  12. mac 爱普生打印机驱动_epson lq630k mac驱动下载
  13. 基于AndroidStudio员工绩效考核评价系统app设计
  14. 买天猫网店转让怎么变更资料
  15. 互联网信息服务业务icp许可证年审来了
  16. Pyqt5+python2.7 美观的登陆界面制作(二)
  17. python提取视频字幕_GitHub - jiulinxiri/video-timeline-and-subtitle-extract: 视频时间轴及字幕提取...
  18. BZOJ2687 交与并/BZOJ2369 区间【决策单调性优化DP】【分治】
  19. 2022年制冷与空调设备运行操作考试模拟100题及在线模拟考试
  20. Android源码解析触碰机制

热门文章

  1. Lorenz系统的MATLAB/Simulink建模
  2. xp系统web服务器不可用,WindowsXP系统无法使用火狐浏览器访问网页?教你解决方法...
  3. 2017秋 《高级软件工程》学习总结
  4. 免费图标查询、下载的网站
  5. 对超宽输入范围DC/DC转换器的需求
  6. 耐人寻味的 for...else...语句
  7. 计算机控制技术试题a卷,计算机控制技术试题试卷及参考答案
  8. 别再吐槽大学教材了,来看看这些网友强推的神作!
  9. DELL服务器iDRAC批量管理工具介绍——RACADM
  10. 自媒体中短视频流量主广告小程序开发