近日,国际顶级数据库学术会议 VLDB 2022 在澳大利亚悉尼举办。阿里云与达摩院空天数据库引擎团队有关 Ganos 的两项研发成果被 VLDB 2022 收录。

VLDB 与 SIGMOD、ICDE 并称为数据库业界的三大顶级学术会议,收录全球研究机构以及科技企业在数据库领域最前沿、最顶级的研究成果。数据库作为核心基础软件,是底层硬件基础资源与上层应用系统之间的重要桥梁。Ganos 率先借助云原生能力研究大规模 3D 场景和移动对象轨迹的 In-database 空间计算,研发成果在 VLDB 的发表,揭开了数据库基础软件在数字孪生 3D 空间计算方向上的崭新篇章。

将现实世界放进数据库

数字孪生,是指利用物理模型、传感器更新、仿真模拟等技术完成现实世界到虚拟世界的映射。简而言之,就是创造现实世界的数字克隆体,并把它放到计算机管理起来。和传统计算机辅助设计(CAD)不同,这个数字克隆体是会“动”的,发生在现实世界中的变化会实时地反映到数字克隆体上。作为一个新兴技术,数字孪生还有很多的挑战亟待解决,比如用什么模型来表示现实世界的物体、如何存储数字克隆体、如何支持高效的查询和数据更新等。

随着智能城市和数字孪生技术的结合,快速分析与处理大规模的多维、动态、场景化空间数据已构成挑战。例如,建筑的精细化 BIM 模型数据、网联汽车产生的大量动态轨迹数据,无人机拍摄的实景三维数据等。传统数据库能良好处理整数、浮点数、文本等各种常规数据类型,但如何把一幢摩天大楼数字化后放进数据库?如何对城市中的各类移动车辆的动态数据进行有效管理仍然存在诸多挑战。这种以人、车、建筑等复杂单体(静态或动态)及其动态交互为处理对象的新型数据库需要数据库处理模式的变革,也需很大程度上依赖云算力的极致发挥。

Ganos 团队通过阿里巴巴达摩院数据库与存储实验室的关键技术突破,并借助阿里云的技术转化,在解决数字孪生背景下如何在数据库中表示和存储现实世界的数字克隆,并支持高效的查询与分析计算问题上实现了阶段性的重要突破。

成果简介

主论文《Ganos: A Multidimensional, Dynamic, and Scene-Oriented Cloud-Native Spatial Database Engine》为阿里云和达摩院的独立研究,分析了数字孪生新技术浪潮背景下,多维、动态、场景化新型空间多模态数据的挑战,介绍了 Ganos 在云原生关系型数据库 PolarDB for PostgreSQL 上的实现,包括应用背景、系统架构、支持的数据类型、低成本高可用性扩展存储机制以及多级并行查询等技术。Ganos 加持 PolarDB 数据库,使之成为业界首个具备数字孪生空间计算,且最早系统性支持移动对象和 3D 场景数据处理能力的云原生数据库。

论文阐述的主要技术创新包括:

  • 对多维、动态、场景化数据提供数据库原生支持。Ganos 将多维、动态、场景化数据视为数据库首等公民,提供 3DMesh、Trajectory、Raster、PointCloud 等新型数据类型与模型体系、多维索引访问方法以及空间查询、时空查询、面向场景查询和跨模态查询复杂能力。
  • 低成本高可用性扩展存储机制。Ganos利用云原生对象存储服务(OSS)大容量、低成本、高可用特性实现了一套扩展存储机制,在保证查询效率的同时大幅扩展了存储容量,并降低了存储成本。
  • 空间多级并行查询处理机制。针对数字孪生场景多维复杂查询耗时长的难题,Ganos 结合 PolarDB 共享存储、存计分离云原生架构特性,创新提出了面向空间计算的多级并行查询处理框架,相较于已有并行机制实现高达一倍以上的性能提升。

与此同时,针对百亿级超大规模轨迹数据的处理,Ganos 团队与皇家墨尔本理工大学(RMIT)合作,在本次 VLDB 大会上联合发表了论文《VRE: A Versatile, Robust, And Economical Trajectory Data System》。论文介绍了功能丰富、强鲁棒性、低成本的大规模弹性轨迹系统VRE的系统设计,而该系统正是阿里云多模数据库 Lindorm 时空轨迹处理系统的原型。论文阐述了 VRE 的系统架构、轨迹分段模型、时空索引机制以及两阶段查询处理框架等技术。

VRE 系统架构

VRE 系统(Lindorm Ganos 原型)的功能特性和主要技术创新为:

  • 覆盖丰富的轨迹查询。结合阿里巴巴的实际应用需求,VRE 首个全面支持了 ID 时间查询、空间范围查询、时空范围查询等基础查询,以及近似轨迹搜索、近似轨迹连接、子轨迹近似搜索等高级查询,并且同时支持 Fréchet、Hausdorff、 DTW、 LCSS 和 EDR距离度量。
  • 高效存储和索引机制。VRE 提出了新的轨迹分段模型,在存储成本和过滤性能两方面的综合性能明显优于传统的以轨迹为单位的存储模型以及以轨迹点为单位的存储模型。同时,针对各类查询实现了不同的索引结构,显著提升了查询性能。
  • 两阶段查询处理框架。VRE 采用了两阶段查询处理框架,在第一阶段仅使用数据规模小的轨迹元数据进行过滤操作,在第二阶段只对第一阶段无法过滤掉的轨迹数据才读取完整的轨迹做检查。将过滤操作下推到存储层,大幅减少了数据传输开销和查询效率。
  • 优异的性能。实验表明,VRE 在存储开销和查询效率方面都表现优异,和现有方法相比,可以实现 1/3 的存储开销以及高达 10 倍以上的典型查询效率提升。

行业应用

从实验室到使能百业,Ganos 在快速迭代进化。Ganos 解决了传统位置多模态大数据使用流程复杂、使用门槛高、应用效率低等问题,实现了位置智能服务的普惠计算,目标使能千行百业。据不完全统计,云上 Ganos 引擎被创建次数达到 3 万 6 千多次,目前已应用到航空航天、自然资源、共享出行、灾害应急、交通物流、远程银行、农业/海洋/水利以及社交/健身/O2O 等总计 45 个不同行业/应用方向。

数据库数字孪生技术获突破,Ganos两项研究成果入选VLDB

数据库数字孪生技术获突破,Ganos两项研究成果入选VLDB相关推荐

  1. 数字孪生技术在工业制造领域的研究与实践

    随着物理世界和虚拟世界之间深度融合的技术条件日趋成熟,数字孪生作为突破性的应用技术框架,将会成为实现CPS乃至智能制造的基础,值得深入.全面地研究其内在机理和应用模式. 数字孪生技术在工业制造领域开始 ...

  2. 7.07亿TPC-C背后的技术突破,OceanBase研究成果入选VLDB

    近日,国际顶级数据库学术会议 VLDB 2022 在澳大利亚悉尼开幕.OceanBase 研究成果论文"OceanBase: A 707 Million tpmC Distributed R ...

  3. 数字孪生技术研究综述

    一.中文摘要 数字孪生作为实现数字化.智能化.服务化等先进理念的重要使能技术,当前备受学术界和工业界关注.模型是数字孪生的基础和核心,而传统数字孪生三维模型已无法满足现阶段技术发展与应用需求.本文基于 ...

  4. 数字孪生技术在自动驾驶测试领域的应用研究概述

    来源:汽车测试网 作者:王庆涛 周正等 摘 要: 研究数字孪生技术在自动驾驶测试领域的应用.旨在构建高度开放的数字孪生自动驾驶测试平台,结合仿真测试工具.通信设备.真实测试车辆等功能单元,形成丰富的测 ...

  5. 关于数字孪生技术国家政策及发展趋势

    引言 数字孪生技术作为新型智慧城市建设的创新引领性技术,有利于打造孪生城市运行空间,强化城市大脑基础能力,实现全域时空数据融合.数字孪生技术在推动智慧城市建设方面的作用已越来越受到重视.2021年3月 ...

  6. 基于数字孪生技术浅谈智慧园区的构建及其发展

    1 智慧园区概述 智慧园区是融合新一代信息.数字孪生.物联网与通讯(ICT)技术,具备迅捷的信息采集.高速的信息传输.高度集中的计算.智能事务处理和无所不在的服务提供能力,实现园区内及时.互动.整合的 ...

  7. 数字孪生技术最新八大应用实践方向

    对于很多人来说,数字孪生这个热词好像是一夜到来的,但是对于从业者来说,他们其实已经以目标和需求为导向,在那些需要数字孪生的领域扎根已久,而且相关实践和落地已经日渐成熟.今天,就来列举数字孪生技术走进现 ...

  8. 数字孪生技术,可视化系统?

    数字孪生可视化技术为5G.人工智能.大数据.云计算等信息经济提供基础设施;二是电子化.智能化改造传统基础设施;三是发展新能源.新材料的配套应用设施;四是城际高速铁路等补短板基建. 数字孪生白皮书 数字 ...

  9. 数字孪生技术如何实现复制世界?关键的关键是…

    摘要:庞杂的系统中,保证业务稳定运行,提高运维效率,降低能耗都是数据中心面临的挑战. 一.数据成为当今主要生产力 2020胡润世界500强榜数据显示:苹果公司以近14万亿人民币的市值成了世界上最具价值 ...

最新文章

  1. 神盾特工hive_周末剧透:杰西卡·琼斯、黑名单、时空守卫等
  2. 在Windows Server 2008上创建 简单卷
  3. 【MM模块】 Blanket PO 框架订单
  4. 物理设计-数据类型的选择
  5. SAP C4C Adapt menu debugging
  6. Ant Design Blazor 组件库的路由复用多标签页介绍
  7. HBase错误解决(启动Hbase出现错误的替换,启动hbase shell出现ERROR KeeperErrorCode=NoNode for /hbase/master)
  8. 歪门邪道破解Flash-SWF to AVI GIF Converter
  9. Maven安装与配置(详细步骤)
  10. PID控制器开发笔记之十二:模糊PID控制器的实现
  11. 有一种努力叫“凌晨四点”
  12. 处理器仿存带宽_存储系统性能 - 带宽计算
  13. 段誉和男人们的普遍困境
  14. c语言程序设计 大学考试题库,广东工业大学《C语言程序设计》考试复习重点题库.pdf...
  15. 【OS学习笔记】二十五 保护模式七:任务和特权级保护对应的汇编源代码
  16. 3dmax 计算机中丢失,3ds Max文件损坏或丢失怎么办?
  17. 智能家具N种WIFI密码设置方法
  18. IntelliJ IDEA 之 配置JDK 的 4种方式
  19. 地图APP的产品分析-驴迹导游
  20. 17.你知道哪些设计模式,它们在JDK源码中是怎么体现的

热门文章

  1. 文件处理命令(二)目录处理命令
  2. 姚重华曾获得过计算机领域最高的奖项图灵奖,微软研究员泰克获计算领域最高奖项图灵奖...
  3. 15分钟了解TiDB
  4. ARM AArch32和AArch64通用寄存器、状态寄存器
  5. 【硬核】 ROS Navigation 局部路径规划常见算法
  6. ETF操作实战记录:2022-2-22
  7. JavaScript之DOM对象
  8. c# rc4算法,加密解密类
  9. html/css导入自己的字体样式
  10. 什么是 Web 3.0?定义、功能和示例