简介:本篇内容为2021云栖大会-企业级云原生数据库最佳实践论坛中,阿里云数据库事业部资深技术专家、生态工具产品部负责人 陈长城关于“一站式在线数据管理平台DMS技术解读”的分享。

本篇内容将从3个部分为读者介绍一站式在线数据管理平台DMS,希望通过一站式数据管理理念,让企业敏捷建仓,通过低门槛数据开发快速发挥数据价值,欢迎大家使用和体验。

Ÿ

  • 企业数据管理的痛点
  • 云原生2.0一站式数据管理DMS
  • 解决方案与最佳实践

一、企业数据管理的痛点

1) 数字化转型是企业发展的战略重点

在国家提出供给侧改革的形式下,企业在发展过程中,很多行业不断往头部集中,我们看到最近的经济报告,中国数字经济的GDP的占比逐年上升,企业自身也存在经营效益提升的诉求,因此在政策的导向和企业诉求的双轮驱动下,数字化转型也在快速推进。

2) 数据在业务中的全生命周期

在整个业务发展过程中数据的生命周期是从生产到存储、处理、分析、应用的一连串流程。企业内部多个业务会根据自身特点使用不一样的数据库,导致数据库使用类型非常多,而数据仓库也是独立建设为主,在企业内部系统中就会存在多种不同的数据存储系统和数据平台。今天非常缺乏覆盖数据生命周期的一站式管理平台,同时为了让这些数据统一管理,实时数据趋势成为未来的大趋势,有预测2025年新业务的实时数据占比会达到50%以上。

3) 企业数据价值化过程中遇到的痛点

企业内部有特别多种类的数据构成的数据孤岛、数据加工链路复杂、数据治理和安全管理困难,都成为发挥数据价值的痛点。

二、云原生2.0一站式数据管理DMS

1) 数据管理服务DMS

如何进行数据的统一安全管理,更快发挥数据价值? 在此背景下我们提出一站式数据管理平台,一站式数据管理平台DMS把企业数据资产统一串联起来,通过底层对接所有异构数据源统一管理起来,再从数据的生产端进行切入,从数据库的设计、开发、应用、发布,到数仓构建和数据服务,建设成覆盖数据生命周期的统一平台。通过这个方式,企业数据管理生命周期就能全部串联起来。这是非常新的理念,让企业在线数据处理和分析的整个周期都串联起来。

DMS产品在阿里集团内部沉淀了12年以上,我们从数据管理、数据安全、数据库的DevOps,数据传输这些底层基础建设逐步把数据生命周期全覆盖。

2) 一站式数据管理DMS 技术架构

技术架构主要有三层:

  • 底层基础服务是构建全域统一的数据资产、开发运维体系和安全管理体系;
  • 中间是控制平面和数据平面的支撑引擎,控制平面是面向数据安全和数据库DevOps场景的支撑引擎,比如工单执行引擎、安全规则引擎和稳定变更引擎;数据平面包括数据全量传输、增量以及ETL处理和转换的算子,包括联邦查询的多源异构统一查询处理,这些都是数据平面的引擎。
  • 最上面是面向各场景的业务功能,支撑数据安全、数据库DevOps、数据集成与开发,通过对这些场景的支持形成一站式全链路数据生命周期管理。

Ÿ   接下来展开介绍一下DMS的三个部分核心特性。

3) DMS核心技术特性

数据管理DMS-数据资产与安全

数据资产是把全域数据统一管理起来,让企业快速知道有哪些数据,数据在哪里,数据治理情况,方便发挥数据价值。这里介绍两个技术点:

一个技术是知识图谱构建,将多源异构的物理元数据和相关业务逻辑对应起来。通过对元数据定义和语义学习到字段关联关系,结合在我们平台使用过程中工单系统人和数据的关系,形成构建数据图谱的输入,把数据汇集起来后构建成全域数据资产的关系图谱,让数据工程师进行低门槛数据的建仓,他可以通过指定几个核心业务字段,系统结合关联关系自动构建数仓宽表,帮助低门槛建仓和全域所有数据质量的实施。

在数据安全方面,我们支持包括GDPR在内的五个以上数据安全法案,让企业在选择数据安全法案后,可以分级分类进行敏感数据的识别。在数据生命周期的数据生产、数据集成、数据开发、价值挖掘过程,数据脱敏都会贯穿其中,支持15种以上的数据脱敏。

DevSecOps在云上有10万以上的开发者和活跃的用户。平台提供非常多数据库开发者工具集,基于这些开发者工具,将数据变更,库表设计DDL与安全规则引擎结合,使企业通过DevSecOps在保障安全下最大化释放业务开发人员的工作效率,让他们自主进行数据库的库表设计和变更发布。

安全规则引擎内置200多个安全规则模板,不同数据库引擎有不同的最佳实践,企业可以根据模板定义合适的安全规则,以操作人、数据库对象、具体操行为三者作为因子定义规范的规则。比如数据一次订正的数量,一次查询的数量,人员的字段访问权限,都是基于安全引擎设计的。

变更安全是对DevSecOps研发自主的变更动作进行保障和兜底,比如在做大批量数据操作的时候会切成多次小批量操作,有锁变更自动变成无锁变更。通过研发设计安全规则检测和拦截的规范让变更安全可靠,把这些能力释放给企业开发人员,能提高自主研发迭代的效率。

企业数字化转型面临的问题是如何进行统一数据集成和发挥数据价值,我们希望通过流批一体数据集成和低代码开发能力给到开发者便捷的体验。

数据底层的核心链路是基于DTS产品实时异构的数据传输能力,在数据迁移、同步、订阅方面有比较成熟的沉淀。

在传输链路内部实现AnyToAny的技术架构后,新数据源作为一个插件,快速跟原有的多种异构数据源进行实时打通。同时对非结构化数据可通过语义识别和类型映射,进行结构化入库后的价值挖掘。

在内部构建数据流批一体的集成链路后,通过统一的内存转换模块,支持用户自定义算子和脱敏算法,流和批的数据只要经过一次定义就能实现一致转换,所有的全量数据初始化都复用转化逻辑。在DMS进行建仓,链路自动把表结构自动在目标进行初始化,全量数据和增量数据迁过去,中间的转化只要做一次定义。在源端进行数据库切换或DDL变更都可以无缝将源端变更同步到目标数仓,实现库仓一体的技术架构。内置100多个数据转化的算子使用户数据的链路极大收敛,使整个链路更加稳定,极大简化了数据链路的运维成本。

在实现数据集成后,通过拖拉拽的方式,使数据源、跨库查询引擎和数据传输链路的流和批都能作为操作节点,让用户用自主定义数据加工流程,通过运维工具、安全管理和统一治理的能力能让企业进行批量生产任务创建。

三、解决方案与最佳实践

1) 某金融基于DMS+RDS构建数据安全生产方案

该金融公司基于DMS+RDS构建的数据安全生产方案。企业内部有600多个数据库实例,面向非常多的前线业务开发者,业务开发要做变更发布和数据库操作的时候,沟通问题、数据安全问题和效率问题通过DMS管理数据源、提供统一数据安全变更使得前端业务开发效率提升,同时数据安全和变更稳定性得到保障。

2) 某运营商基于DMS+PolarDB-X构建异地多活

上图是运营商通过DMS和Polar DB-X构建异地多活解决方案。传统数据库的灾备机房基础设施投入无法承担业务流量,或者只能承担有限的业务流量。这些基础设施投入很难发挥价值,导致运营商物理机房电力限制,无法支撑业务更大发展。通过DMS+PolarDB-X帮助升级为异地多活架构,实现了容灾快速切换,同时承担了业务流量,满足了业务拓展诉求。

3)全球多活数据库

由于很多企业对异地多活架构有很强的诉求,本次我们发布RDS全球多活数据库,通过RDS控制台可一键购买全球多活数据库,自动创建多个数据中心的RDS并完成架构搭建,通过多活接口让业务切流变得更简单,降低企业异地多活的实施成本和管理复杂度。

4)某银行基于DMS+ADB构建T+1的数据仓库

上图是某银行案例,基于DMS+ADB构建T+1的数据仓库。该企业周期性数据批量集成导致生产库出现大的业务负载,影响业务稳定性,定时报表无法支撑业务活动的实时决策。基于这样的痛点,我们构建T+1的数据仓库,拉链表对源库生产影响很小,第一次进行全量后都是增量的实时数据,通过定时合并产出周期性报表,在活动时基于ADB实时产生生产报表,而且通过在本地进行构建还能回溯任意时间点的历史数据快照,帮助企业同时解决了定时报表和实时分析的诉求。

原文链接:https://developer.aliyun.com/article/804265?

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

前沿分享|阿里云数据库事业部资深技术专家、生态工具产品部负责人 陈长城:一站式在线数据管理平台DMS技术解读相关推荐

  1. 前沿分享|阿里云数据库解决方案资深专家 李圣陶:云原生数据库解决方案 加速企业国产化升级

    简介: 本篇内容为2021云栖大会-企业级云原生数据库最佳实践论坛中,阿里云数据库解决方案资深专家 李圣陶关于"云原生数据库解决方案 加速企业国产化升级"的分享. 本文从几大视角来 ...

  2. 媒体声音|阿里云数据库:一站式全链路数据管理与服务,引领云原生2.0时代

    简介:引领云原生数据库技术持续创新 这几年,云原生已成为阿里云的另一个标签,不仅最早布局云原生技术,拥有大量客户实践,更打造出丰富的云原生产品家族.尤其是数据库产品线,已进入云原生2.0阶段,通过全链 ...

  3. 阿里云数据库:一站式全链路数据管理与服务,引领云原生2.0时代

    这几年,云原生已成为阿里云的另一个标签,不仅最早布局云原生技术,拥有大量客户实践,更打造出丰富的云原生产品家族.尤其是数据库产品线,已进入云原生2.0阶段,通过全链路的技术支撑能力,奔向更远的星辰大海 ...

  4. 阿里云数据库云栖亮剑,一场立体化竞争已经打响

    在数据库领域,存在一种声音,未来将属于云数据库的天下. 两个事实可以简单佐证一下:一是甲骨文这样全球性领先数据库厂商,在云业务方面的转型十分努力,并且从财报可以看到甲骨文云的收入已经占比越来越高,其中 ...

  5. 阿里云数据库再获学术顶会认可,一文全览VLDB最新亮点

    一年一度的数据库领域顶级会议VLDB 2019于当地时间8月26日-8月30日在洛杉矶圆满落幕.在本届大会上,阿里云数据库产品团队浓墨登场,不仅有多篇论文入选Research Track和Indust ...

  6. 媒体声音 | 阿里云王伟民:阿里云数据库的策略与思考

    简介: DTCC 2021大会上,阿里云数据库事业部 产品与解决方案部总经理 王伟民(花名:唯敏)发表主题演讲<云原生数据库2.0,一站式全链路数据管理与服务>,并接受IT168企业级&a ...

  7. 阿里云数据库四位小伙伴聚齐!共同开启生态合作新篇章!

    随着用户的不断扩大,阿里云数据库能够帮助用户节省大量的基础运维工作,但是基于数据库业务侧的诊断.调优.护航等工作也是必不可少的.为了满足更多的市场需求,阿里云数据库团队发起数据库合作计划,招募具备优秀 ...

  8. 前沿分享|阿里云数据库资深技术专家 姚奕玮:AnalyticDB MySQL离在线一体化技术揭秘

    简介:本篇内容为2021云栖大会-云原生数据仓库AnalyticDB技术与实践峰会分论坛中,阿里云数据库资深技术专家 姚奕玮关于"AnalyticDB MySQL离在线一体化技术揭秘&quo ...

  9. 前沿分享|阿里云数据库高级技术专家 宋利兵:阿里云企业级自治数据库RDS详解

    简介:本篇内容为2021云栖大会-企业级云原生数据库最佳实践论坛中,阿里云数据库高级技术专家 宋利兵关于"阿里云企业级自治数据库RDS详解"的分享. 本文将从2方面为大家介绍企业级 ...

最新文章

  1. canvas java 上传截图_在Vue项目中使用html2canvas生成页面截图并上传
  2. 信息化监理公司的所有问题归到底是人的使用和管理
  3. 2193亿,长沙雨花GDP成为中西部区县第一是如何做到的?
  4. 机智云小程序启蒙:WebSocket网页控制
  5. Thonny -- 简洁的 python 轻量级 IDE
  6. JQ ajax解决跨域
  7. java asc码_Java中ASC码与字符互相转化
  8. 小程序使用css变量,小程序使用css变量实现“换肤”方案
  9. Mac下mysql登陆问题
  10. 新中大怎么修改服务器,新中大如何修改服务器地址
  11. 蚂蚁课堂视频笔记思维导图-3期 三、性能优化专题
  12. session Asii码转换
  13. 计算机在英语教学中的应用课题,浅谈信息技术在英语教学中的应用
  14. Dubbo的介绍以及Dubbox的区别
  15. 在 LaTeX 中创建文档
  16. Vi/vim编辑文件无法保存和退出的解决方法
  17. 微信小程序 特殊布局下,页面上拉触底事件onReachBottom无法触发解决方法
  18. EasyX全部函数及使用
  19. Podman 入门指南
  20. Android体系结构

热门文章

  1. fusioncharts java_FusionCharts 导出图片实例 java版 | 学步园
  2. python的练习题:1-100奇数求和(涉及匿名函数filter lambda 的使用)
  3. embed 标签显示PDF, 并隐藏下载打印按钮
  4. MongoDB详解,用心看这篇就够了【重点】
  5. 其他一些开发中遇到的问题
  6. java项目-第73期基于ssm的汽车出租租赁系统
  7. ![CDATA[ ]
  8. 【C++】HelloWorld
  9. “2018可信区块链峰会”8大分论坛精彩提要!
  10. 如何对seaborn.heatmap进行调色?cmap色彩配置大全