2018云栖大会南京峰会企业级互联网架构专场,阿里巴巴高级数据架构师黄欢欢带来题为企业级数据架构探索之路的演讲。主要从企业数据库的发展现状、存在的问题以及企业级架构的需求开始谈起,针对其存在的问题提出了对应的解决方案,最后对企业级产品的架构以及满足企业及架构的需求问题做了详细的分析。
数十款阿里云产品限时折扣中,赶快点击这里,领券开始云上实践吧!
直播视频请点击
以下为精彩视频及ppt内容整理:

企业数据库现状

说起企业级数据库架构体系,在2010年阿里巴巴还没有一个完整的数据库架构体系且存在着很多问题,问题大致可以分为一下几点:

  • 业务快速发展,如何才能做到弹性扩展、且性能满足要求:单体的IOE架构已经不能满足业务快速发展的需求,所以需要我们去做弹性的扩展,也就是既可以弹性扩容也可以弹性缩容的。
  • 数据是最重要的资产,但数据孤岛却是现状:现如今应用都在做服务化,应用做服务话以后在每个地方都存在自己的数据,那么数据之间是如何流通的呢?以及怎样避免数据孤岛等问题值得思考。
  • 稳定和高可用,已经成为企业数据库系统的最大挑战:对于企业级来说,这是一个普遍的问题,数据库的稳定性、高可用性是企业级数据库最基础的一个功能。
  • 业务的多样化,单一的数据存储无法有效满足需求:我们发现业务正逐渐的多元化,单一的数据库已经不能很好的满足业务发展的需求,那么我们在统一化的支撑和个性化的支持下如何做权衡也是我们要考虑的问题。
  • 研究人员众多,数据安全、效率、规范的挑战很大。

企业级架构的基本诉求

结合以上问题,总结了企业及数据库的一些基本诉求:

1)可扩展性:可扩展性与容量的扩展并不完全相同,更多指的是架构上的可扩展以及弹性的需求。
2)稳定可靠:系统的稳定性和高可用。
3)高效:可分为两层含义理解,首先企业级架构数据库之后,我们如何高效地、自动地去运维数据库;其次,研发的人员越来越多,如何利用自己的平台去提升研发效率是我们需要考虑的问题。
4)安全:数据安全是企业的生命线,安全问题绝不能够在出现问题之后再去考虑安全问题。

如何提升系统的扩展性

提升系统扩展性或者提升系统的容量有很多方法,比如可以去做Scale Up,也可以升级数据库版本以及数据库硬件的配置,但是这是有限的。所以要进一步结合业务做一些垂直拆分,例如应用做服务化,那么商品的应用、交易的应用或者库存的应用需要拆开来,其对应的数据库也需要拆开来,这样做垂直拆分以后,对于单个应用来说我们需要做更进一步的扩展性,慢慢我们发现会遇到瓶颈,尤其是在写上面的扩展性。这时就需要做Scale Out,也就是说水平拆分线性的扩展。需要注意的是水平拆分的线性扩展不是一次性的,对系统进行扩展以后需要对弹性的缩容。

Scale Out解决方案

  • 利用DRDS进行水平拆分,线性扩展:
  • 弹性的扩容能力
  • 超高性能,满足业务极致需求
    Scale Out解决方案现在最成熟的技术就是分库分表的解决方案,当一张物理库或一张物理表已支撑不了业务写入的时候,我们就对它按照不同的维度去做水平的分库分表拆分。DRDS所做的事情就是在分库分表表的基础上,把它揉合成逻辑库和逻辑表的概念,其优势在于进行分库分表后,对于用户来说看到是还是一张逻辑库或逻辑表。

弹性扩展解决方案

  • 利用云上计算资源,轻松应对业务高峰
  • 按需使用云资源,高峰结束后快速释放
  • 一站式服务,简单易用
    SDM混合数据管控所做的事情就是实现一键的数据库弹到云上去,之后做一个云上与云下混合的数据库,通过统一的管控平台,对云上的和云下的数据库进行统一的管理。

如何保证系统的稳定可靠

  • 提供多种数据库容灾方案:考量:RPO,RTO,成本,扩展性。
  • 覆盖数据库容灾的各种需求:容灾建设,监控,容灾演练,容灾切换,数据校验及修复。
  • 构建数据库异地容灾的完整体系
    多层级高可用方案:

1)备份上传:采用单点写入方式,RPO为最后一次成功上传的备份的时间点到崩溃时间,RTO为小时级甚至天级,通过常规的数据库备份,将备份集上传至云端OSS存储。
2)DBS备份上云:采用单点写入方式,RPO为秒级,RTO为小时级,通过捕获数据库变化日志持续将数据库增量备份到云端,保有数据库最新的数据。
3)单向实时同步:采用单店写入方式,RPO为小于1秒,RTO为秒级到分钟级,其特点在于持续增量同步数据变化到容灾端数据库,容灾端数据库为读写打开状态,但逻辑上不接受应用写入。
4)异地多活:采用多点写入方式,RPO为小于1秒,RTO仅应用流量切换时间,多活架构,数据多点写入,数据变化双向复制。需要做多点间数据写入的隔离,防止记录在多点被更新。
对于现在阿里的数据库架构来说四种方案均能够支持,并且主要采用异地多活的方案。对于前面所提到的应用做了服务化这个问题,一些数据是需要依赖其他数据的,这时候如何实现数据之间的相互实时流转,且满足业务需求的,这时候就需要数据同步来实现。

让数据成为架构的动脉

针对数据自由流转这个问题,列举了几个典型的实践案例:
1)上云迁移:(同异构)数据在云上和云下自由流转。
2)在离线:在线的数据库同步到离线,进行实时分析。
3)多活同步:单元之间的实时双向同步,满足异地容灾需求。
4)下游消费:通过订阅实时增量消息,满足搜索等下游业务。
5)实时大屏:在线数据,流经实时计算,大屏展示。

兼顾数据安全和效率

保证数据安全的前提下,怎样保证效率是每个研发者所要考虑的问题,DBA已经成为瓶颈。我们所做出的解决方案是通过DMS企业版平台,此平台主要解决两个问题,第一个就是研发效率的问题,让研发者对数据库的操作不在成为瓶颈;第二个问题就是数据安全问题,我们会对权限进行非常精细以及明确的管控,我们对权限定义的力度可以细化到某一个库、某一个表或某一个列的程度。
接下来简单介绍下DMS数据库平台,现如今数据库类型众多,但DMS平台支持多种数据库类型,在数据库控制层之上有一个安全控制层,也就是前面所提到的数据安全。若没有数据安全,我们会遭受很多风险与挑战。此外还有核心功能层,面向研发时对数据库的操作全部通过自助的方式来实现,用户则更多的是面向研发同学、运营以及后台同学来看的。

在解决数据安全和效率的问题之后,我们还面临着另一个问题,即业务个性化的权衡问题,对于数据库的管理人员来说,更希望一个数据库能够支撑所有的业务,在统一化、规模化运维的时候是最方便的。但实际上业务需求是很多元化的,这时一种数据库就很可能无法包含整个业务。例如淘宝上有上千个应用,有些文档型的应用结构定义常常会发生变化,又比如有一些IOT的用户,在IOT场景下很多时候是偏向时序的分析,时序数据分析的时候或日记类的数据分析的时候我们把这些数据放到哪里呢?为了解决这些问题我们提供了多种数据库引擎,如下图显示。

虽然提供了很多数据库类引擎,但是在统一运维上面也并没有做太多的妥协,数据库引擎众多,但数据库中台是能够很好的包容这些产品的。

产品总结

为了满足企业架构的需求,我们采用分布式数据库Scale Out实现弹性扩展,此外还有多样化存储引擎满足业务需求,让每个数据库都能发挥它最大的作用;同时通过数据流转,打通任督二脉;以及多层级的容灾保证系统高可用性,提出了高效的数据库DevOps和数据安全方案。
本文由云栖志愿小组毛鹤整理编辑

共同探索企业级数据库架构之道路相关推荐

  1. 张程伟:从开源项目到企业级数据库,云和恩墨 MogDB Uqbar 的技术探索与实践...

    导语 4月8日下午,为期两天的第十二届数据技术嘉年华(DTC 2023)在北京新云南皇冠假日酒店圆满落下帷幕.大会以"开源·融合·数字化--引领数据技术发展,释放数据要素价值"为主 ...

  2. 三层架构与设计模式思想部署企业级数据库业务系统开发

    1. 三层架构介绍 1.1关于架构 架构这个词从它的出现后,就有许许多多的程序员.架构师们激烈地讨论着它的发展,但是架构一词的出现,却是随着三层架构的出现才出现的.当然,目前应用三层架构开发也正是业界 ...

  3. 数据库架构优化的12种组合方式与风险解读

    韩锋 阿里云高级产品专家 dbaplus社群联合发起人,CCIA(中国计算机协会)常务理事: Oracle ACE,具有丰富的一线数据库架构.设计.开发经验,著有<SQL优化最佳实践>&l ...

  4. 蚂蚁金服资深总监韩鸿源:企业级数据库平台的持续与创新

    2019年11月19日,蚂蚁金服在北京举办"巅峰洞见·聚焦金融新技术"发布会,介绍2019双11支付宝背后的技术,并重磅发布全新OceanBase 2.2版本.欢迎持续关注- 蚂蚁 ...

  5. “宇宙第一大行”之 MySQL 数据库架构解密

    点击▲关注 "中生代技术"   给公众号标星置顶 更多精彩技术内容 第一时间直达 摘要:本文根据 DTCC 数据库大会分享内容整理而成,将介绍工行 IT 架构转型中传统 OLTP ...

  6. 前世今生:蚂蚁金服自研数据库OceanBase的道路与思考

    本文根据冯柯老师在 2018 年 5 月 10 日[第九届中国数据库技术大会]现场演讲内容整理而成. 讲师介绍 冯柯 蚂蚁金服资深总监.OceanBase 首席架构师 冯柯,蚂蚁金服资深总监.Ocea ...

  7. 【演讲实录】下一代企业级应用架构管理体系

    在IT系统的建设和管理中,敏态和稳态似乎不可协调的两个问题,那么在企业IT系统的管理中,如何根据需求去合理管控,今天将通过王璞老师在第七届数据技术嘉年华上的分享进行详细解读. 本次分享重在讲解企业系统 ...

  8. 开源关系型数据库架构

    前言 我们把主要的开源关系型数据库分为三类,来分别了解一下它们的架构和设计,并了解一下它们各自的优缺点. OLTP,在线事务处理,是传统的关系型数据库的主要应用场景 OLAP,在线分析处理,是当今大数 ...

  9. 从 TDSQL 演进史,探索国产数据库发展规律

    自 2020 年 12 月 24 日腾讯云宣布 TDSQL 数据库品牌升级以来,这个国产分布式数据库就一直热度不减,不仅在墨天轮 2 月份国产数据库排行榜上攀升至 Top4,在社区热门搜索词中,&qu ...

最新文章

  1. SRV记录用来标识某台服务器使用了某个服务,常见于微软系统的目录管理——深入的话需要去折腾Azure Active Directory...
  2. Hibernate双向多对多关联
  3. 【视频】vue插值表达式之字符串的反转
  4. 简单分析EnableAutoConfiguration
  5. 移动营销的魔力:让你的客户无处可逃(附赠2012移动营销百问百答手册)
  6. Android仿探探卡片拖拽,[转]仿探探拖拽卡片效果Vue3实现
  7. C++ const型成员函数与 non-const型成员函数 (二)
  8. 线搜索中有最速下降法、牛顿法、拟牛顿法、共轭梯度法汇总
  9. 你好,Wi-Fi 6
  10. IDEA 集成配置 Jad
  11. 测试远程服务器udp端口,测试远程udp端口
  12. 如何生成CGCS2000坐标系等高线
  13. 霍尔电流传感器ACS758/ACS770/CH704应用于三相四桥臂逆变器的电流检测装置
  14. windows:查询本机ip地址方法
  15. html页面调用高德地图,html前端使用高德地图入门教程
  16. Unable to find instance for system
  17. 计算机表格性格计算,MBTI职业性格测试自动计算得分并得出分析结果.docx
  18. STM32debug模式下可以执行,但是不能单步调试和跳转
  19. 南柯服务器压力,性能测试新手误区(四):一切来自录制
  20. 如何恢复因为chrome同步而删除的书签

热门文章

  1. python string与list互转
  2. Leetcode 142 Linked List Cycle II
  3. Jquery实现列表框效果
  4. JAVA高并发的三种实现
  5. c 开发服务器的性能,高性能网络编程(三):下一个10年,是时候考虑C10M并发问题了...
  6. Golang并发——并发技术Goroutine和channel的使用、定时器、生产者消费者、条件变量、select
  7. imgaug批量椒盐噪声 python_python手写给图像加椒盐噪声和高斯噪声
  8. python 读取mysql大量数据处理_python使用多线程快速把大量mysql数据导入elasticsearch...
  9. jquery 树形框 横_利用jQuery设计横/纵向菜单
  10. e5cc温控仪通讯参数设定_产品介绍||DeltaWiFi通讯型多功能电表DPMC520W