2017云栖大会POLARDB专场,阿里云高级技术专家贺军带来POLARDB产品特性和通用业务场景的演讲。本文主要从POLARDB产品架构开始谈起,接着介绍了产品特性,最后着重分享了POLARDB通用业务场景。

以下是精彩内容整理:

产品架构

当我接触到POLARDB时很震惊,因为它是集计算、存储、网络,众多的创新于一体的,我个人理解是跨代界的里程碑产品。它采用了全新的设计理念,Cloud Native,和之前谈到云数据库设计理念有很大的不同。数据库最早的血缘关系来自于IT时代关系型数据库,是那个时代计算力的创造。可是当我们把计算力放到公有云上面来连接用户业务的时候,做了很多很多创新的能力提供,可是这样远远不够,为什么呢?今天我们需要针对公有云的环境,针对公有云环境下用户业务的一些场景来设计一款公有云上使用的关系型数据库,这是很难的事情。

POLARDB采用了计算、存储、分离的架构,我们知道这一句话说起来容易,做起来是非常难的。因为存储之所以要和计算放在一起,是为了性能。做一个关系型数据库,所有关系型数据库首要就是性能,当把计算和存储做分离是很容易构想,怎么创造出来是非常难的。

今天POLARDB采用计算与存储的分离是一次大胆的创新,不仅是一个想法,而且我们做到了。关系型数据库的难点在于什么,它要支持ACID的语义,一个关系型数据库不支持AC的语义,是不能支持在线事务处理的业务场景的。如果又要支持ACID,又要性能很好,又要在云上提供公有云的各种弹性能力,还要性价比。放眼市面上商用数据库,似乎觉得多多少少是一种幻想。能不能把所有特点,我们的功能、能力、性价比融合在一起,有一种满足绝大多数业务场景的架构来支撑呢?我们通过对业务的理解,公有云这么多年的积累,我们采用一写多读的数据库架构,极大简化了数据库多写的复杂性。同时又能够满足绝大多数使用场景。我们采用了自主研发分布式存储引擎,这个引擎可以是阿里云自主研发的核心武器,由于采用了共享分布式存储引擎的技术,使得我们POLARDB才有可能提供多维的弹性能力。

如图,它分为三个层次。最上面是DBserver,采用一主多从的架构,其它节点通过在线的扩展或者伸缩来支持读的请求,底层是分布式快存储的设备。

POLARDB 产品特性

POLARDB有哪些特点?首先关系型数据库的诉求就是性能要好。如果说一个关系型数据库性能不好,很难满足在移动互联网时代数据爆发性增长下处理能力的要求。POLARDB的性能好,好在哪些方面呢?具体如下:

  • 极速。单点QBS很轻松上到50万,由于采用共享式分布存储,POLARDB增加一个只读节点时性能很好,共享一个数据不用再增加一个新的只读实例进行数据复制,减少了数据复制的开销,增加只读实例的时间快则1分钟,慢则5分钟,而且不会因为数据规模的增加导致时间的增加。另外,采用一主多读的结构,延迟也是控制在毫秒级。还有做备份秒备。这些能力都是具有极速的性能。
  • 超大容量。当数据用到一定的时候,随着数据量的增加到2个TB的时候好像不够用了。今天POLARDB能够提供超过100个TB级别的数据量,本身在关系型结构化数据的层面来讲,是非常大的数据级别。
  • 应需而变,弹性伸缩。云的弹性在POLARDB数据库架构上得到充分的发挥,根据用户业务变化灵活的做升级。
  • 兼容MySQL。开源数据库加进来已经超过Oracle数据库,而且这个趋势每年在递增,我们现在向下百分之百兼容,也会尽快展开对SQL标准的支持。
  • 高可靠,高可用。POLARDB采用一主多从的架构,天生支持高可用。当主节点有故障时,会自动到指挥节点。同时数据也是多副本的,数据可靠性可以得到天然的保障。

POLARDB 通用业务场景

讲到POLARDB产品能力时,一个产品的诞生,它的价值、产品的荣耀最后还是来自于服务。如果没有用户的使用,没有解决用户场景各种问题,我们很难体现一个产品的价值。对于公有云上用户来讲,它首先需要考虑的是诉求能不能通过云数据库来解决。新业务,或者已有的业务,如果我想迁移到云上面,我想用性价比更高的数据库,我想使用新一代数据库,把数据库放在公有云上,这涉及到用户整体迁移成本。

如果整体迁移用户非常便捷迁移上来,那么这个迁移成本是非常低的。如果用户还需要改业务程序,这个过程就非常痛苦,也会带来一些潜在的风险,这是用户去做的事情。我们需要提供强大的性能满足高端用户的需求,业务上到云上,我相信公有云,相信阿里云。业务上提供7×24小时的服务,所有的业务是不能中断。当用户数增加了之后,数据库是否有足够的弹性,是否有足够的扩展能力来满足业务场景能力的增加。

最后,数据要安全可靠,满足这几个用户的诉求,才能体现数据库产品服务用户的价值。刚才讲到了POLARDB的能力和服务用户的场景,我把整个大图做一个分解,分成四个场景。

高吞吐量、大数据量处理

高吞吐量,大数据量的处理能力。公有云最早的时候都是服务一些互联网网站的用户。随着公有云能力的增强,公有云各种软硬件持续的进化,公有云服务的能力不可同日而语。有一些大客户,或者一些中型客户,或者有潜力业务增长的客户,他的业务量越来越大,数据量也越来越大。我们知道在移动互联网时代,数据不仅仅是为了解决需求的问题,数据很可能接下来会做一件更伟大的事情,数据可能会改善供需关系的平衡。因为我们知道今天的计算,怎么提高生产效率,生产的效率性能越来越好,用户服务的场景效率就越高,它的性价比也就越好。我们因为服务了用户之后,有了数据之后就会收集用户的诉求,我们就知道该给用户提供什么,有了数据会因需而变,有了数据之后能够提前感知数据的变化。数据可能会改变供需的不平衡,这是大数据时代的贡献能力,随着数据的无限增长,数据库作为商业文明支撑后台计算能力,它在计算力上也需要处理更多数据量的处理能力。

我们采用读写分离的架构,能够应对更多的客户端处理系统,同时采用共享存储,支持100TB以上的规模,应对互联网环境下数据量的增加。

高可用、业务弹性能力

几年前在做developer时候,那时候开发一个高可用软件。当时我们想通过两个单节点上装开源的MySQL,再花钱买一个高可用的软件,然后再学习高可用软件的配置,才能做到让两个机器上运行LAMP架构高可用能力。今天在公有云上,公有云高科技能力把普惠科技用更低的成本,把科技含量用更低的价格服务所有公有云上用户,它所带来的价值巨大。

我们看这张图,每一个POLARDB的计算节点、CPU和内存不够用的时候可以很容易往上升。今天通过共享存储的架构,再去做Scale Up和Scale In。当读业务需求量不大时,还可以把只读节点删掉。今天由于竞争、营销、互联网一些生态的变化,我们的业务可能时间窗口到小时,甚至分钟级,电商经常搞一些秒杀,可能一个小时业务流量就上来了。有这个能力,可能分分钟加一台只读节点,这个事情就变得容易了。

上云、迁移

当一个新的东西,更高级的东西出现的时候,我们特别想来用,可问题是如果还需要改变业务程序很难。如果MySQL兼容的话,它上云非常轻松,再借助其它上云的工具,做一些逻辑的迁移,整个上云甚至在云上面迁移的过程都非常平滑。

今天进入了云计算,物联网,人工智能的时代。之前说互联网要从线上走到线下,可能一些传统行业也要走到线上,甚至用人工智能开辟一些新的业务形态。行业+互联网,可能更多会拥抱云这种性价比高、具有弹性、部署容易的特点,它就会迁到公有云上面。有这样一些迁移工具,兼容也解决了,上云的代价就非常低,整体上云迁移的成本比以前低很多。

高可靠、备份容灾

最后一点,高可靠备份容灾能力。POLARDB有一个产品架构图,POLARDB是一个集群架构,在DBserver层都是集群架构。对于集群架构来说,它的网络连接可以为Mission Critical应用服务。

回头来看,我个人理解POLARDB,它应该是一种想象力+创造力+应变力,来专门设计的一款数据库产品。我相信POLARDB就是以信仰的精神,加上所谓的努力和付出,今天才能呈现给大家。

POLARDB产品特性和通用业务场景相关推荐

  1. 入选 SIGMOD2021 的时间序列多周期检测通用框架 RobustPeriod 如何支撑阿里业务场景?

    简介: 本文除了介绍RobustPeriod的核心技术亮点,还将重点解释如何将它构筑成服务来解决阿里云的业务痛点. 近日,由阿里云计算平台和阿里云达摩院合作的时序多周期检测相关论文RobustPeri ...

  2. 百亿条数据复杂业务场景下通用归因模型设计实现

    1 背景 互联网流量应用的一个重要方面是计算各页面.入口的转化,深度洞察用户行为轨迹,数据驱动精细化运营,对一些大公司来说也是如此.如何建设公司级统一口径转化导流分析数据,满足多个业务对转化数据的需求 ...

  3. 两亿多用户,六大业务场景,知乎AI用户模型服务性能如何优化?

    作者 | 王政英 来源 | 知乎技术专栏 用户模型简介 知乎 AI 用户模型服务于知乎两亿多用户,主要为首页.推荐.广告.知识服务.想法.关注页等业务场景提供数据和服务,例如首页个性化 Feed 的召 ...

  4. .net中调用esb_都是应用集成,ESB和集成引擎对医疗业务场景的“口味”为何不同?...

    前言:本文由浙江省台州医院刘祉呈撰写,详细说明了集成平台核心中间件集成引擎(IE)与ESB在医疗信息化场景中的各自特点及优劣,并辅以翔实的图文业务流程场景.看完之后能对ESB和集成引擎两者有更深入的了 ...

  5. SpringBoot - 实践阿里巴巴【Manager 层_通用业务处理层】

    文章目录 规范 对比传统MVC 小栗子 V1.0 传统写法 V2.0 引入Manager层 源码 规范 对比传统MVC 说几个弊端 Service层代码臃肿 Service层易出现大事务,事务嵌套,易 ...

  6. 1688 复杂业务场景下的 Serverless 提效实践

    前言 首先为大家简单介绍一下我们的业务场景,1688 隶属于阿里集团的国内贸易事业部(CBU),是阿里最早起家的业务,已有十几年的历史.我们主要负责 PC 端 1688.com 以及手机端阿里巴巴 A ...

  7. 结合业务场景案例实践分析,倾囊相授美团BERT的探索经验

    Google 在 2018 年公布 BERT 的工作之后,引起了 NLP 学术圈以及工业界的极大关注.无论是在各个公司的应用场景中,还是在一些公开的 Benchmark 上,BERT 的效果都得到了验 ...

  8. 5G差异化业务场景需求及网络切片(1)

    文章目录 前言 一.5G网络切片在国内外研究情况 二.为什么需要网络切片? 2.1 不同场景对差异化业务的挑战 2.2 技术的驱动 三.什么是网络切片 3.1网络切片的特征 3.2网络切片的价值 四. ...

  9. SAP解决方案(典型业务场景)

    一.SAP解决方案(典型业务场景) 在华为云上部署SAP业务,能够充分利用华为云大规格.高性能.高安全和高可靠的能力,以及全生命周期的管理服务,帮助企业简化管理.节省成本.高效运营,快速实现数字化转型 ...

最新文章

  1. cocos2d-lua 搓牌效果_4款热门面霜评测,欧莱雅效果一般,艾珂薇性价比高,菲洛嘉最贵...
  2. 窗宽窗位改变图像_CT、MRI图像的影像诊断4大原则、5个步骤、3大阅片方法
  3. sqlilab--writeup (5~6) 布尔盲注
  4. php中数组下标,PHP数组介绍_php
  5. python系统性能模块笔记
  6. 对软件研发项目管理的深入探讨
  7. Apache中配置ASP.NET环境
  8. 多目标跟踪MOT评价指标
  9. ENVI实验教程(6)实验六、遥感图像分类
  10. Python自动化办公之操作Excel文件
  11. 2013年大数据行业应用展望报告
  12. oracle数据库imp命令,数据库imp导入命令
  13. Es6模板字符串条件判断
  14. python程序内存限制
  15. springcloud分布式配置中心(二)-阿波罗apollo
  16. 洛谷 P1129 矩阵游戏
  17. 向西,向西,到栖霞去(二)--走马看福山
  18. [转]SEO做关键词的十大分析方法
  19. hdoj 还是畅通工程
  20. 移动端安全通信的利器——端到端加密(E2EE)技术详解

热门文章

  1. 纹身电极: 一种新型的可以进行脑信号测量的电极
  2. [评测] 联想 Mirage Solo 一体机:基本性能强大,价格定位很迷
  3. [unreal4入门系列之十五] UE4中的动态数组:TArray容器
  4. 黑客大神用什么杀毒?Windows自带的就够,只是加了亿点微小的强化
  5. 3D演示帮你一眼看懂线性规划问题,这篇可视化教程火了
  6. 万维网源代码正在被发明人拍卖,有人出价1800万,还在不断上涨
  7. AI性能基准测试从此有了「中国标准」!英伟达、谷歌可以试试这套算力卷
  8. 手机拍视频,实时换背景,继马卡龙玩图后,Versa又出了一款更厉害的App
  9. JavaScript之各种继承方式和优缺点
  10. [TFRecord文件格式]基本介绍