近日,华为云自研关系型数据库Taurus公开亮相。作为华为云自研的最新一代云原生分布式数据库,Taurus完全兼容 MySQL 8.0,采用计算与存储分离、日志即数据的架构设计,支持1写15读,性能达到原生 MySQL 的7倍。

过去多年,数据库技术本质上并没有出现颠覆式发展。作为核心基础设施,数据库是一款用户粘性非常高的产品,一旦核心业务数据落定,企业轻易不会尝试更换,因此很长一段时间内,大众习惯于老牌IT厂商垄断数据库市场的状况。然而,云厂商涉足数据库领域的消息近年层出不穷,比如AWS Aurora、阿里云PolarDB以及华为云Taurus。

在互联网、移动和物联网等新场景之下,图片、音频、视频等非结构化数据开始出现爆炸性增长,传统数据库不堪重负,企业客户急切需要新的数据库产品。在云计算技术不断成熟的背景之下,云数据库开始崛起,并因为按需扩展、按需付费等特性获得大量中小企业及互联网客户的拥护。

从云厂商的入局也不难看出,现在做数据库的门槛并不像从前那么高,并不只有传统的数据库厂商可以做,单就这一领域的创业者也不少。在这种情况下,核心竞争力只可能从差异性发展而来,人人都在做且会做的东西很难形成核心竞争力。据此,华为云近日公开亮相的自研关系型数据库Taurus有什么不同?核心竞争力是什么?为什么性能足以达到原生MySQL的7倍?与云上MySQL相比,后者的不足之处有哪些?华为云进行了哪些修补?

云原生数据库技术趋势

传统的数据库体系结构已有30多年的历史,专为本地部署,本地存储和单机数据库实例而设计和优化,此后很长一段时间内,该体系结构未针对公有云环境进行优化。在公有云环境下,计算和存储通过网络分离以支持多租户数据库实例并scale out向两端扩展;并不要求单个节点的高可靠性。

举例来说,假设一个本地数据库的每个数据库实例都有本地存储,为了支持高可用性,通常部署一个备实例并使用数据库内部复制机制将数据库日志(MySQL binlog)发送到备实例重建数据库副本。目前,大多数云厂商都采用类似机制来支持云数据库高可用性。但是,这种内部复制机制并没有利用云存储已经通过存储层复制提供的可靠性,这导致大量存储和带宽浪费。实际上,备数据库实例可以通过云存储与主实例共享数据,不仅可以节省磁盘空间和带宽,还可以为云数据库服务提供快速RTO。

很明显,在将传统数据库迁移上云时,需要重新设计和优化数据库系统。过去几年,主要云供应商,比如AWS和阿里云,已经做了部分工作。预计未来几年,更多云和数据库供应商将遵循这一趋势,构建某种形式的云原生数据库技术。此外,Gartner预测,到2019年,90%的云数据库架构将支持计算和存储分离。

值得注意的是,除了基于云环境的数据库架构重新设计之外,这一领域还存在两大趋势:

在云原生数据库中利用新硬件:如新硬件和RDMA。这些都是活跃的研究领域,然而除了充当缓存和计算机与存储之间的快速链接之外,到目前为止,我们还没有看到任何其他的突破性。

基于即时和历史收集的数据,使用ML(机器学习)和统计技术来帮助管理和自我调整云数据库,包括但不限于数据库实例自动伸缩和参数设置和自动 调整,异常检测等。

云上MySQL的不足

当前,对于RDS for MySQL,各大云厂商基本都采用主备高可用模式、主备间使用Binlog 复制,该架构下每添加一个从库都需要全栈式资源,这导致了一些问题:

1、资源浪费

备库往往不承担流量;复制线程会消耗主库/从库计算资源,造成计算资源浪费;EVS 的 3 副本冗余机制下,N个备库最大需要3*(N+1)个副本,造成存储资源浪费以及多种数据需要走存储网络进行刷盘,造成网络资源浪费等。

2、扩展性不佳

添加只读时需要拷贝数据,重放 binlog,对于大数据量情况下速度很慢,尤其是采用本地盘方案。主从复制延迟问题会让主备倒换受影响,难以保证RTO。此外,采用物理备份、逻辑备份时备份恢复速度很慢, 1T以上数据量都以小时计,使得数据库扩展性受限。

华为云 RDS 架构演进

华为云 Taurus 与Amazon Aurora 数据库进化的方向是一致的,然而进化路径各有不同,这是由各自的数据库云服务实现方式不同所决定的。华为云 RDS MySQL 有如下几个版本,这些产品形态满足不同的用户业务场景,具有不同的特点,可以进行优势互补。

MySQL 单机版

MySQL 单机版采用数据库计算节点和存储节点分离的方式,利用云盘数据本身的可靠性和多副本的特性,同时也利用ECS 云服务器虚拟化来提升标准化部署、版本和运维管理效率,能够满足低端用户不太注重高可用服务的业务场景。

MySQL 主备版

MySQL 高可用版则是针对企业级用户提供的高可用数据库版本,提供 99.95% 的 SLA 保障。采用 Active-Standby 高可用架构,主节点和备节点之间通过 MySQL Binlog 进行数据Replication。当主节点发生故障,备节点接管服务。同时还支持最多5个只读节点,支持负载均衡的数据读写分离的访问方式。

MySQL 金融版

MySQL 金融版是针对金融行业等高端用户设计的高可用、高可靠云服务产品。一主两备三节点架构,可跨 AZ 部署,任意一台服务器宕机不影响业务可用性;基于 Paxos 协议,实现了分布式下数据的强一致性,拥有更加优异的故障恢复时间,满足数据容灾备份等业务场景的需求。

Taurus 的进化

Taurus 采用计算与存储解耦的技术架构,同时可以最多支持15个只读节点。主节点和只读节点之间是 Active-Active 的 Failover 方式,计算节点资源得到充分利用,由于使用共享存储,进一步降低了用户使用成本。

Taurus 的设计思想有几个大的革新:

将部分计算能力卸载到存储节点

软硬件深度优化,充分利用RDMA网络、NVME SSD等硬件优势

日志即数据,与传统RDS for MySQL相比,不再需要刷page,所有更新操作都记录日志,不再需要double write,减少了网络通信。

另外在 DB Server 设计上,完全拥抱开源生态,完全兼容MySQL 8.0。

华为云 Taurus 和 Amazon Aurora 的一个共同设计哲学就是,先推出一写多读的版本,根据市场需求,适时推出多写版本,满足绝大多数 OLTP 应用场景和性能要求。

Taurus 架构设计原则:

采用华为下一代云存储(DFV)作为快速,可扩展,可靠和共享数据库存储。不复制存储层中的已有功能,例如,数据复制,跨AZ可靠性,数据清理。

单个数据库集群应该只需要一份足够可靠的数据库副本集。所有只读副本共享存储在云存储中,甚至跨AZ,数据库层中没有逻辑复制。一写多读,没有独立的备用实例。主节点发生故障转移时,只读副本可以切换到接管主服务器。

记录为数据库。仅顺序写入以最小化SSD磨损(避免写入放大)

只有数据库日志通过网络从数据库计算机节点写入DFV存储层。没有页面检查点和刷新跨网络,没有双重写入。基于DFV存储层内的数据库日志重建数据面,以避免繁重的网络流量。

基于跨DFV存储节点的切片策略对数据库进行分区,以支持大型数据库卷。单个DFV存储节点管理来自不同数据库集群实例的多个分片,实现存储容量和处理能力的无限扩展。

Taurus 数据库关键技术点剖析

Taurus架构

如图所示,Taurus 是一个分布式集群架构设计,采用计算与存储分离的设计理念,满足公有云计算环境下用户业务弹性扩展的刚性需求。数据库计算节点和存储节点之间采用高速网络互联,并通过 RDMA 协议进行数据传输,使得 I/O性能不再成为瓶颈。

数据库节点采用和 MySQL 完全兼容的设计。主节点和只读节点之间采用 Active-Active 的 Failover 方式,提供 DB 的高可用服务。同时 ,DB Server 之间仅需同步 Redo log 相关的元数据信息。

SQL Nodes

管理客户端连接、解析SQL请求,、分析执行计划并执行和管理事务隔离级别

一主多读

主库和只读松耦合

主库和只读通信少

快速Failover

引入内核中的一些特性

Query result cache

Query plan cache

Online DDL

SQL Replication

只读节点在本地buffer pool中维护数据页的多个版本

减少从存储的远端读取数据页

主库交互

MVCC: 同步主库当前活跃事务列表

页失效: 接收主库页失效列表

高速网络下的 RDMA 协议

部署RoCE RDMA以减少网络延迟并增加带宽。在单个AZ中,Taurus 可以利用高速网络(RDMA)来获得更新和读取的低延迟存储I/O,这对于低客户端连接方案非常有用。

存储抽象层 (SAL)

存储抽象层 (SAL)是逻辑层,将数据存储和SQL前端、事务、查询执行等进行隔离。由一组容量和处理能力按需扩展的分片节点组成,SAL将所有SQL节点需要的数据页按分片管理和横向扩展。随着数据库规模的增长,可用资源(存储、内存)随着分片创建按比例增长。数据处理本地化,数据密集型操作是在存储节点上按分片服务执行。

Taurus Storage

Taurus 存储基于华为云存储DFV持久层。DFV持久层集群包括多个存储节点。每个存储节点包含多个SSD设备和适应SSD介质的append存储服务进程。 DFV持久层为SQL节点提供存储接口。

Taurus 采用日志化方式处理SQL节点数据,即通常表述的“日志即数据”。数据组织采用面向SSD重新设计的Append模式,显著减少系统写放大,减少存储时延。同时,在Append模式下,数据回滚和回档变得非常快速。

Taurus核心竞争力

成本更低

与传统RDS for MySQL相比,只有一份存储。添加只读节点时,只需添加计算节点,无需额外购买存储。只读节点越多,节省的存储成本越多。

扩展性、可靠性更高

横向扩展更快。Taurus采用共享存储,只需添加计算节点,无论多大数据量,只需5分钟左右,并且支持15个只读.

纵向扩展更快。容器化部署,规格变更更快。

主从倒换时间更快。 消除了复制延迟,RTO有保证。

数据库Crash恢复更快。

性能更强

软硬结合,基于硬件:Hi1822卸载,NVMe SSD,RDMA,同时内核进行优化:去掉double write,Query Cache/Plan Cache优化,Innodb Lock Management优化,Audit Plugin效率优化,性能达到原生 MySQL 的 7 倍。

备份恢复更快

专为Taurus引擎定制的分布式存储系统,极大提升数据备份、恢复性能

强大的数据快照处理能力。AppendOnly vs. WriteInPlace,数据天然按多时间点多副本存储,快照秒级生成,支持海量快照。

任意时间点快速回滚。基于底层存储系统的多时间点特性,不需增量日志回放,可直接实现按时间点回滚。

并行高速备份、恢复。备份及恢复逻辑下沉到各存储节点,本地访问数据并直接与第三方存储系统交互,高并发高性能。

快速实例恢复。通过异步数据拷贝+按需实时数据加载机制, Taurus实例可在数分钟内达到完整功能可用。

总结

通过以上介绍不难发现,Taurus 的共享存储架构将数据持久化放入新一代存储中,充分保障数据强一致性和 0 丢失;采用软硬件结合,充分利用RDMA网络、NVME SSD等硬件优势,正是这些关键技术的整合创新,才使得 Taurus 的性能有了质的飞跃。

分享是一种美德,希望每篇文章对大家有所启发和帮助;也期待你的转发,谢谢!

欢迎在评论区留言、评论、交流!

转载于:https://my.oschina.net/u/4160276/blog/3096240

性能达到原生MySQL七倍,华为云Taurus技术解读相关推荐

  1. 性能达到原生 MySQL 七倍,华为云 Taurus 技术解读

    吴林.黄伟 近日,华为云自研关系型数据库 Taurus 公开亮相.作为华为云自研的最新一代云原生分布式数据库,Taurus 完全兼容 MySQL 8.0,采用计算与存储分离.日志即数据的架构设计,支持 ...

  2. 云原生数据库风起云涌,华为云GaussDB破浪前行

    本文分享自华为云社区<云原生数据库风起云涌,华为云GaussDB破浪前行>,原文作者:心机胖 . Gartner预测,2021年云数据库在整个数据库市场中的占比将首次达到50%:2023年 ...

  3. 万物互联、应用现代化、云原生新范式,华为云为数字化转型提供最优解

    10月27日,华为云TechWave全球技术峰会(应用现代化)在广州举办.华为云发布"云原生2.0"新范式,并分享应用现代化.万物互联等最新理念及产品进展. 华为云CTO张宇昕发表 ...

  4. 2002 Can‘t connect to server on (60) 连接不上服务器mysql服务(华为云 ubuntu20 )

    @2002 Can't connect to server on (60) 连接不上服务器mysql服务(华为云 ubuntu20 ) 最近刚搞了个域名 买了个服务器 想着自己搭个站玩 结果今天测试m ...

  5. 【华为云数据库技术大公开】机房失火后,还能拯救你的数据吗?

    相信很多人都有整理C盘的经历,C盘作为电脑的系统盘,系统运行所需的关键数据都存储在其中.但如果使用不当,C盘就特别容易变红,然后电脑变卡,恶性循环,最差的结局就是系统崩溃,所有数据丢失. 对于企业来说 ...

  6. 【华为云专家技术公开课】7月4日直播,报名观看赢取好礼

    [导语]新手大咖齐相聚,畅谈云端新科技.2019年7月4日,华为云专家技术公开课直播将在云视界进行线上直播,本期华为云MVP.敏捷创新教练王立杰将就<敏捷项目管理的关键点>进行深入讲解,让 ...

  7. 超强性能,秒级存储,华为云GeminiDB for Cassandra 正式商用了

    云数据库GeminiDB是一款基于华为自主研发的计算存储分离架构的分布式多模NoSQL数据库服务.在华为云高性能.高可用.高可靠.高安全.可弹性伸缩的基础上,提供了一键部署.备份恢复.监控报警等服务能 ...

  8. 华为mysql金融版_华为云数据库MySQL金融版公测,打造满足金融场景数据安全性的高端产品...

    日前,华为云数据库推出MySQL 金融版,基于Paxos协议,采用一主两备三节点架构,解决数据库分布式环境下数据一致性的问题,实现了自动脑裂保护机制,保证数据库高可用和高可靠,满足金融场景下的数据库高 ...

  9. 基于云原生2.0,华为云沃土云创计划全面使能伙伴创新升级

    5月18日,华为中国生态大会2021在深圳举行,在"云原生2.0,赋能新云原生企业"为主题的云原生分论坛上,华为云分享当前生态伙伴发展情况和全栈云原生的创新能力与及丰富实践,并详细 ...

最新文章

  1. gpg加密命令 linux_用 PGP 保护代码完整性(五):将子密钥移到一个硬件设备中 | Linux 中国...
  2. boost源码剖析之:多重回调机制signal(下)
  3. webapi中的模型验证
  4. mysql5.7 忘记root密码后,如何找回密码?
  5. NOIP2007 字符串的展开
  6. 操作索引库-创建索引库
  7. 69 SD配置-发票凭证配置-为回扣处理选择出具发票单据
  8. systemtap notes
  9. synchronized 分布式时为什么会失效_10张图,搞懂索引为什么会失效?
  10. 排序系统 c语言程序设计,c语言程序设计(排序算法).doc
  11. SAP Client Copy
  12. 本周小折腾记录: ipad和电脑完成同屏功能
  13. 亲戚关系关系算法java程序_并查集1——查找亲戚关系
  14. 用友t3服务器系统管理软件,T3用友通系统管理常见问题及解决方案
  15. logiscope系列-使用说明书
  16. j3455linux网卡不亮,J3455 ProxmoxVE v6.0-4 直通物理网卡教程
  17. 全国计算机考试如何查准考证号
  18. Linux 安装cacti
  19. PyCharm下利用pyqt对话框打开图片,显示
  20. 乖离率背离公式_股价偏离率是什么 BIAS指标计算公式-BIAS-技术指标-股票入门基础知识学习网...

热门文章

  1. 数字推盘游戏java_最强大脑数字推盘游戏-最强大脑数字推盘游戏官方版 v1.0预约_手机乐园...
  2. python 聚类分析实战案例:K-means算法(原理源码)
  3. 大数据技术之_08_Hive学习_03_查询+函数
  4. 一文看懂web组态编辑器web可视化组件
  5. 三角网格算法应用总结
  6. 2020云南公务员计算机专业,《2020年云南省公务员录用考试专业指导目录》(征求意见稿)发布...
  7. 2018广东互联网大会即将开幕
  8. SAP 银企直连 通过 Http Get 方式下载交易明细文件
  9. cramfs根文件琐屑的运用
  10. quote函数什么意思,怎么用