作者 | 马超

责编 | 伍杏玲

出品 | CSDN(ID:CSDNnews)

5月20日,世界上权威数据库评测机构——国际事务处理性能委员会(TPC),发布最新评测榜单,蚂蚁金服自研的分布式关系数据库OceanBase,以7.07亿的tpmC的评测成绩再次夺冠,并将自己之前创造的记录提升了近11倍。

2019年10月,OceanBase打破甲骨文长达9年的“垄断”,登顶TPC榜首时,业界有不少的评论称,阿里的第一名成绩不会保持太久的,甲骨文、IBM等老牌数据库厂商很快就会刷新OceanBase创造的记录。OceanBase这次直接用提升11倍的成绩,对那些唱衰言论给出最好回应。

除了tmpC,TPC-C的评测还有一个重要指标,就是用系统的总价格除以tmpC得分,得到性能价格比的指标(Price/tpmC)。

在这一项指标中,OceanBase是3.98cny/tmpc,在折算后比甲骨文的Orcale数据库低了近50%。其中最为关键的一点是,Orcale在TPC-C使用顶配的专用设备,计算集群动用了108 颗 T3 SPARC 处理器,1728 个物理核心和 13824 个执行线程,同时使用了97 台 COMSTAR 专用存储设备,这些存储设备都经过专门的优化,使用Intel 服务器作为存储机头。

Oceanbase是布署在1557 台增强型阿里云ECS i2d服务器上的,并未使用专门存储。数据库的性能是很依赖服务器的计算与I/O能力,在这方面阿里云ECS i2d不但配备了Intel Xeon(Skylake) Platinum 8163 处理器、NVMe SSD本地磁盘,同时其网络性能也达到了25G的带宽和400万PPS的转发能力,这使得i2d适用于各种如OLTP、NoSQL与数据仓库等数据库应用场景。可以说阿里夺冠,不仅体现了阿里在数据库研发方面的实力,也展示了阿里云基础设施ECS的高性能与稳定性。

笔者在200 行代码解读国产数据库阿里 OceanBase 的速度源头!中曾经介绍过,OceanBase是基于Paxos分布式协议构架的数据库,其中如布隆过滤器等设计都对于其性能优化的问题,这里就不加赘述了。除了性能外,Oceanbase最大的亮点在于其HTAP的混合属性,这让Oceanbase解决了业界很多的痛点。

HTAP是2014年由Garnter提出的:混合事务/分析处理(HTAP)是一种新兴的应用体系结构,兼容两种业务场景。混合负载(HTAP Hybrid Transactional/Analytical Processing)是在保留原有在线交易功能的同时,强调了数据库原生计算分析的能力。支持混合负载的数据库能够避免在传统架构中,在线与离线数据库之间大量的数据交互,同时也能够针对最新的业务数据进行实时统计分析。简单的讲TP可以看作是战斗机的敏捷迅速属性,AP则相当于载弹量大、威力强的轰炸机。OceanBase就是这种混合式战机的典范。

缘起HTAP

HTAP的出现主要原因是当今大时代时代的数据和以前相比出现了明显的变化。根据笔者在银行业的观察,目前数据的生产者有以下几种类型:

第一类是应用产生数据。最早的数据生产机制是应用系统的副产品,也就是应用产生数据。为了满足业务,需要构建业务IT系统,随着IT业务系统不断在运行,大量应用数据就产生了。

这些数据经过ETL加工进入数据仓库进行再处理,供业务应用。这些数据都是单一的关系型数据,数据量级是GB的。这些数据利用早期传统的关系型数据库和数据仓库都可以处理完成。

第二类是行为产生数据。随着互联网和电商的快速发展,大量人的操作行为和使用行为产生的数据,像谷歌、脸书等大数据互联公司,都记录人的形成产生的数据。上网浏览、购买、评论、刷微博、玩抖音等行为都可以产生大量数据。这些数据不再是单一的结构化数据,出现了大量文档、音频和视频数据,数据量级是TB级的。

第三类是机器产生数据。进入万物互联的时代,大量机器传感器和IoT设备都会产生大量数据。这些设备 7*24小时产生数据,数据格式也是多种多样,有的是日志数据,有的是时序数据,有的是网格数据等等,数据量级是PB的。

由于处理的数据的规格、速度和多样性发生了根本变化,它不仅仅是要支撑到万亿记录数据库表的处理,还要支撑分析场景。而传统的TP数据库支撑交易业务,再吐出数据将给AP分析报表的用法,无法看到实时的战报结果,无法满足时间要求,这种变化,是传统的关系数据库,数据仓库以及大数据的Nosql数据库都是无法支撑的。因此以Oceanbase为代表HTAP数据库开始兴起了。

大数据时代的秘籍——唯快不破

传统的数据消费者是一般是决策层的领导。当业务系统产生数据,经过ETL加工处理进入数据仓库,经过数据主题设计和统计汇总,形成KPI仪表盘,提供给领导决策者服务,领导根据数据分析结果进行宏观决策服务。因此管理层不只需要对上一日的数据进行追踪即可。传统的纯AP或者TP数据库在这种背景下需适应节奏的。

随着移动互联网时代到来,大量个性化服务需求产生,数据分析结果不再是推送给公司管理层,而是要提供给一线营销人员,供他们直接使用。

例如,OceanBase支持阿里妈妈的广告报表查询,这使得数据实时性大幅度提升。再如,现在银行的一个移动启瓶器系统就需要向理财经理实时提供大客户的结息、净值等一系列个性化指标,用户有六万多人,需要支持至少五百个在线并发/秒。这些场景都要求基于实时数据的分析,传统TP与AP分享的数据库已经无法满足要求了。

OceanBase让数据产生价值

随着数据体量不断增大,传统的单机IOE计算框架向分布式计算框架转变,又一次实现移动数据和移动程序之间的转移。

在传统IOE计算框架下,数据在不同业务系统之间移动;进入分布式计算框架下,数据存在HDFS文件系统上,根据不同业务需求编写MR程序,进行数据处理。当数据库的计算框架从单机计算框架转向分布式计算框架,整个IT业务应用系统的架构也发生根本的变化。

数据在传统业务系统中从核心业务系统(TP),向数据仓库系统(AP),再向模型分析系统(SAS)进行迁移。

在新一代大数据应用系统中,数据可以不进行迁移,在大数据体系架构下,同时实现TP(实时交易),AP(数据分析)和ML(机器学习)等应用处理,极大提高数据利用率和工作效率。在大数据体系架构下,想要提升数据的价值,就必须减少无谓移动。这就要有一个全新的数据库架构体系进行支撑,可以说只有使用HTAP数据库架构体系,才能满足实时数据分析结果的需求,而OceanBase也是在这样的背景下孕育而生的。

为了支撑上述三大趋势变化,数据库除了应对操作型业务,还会在业务实时数据监控,数据报告和决策辅助方面有许多数据实时应用的场景。传统架构中OLTP和OLAP两类业务是完全分离的。两者的隔离导致整个系统在数据一致性,数据平台管理上带来了巨大的阻碍。

此前, RDBMS和大数据(Hadoop)分别成为数据处理的两个方面,一旦一种架构选择了一种场景,就不得不放弃另一种场景。因此,以OceanBase为代表的HTAP混合数据库,终将成为数据库发展的一个新要求,必将成为数据库发展的主流。

最后,笔者相信OceanBase本次再度刷榜TPC将大幅提升国人对于国产基础软件的信心。

国产数据库 OceanBase 二次刷榜 TPC-C,7 亿 tpmC相关推荐

  1. 国产数据库 OceanBase 二次刷榜 TPC-C,7 亿 tpmC!

    作者 | 马超 责编 | 伍杏玲 出品 | CSDN(ID:CSDNnews) 5月20日,世界上权威数据库评测机构--国际事务处理性能委员会(TPC),发布最新评测榜单,蚂蚁金服自研的分布式关系数据 ...

  2. 讲师专访丨蚂蚁金服庆涛:国产数据库OceanBase和分布式数据核心技术

    编者按:数据库在每个人的生活里无处不在,不管是通讯.交通.金融行业,亦或是每天大家都在接触的互联网,所有这些业务的背后都是数据库在支撑. 我国的数据库软件产业发展已有数十年,相继经历了技术跟踪期.创新 ...

  3. 你必须要了解的国产数据库——OceanBase

    文章目录 前言 1.什么是OceanBase? 2.OceanBase名字的由来 3.OceanBase 发展历程 4.OceanBase优势 5.OceanBase的核心特性 6.应用场景 7.未来 ...

  4. 2022年1月国产数据库排行榜:TiDB霸榜两年势头不减,openGauss与OceanBase分数大涨...

    奎钩粲粲光华动,群玉森森气象新.国产数据库行业在经历了2021年的躬行实践之后,产品.服务.生态等取得了蓬勃发展.从2022年1月份的国产数据库流行度排行榜上,我们可以看到,相较于去年12月份,榜单上 ...

  5. 2022年1月国产数据库排行榜:TiDB霸榜两年势头不减,openGauss与OceanBase分数大涨

    奎钩粲粲光华动,群玉森森气象新.国产数据库行业在经历了2021年的躬行实践之后,产品.服务.生态等取得了蓬勃发展.从2022年1月份的国产数据库流行度排行榜上,我们可以看到,相较于去年12月份,榜单上 ...

  6. jpa 人大金仓数据库方言_国产数据库的春天,人大金仓完成近亿元融资

    近日,人大金仓宣布完成近亿元融资.本次融资原股东太极股份等追加增资,同时引入战略投资方:电科研投.南威软件与东华软件,总融资额近亿元. 持续加码产品研发与市场拓展 本次融资将助力人大金仓持续加码产品研 ...

  7. 破记录!国产数据库KunDB 单节点TPC-C事务性能超180万tpmC

    近日,星环科技KunDB在TPC-C事务性能测试中,采用常规国产服务器,实现了单节点tpmC超180万,体现其世界级领先的事务处理能力. TPC-C是全球 OLTP 数据库最权威的性能测试基准,由TP ...

  8. 国产数据库40年大盘点,愿这盛世如您所愿!

    "六代繁华,春去也,更无消息.空怅望.山川形胜,已非畴昔.王谢堂前双燕子,乌衣巷口曾相识." -元词作家萨都刺<满江红·六代繁华>,说起国产数据库的开山始祖,非人民大学 ...

  9. 虎啸龙吟之国产数据库风云榜-2022年01月

    绝壁刻字 自古华山一条路,奇险天下第一山. 太阳初升,只见墨老大(墨天轮)一身白衣,潇洒飘逸,萧疏轩举,湛然若神,忽见身体瞬间横移,不见腿下脚下有任何动作,身体却出现在几十丈之外,使用的正是移形换位之 ...

  10. 2022年5月国产数据库大事记-墨天轮

    本文为墨天轮社区整理的2022年5月国产数据库大事件和重要产品发布消息. 5月国产数据库大事记 TOP11 5月国产数据库大事记(时间线) 5月1日消息,超融合时序数据库 MatrixDB 在 TPC ...

最新文章

  1. MySql 查询表字段数
  2. java百度api人脸识别_百度人脸识别api demo
  3. 基于poll实现的echo服务器
  4. 面向对象的程序设计——理解对象
  5. 科研经验:一篇学术文章要写多久
  6. navicat for mysql 导入psc文件
  7. 一招搞定高等数学! | 今日最佳
  8. 焊接空间臂_焊接烟尘净化器设备哪种好
  9. ant混淆编译java web,Android中使用ant混淆编译
  10. 文档屏幕水印_您的文档何时需要屏幕截图?
  11. 神经网络之预测共享单车使用情况
  12. python语言能做什么-python语言能做什么
  13. 系统学习机器学习之增强学习(一)--模型基础
  14. 谷歌浏览器书签丢失,恢复工具
  15. msl3等级烘烤时间_MSL等级
  16. 固态硬盘安装操作系统
  17. A graph auto-encoder model for miRNA-disease associations prediction 论文解析
  18. 仁义礼智信,忠孝廉耻勇
  19. 皇图中原青豫大战打到服务器维护,皇图2超变9377
  20. 隐藏删除 gitbook Published with GitBook 的方法

热门文章

  1. JavaWebDay13_课程回顾,Tomcat软件,Servlet入门.
  2. 服务器运行环境一般填什么,运行环境是什么意思
  3. 深入理解短时傅里叶变换 STFT + Python 代码详解
  4. Linux系统字符终端自动登录问题
  5. 后台经验分享:如何做权限管理系统设计?
  6. 巧做“士兵突击”的个性日历
  7. python语言实例-Python代码样例列表
  8. 信息系统项目管理师自学笔记(二十二)—— 网络应用与管理
  9. 全球及中国工业互联网产业运行态势与布局状况调研报告2022-2028年
  10. mysql codesmith_codesmith连接Mysql