曾经,一提起数据库,似乎只有专业的数据库厂商才足以研发。现在,这个边界变得越来越模糊。在第九届中国数据库技术大会的现场,我们可以看到硬件厂商侃侃而谈自己的数据库产品,可以看到云计算厂商开始分享自己在数据库领域的研发成果。

作为一家云计算厂商,数据库显然不是阿里云的主业,但在其官网的产品列表中,数据库产品在数量上具有绝对优势,为什么阿里云如此重视数据库的发展?商用产品和开源产品一大堆,阿里云做数据库的竞争力在哪?对于各大场合频频提起,多次被报道为数据库领域新趋势的HTAP,阿里云怎么看呢?

▲阿里云数据库高级产品专家 萧少聪

本文采访嘉宾:萧少聪(花名:铁庵)阿里云数据库高级产品专家。主要负责RDS产品的发展规划及产品演进。2011年获得Postgres Plus Professional认证,同年以理事身份筹建PostgreSQL中国用户会,2015-2018年担任PostgreSQL中国用户会主席。

▲阿里云高级技术专家、架构师 曹龙

曹龙(花名:封神),阿里云高级技术专家、架构师,专注在大数据分布式计算、数据库及存储领域,先后研发上万台Hadoop、ODPS集群,先后负责阿里YARN、Spark及自主研发内存计算引擎,目前为广大公有云用户提供专业的云HBase数据库及计算服务。

踏足数据库领域,这家云计算厂商做了哪些思考?

数据库是一款用户粘性非常高的产品,一旦核心业务数据落定,企业轻易不会尝试更换。在这个可以说对后来者不太友好的圈子,阿里云入局前是如何思考的呢?

用户需求驱动和技术沉淀应该是大多数厂商踏足数据库领域的原因,这也同样是阿里云入局原因之一,只是在程度上有所不同。根据萧少聪的介绍,作为一家云计算厂商,阿里云长期服务于众多不同类型的用户,对用户痛点挖掘更深。在新的时代背景下,现有产品无法满足用户新的应用需求,同时不能充分发挥新硬件的性能;当然,这个问题不仅用户存在,阿里巴巴自身同样存在。阿里所面对的庞大数据量和复杂的业务场景是很多厂商无法触及的,这让阿里内部很早就着手于数据库的研发,目前提供的不少数据库产品正是阿里多年技术能力对外输出的表现。

如果单凭这两点,阿里云确实有一定优势,但并不足以构成核心竞争力。对企业和厂商而言,现在做数据库的门槛并不像从前那么高,数据库领域的厂商也越来越多,核心竞争力只可能从差异性发展而来,人人都在做且会做的东西很难形成核心竞争力。

曹龙表示,阿里云做数据库与第三方数据库厂商最大的差异性在于云,阿里云强调云数据库,这就意味着共享,通过程序共享,让企业享受更低成本,当然,前提是你的用户足够多;其次,阿里云平台的产品多样性以及无缝对接能力同样是很多厂商短时间内无法达到的,阿里云平台所承载的产品不仅仅只有云数据库,各产品之间已形成良好打通,一个平台足以解决多类场景问题。

思考结束,阿里云正式踏入数据库领域,准确的说应该是踏入云数据库领域。

开源商用,阿里云如何和开源产品拉开距离?

阿里云不乏开源商用云数据库产品,萧少聪和曹龙本人负责的RDS系列及云HBase就是最好的示例。当然,不仅仅是阿里云,不少数据库厂商都会在开源基础上进行修改。既然是在开源基础上进行修改,企业不免思考这个事我自己能不能做?我是否有必要购买这款商用产品?

企业要基于开源进行修改首要思考的就是技术和人才是否到位,人才问题暂且搁置一边,如果你有足够高的筹码,人才问题比较好解决。我们先来讨论技术问题,以阿里云RDS和云HBase为例,企业不妨看看阿里云都做了哪些改进?

首先是云数据库RDS PPAS版,这是阿里云与EnterpriseDB公司合作基于PostgreSQL高度兼容Oracle语法的数据库服务。众所周知,EnterpriseDB本身就是一家提供基于PostgreSQL企业级产品与服务厂商,基于EnterpriseDB的部分技术能力,阿里云构建了自己的RDS PPAS版,萧少聪坦言,PPAS与PostgreSQL的内核都是一样的,PPAS只是多了Oracle兼容性,可唯这一点便解决了很多企业的大难题。

企业中不乏想从Oracle迁移到其它商用或开源解决方案的,虽然迁移工具很多,但很难保证百分百兼容且应用程序完整迁移上云。PPAS要解决的问题是不同架构和不同底层数据库之间的迁移,将应用程序从Run Oracle完整迁移到Run PPAS。如果想更换其他开源解决方案,企业可以先从Oracle迁移到PPAS,整个过程语法改写较少。熟悉了云数据库架构之后,企业可以另行选择其他解决方案,PPAS在这个过程中更多扮演着桥梁的角色。 综上,这些都让PPAS与开源PostgreSQL、其他商用解决方案拉开距离。加之阿里云提供全流程的ADAM(亚当)平台,协助用户进行迁移的:事前评估、过程管理、数据同步、保障性回流、上线前性能对侧、应用程序兼容SQL发现等功能,使得用户进行数据库异构迁移过程更有保障。

如果谈起曹龙负责的云数据库HBase,这是一款基于Hadoop且百分百兼容HBase协议的分布式数据库。近些年,HBase在许多大型甚至超大型公司被广泛应用,阿里巴巴内部就有很多场景应用了HBase,因此,性能优化从未停止。但是,追求性能的同时必然会损失其他特性,比如易用性、备份恢复等。阿里云对于HBase的改进首先从内核及架构开始,对读写、延迟以及压缩算法等各方面进行了深度优化;其次,完善中小企业关心的易用性、备份恢复以及SQL入口......

RDS产品系列不只有PPAS,阿里云云数据库也不只有RDS和云HBase。萧少聪认为,今天所提到的数据库,不仅仅是一个引擎,更是一整套管理体系,一个完整的云解决方案,正是这样的定位让阿里云的云数据库产品与开源产品真正拉开距离,就好比虽在同一起点却是两条跑道。

HTAP到底是不是数据库领域新趋势? 阿里云:是,但这不会是终局!

去年,我们就见过不少文章将HTAP列入未来数据库领域发展趋势之一,HTAP意味着可以通过一个数据库系统同时满足事务性需求和分析型需求,最具代表性的当属谷歌的Spanner+F1论文,产生了一大批NewSQL系统。对比这两年出现在数据库技术大会上的议题,今年关于HTAP的议题明显增多,这会是数据库领域的一大趋势吗?

对此,曹龙表示HTAP很难称作数据库领域的趋势,如果算,可能也只是对少数公司而言。他表示,真正的大公司离线与在线分得很清楚,几乎不会做HTAP,因为数据量实在太大。其次,如果要做,数据往往要打通,这里所说的数据不仅仅是业务数据,而是整个集团的数据,这对于大公司而言很难实现,但如果某个业务团队有需求,还是可以实现的。

萧少聪补充道,如果一家公司需要迅速将数据变现,在人力与物力不足的情况下,可以考虑采用HTAP的方式。同时,随着硬件成本的逐年降低,这种方式可以在公司短期的发展内满足诉求,但随着公司数据量的扩大,我们也依然很难通过一个数据库就解决所有问题。当数据量到达HTAP无法支撑时,通过独立并专业的OLTP、OLAP、BigData数据库系统,加上顺畅的数据通道,实现业务流通分层计算,依然是现今最为成熟的方案。

综上,HTAP适用于部分体量的公司,可能是这类公司数量增多,也可能是业务部门对该技术的需求上升,导致了HTAP在数据库领域的关注度升高。但当公司成长到一定规模,这种方式显然不适用于业务发展,当前我们还没有看到HTAP可以做到独领风骚,但这一技术架构确实会是企业某一发展阶段的最佳选择。

结语

近年来,从大批硬件和云计算厂商涌入数据库市场就可看出,数据库市场存在大量发展机会并蕴藏巨大价值。本以为阿里云做数据库不过是想分一杯羹,但细算下来,笔者发现这家云计算厂商对用户需求、企业痛点以及发展方向都做了不少思考,很擅长发挥自己的优势。当然,阿里云确实有先天优势,比如多年技术实力沉淀以及云计算业务积累的忠实用户。但是,数据库领域拼了这么久,谁又说得清胜负呢?路程还远,尚未到盖棺定论之时,但阿里云接下来在云数据库领域的一切行动还是值得期待的。

专访阿里云萧少聪、曹龙:一家云厂商对入局数据库做了哪些思考?相关推荐

  1. 【墨天轮专访第二期】巨杉数据库萧少聪:重视企业长期需求,打造中国的世界级产品

    导读: 随着这些年业界对不断涌现的国产数据库产品呼声越来越高,国产数据库的进步有目共睹.尤其是随着数字金融及互联网在国内急速的发展,以及5G时代的来临,在数据量级业务复杂度方面,可以说中国的数据模式及 ...

  2. 全面解密阿里新零售供应链 | 专访阿里研究员大少

    阿里在新零售领域的动态,一直备受关注. 从天猫超市早期的3日达.当天达再到一小时达:从盒马鲜生诞生,喊出3公里内半小时送达的服务效率,到天猫小店的数量越开越多,国际直营7天之内便可收到快递. 阿里的这 ...

  3. 专访阿里云总裁王文彬:做出“用得爽”的工程产品

    摘要:已拥有近百万不同行业领域用户的阿里云,在产品开发.服务输出与生态系统建设等方面还将继续加速,多点开花. 回顾在2014年已经过去的半年中,阿里云在产品开发.服务输出与生态系统建设层面的诸多动作. ...

  4. 专访阿里云游戏首席架构师李刚:如何解决云服务技术两大痛点?

    原文链接:点击打开链接 摘要: 对于阿里云来说,游戏相关的项目合作一直在增加. 对于如今的游戏行业来说,云服务早已不是什么新鲜的话题.一定程度上,不论是近期兴起的手游,还是曾经的端游和页游,如今都会或 ...

  5. 本地 vs 云:大数据厮杀的最终幸存者会是谁?— InfoQ专访阿里云智能通用计算平台负责人关涛...

    摘要: 本地大数据服务是否进入消失倒计时?云平台大数据服务最终到底会趋向多云.混合云还是单一公有云?集群规模增大,上云成本将难以承受是误区还是事实?InfoQ 将就上述问题对阿里云智能通用计算平台负责 ...

  6. 阿里云贾少天:大规模云服务器高效使用及管理实践

    简介:本篇内容分享了大规模云服务器高效使用及管理最佳实践. 2021年10月22日,在云栖大会的<云上运维最佳实践>分论坛,阿里云高级技术专家贾少天发表了主题为"大规模云服务器高 ...

  7. 关于SDN的未来,Linux基金会专访阿里云网络大神

    摘要: 近日,大家熟知的国际开源组织Linux基金会与阿里云进行了一次访谈.专访了阿里云网络团队掌门人江鹤.江鹤执掌阿里云网络产品线,并负责阿里集团网络虚拟化产品的研发管理工作.在软件定义网络(SDN ...

  8. 专访阿里云雁杨:因需求而进化,ECS云服务器追求弹性极致

    编者按:10月11-14日,为期四天的2017杭州云栖大会(门票火热抢购中!)将再度在杭州云栖小镇起航,作为全球最具影响力的科技展会之一,本届大会将有不少阿里集团专家以及各企业行业领袖的精彩演讲.从今 ...

  9. 阿里云研究员马涛:龙蜥社区做对了两件事

    在刚刚结束的 2022 云栖大会龙蜥操作系统峰会上,龙蜥社区理事长.阿里云研究员马涛进行了<开放算力,云启未来>的主题演讲,下文为演讲摘要. 我们相信操作系统将成为数字产业支柱算力来源,龙 ...

最新文章

  1. python学习笔记 day25 封装
  2. Android 监听APP进入前台、后台
  3. 牛客 - 血压游戏(虚树+dp)
  4. python大文件排序_python实现按创建时间对文件排序
  5. vcpkg安装_[工具]包管理工具Vcpkg 的使用
  6. rust异步编程--理解并发/多线程/回调/异步/future/promise/async/await/tokio
  7. 线性表之简介及顺序表
  8. 深度学习专项课程精炼图笔记!必备收藏 | 原力计划
  9. java基础学习(3)
  10. 正运动技术 运动控制卡应用开发教程之C#
  11. python实现图片转字符画
  12. SIM868——GPS加速定位方法
  13. 高精度绝对角度传感器应用高速度角度监测
  14. django账户管理系统admin
  15. 2018年视频云服务市场格局进入整合阶段,阿里云视频云位居市场竞争力领导者的位置... 2
  16. java.nio.Buffer.filp()方法的用法详解
  17. 护眼灯真的可以保护眼睛吗?市面上的护眼台灯到底是不是智商税
  18. 吐槽我是特种兵之霹雳火
  19. 很全的机器视觉、模式识别库
  20. 解决:无法打开文件“GCBase_MD_VC120_v3_0_Basler_pylon_v5_0.lib”

热门文章

  1. 并发编程-15并发容器(J.U.C)核心 AbstractQueuedSynchronizer 抽象队列同步器AQS介绍
  2. Spring Boot2.x-03Spring Boot基础
  3. linux crud命令,crudini命令 – 操纵ini文件
  4. CSDN内容颜色、位置以及图片大小改变
  5. Redis中的自动过期机制
  6. 怎么把文件放在python目录下-python – 如何将文件下载到特定目录?
  7. 深入理解ROS技术 【3】ROS下的模块详解(129-180)
  8. 【TypeScript】获取随机数,并随机生成年份,判断是否为闰年
  9. linux 基本脚本编写
  10. Python中的线程threading.Thread()使用详解