点击上方蓝字,关注我们!

分布式存储可扩展性强、灵活度高,如果能做到集中式存储的低时延,必定会成为主流的存储技术路线。

—— 黄岩

黄岩是云和恩墨分布式存储总架构师。十几年来,他在存储领域,尤其是NAS和备份中深入钻研,曾担任某NAS产品性能SE,负责产品性能调优工作。2011年,该产品打破了SPESsfs性能测试世界纪录。

  • 为何分布式存储如此受欢迎?

  • 为什么它是未来存储的发展方向?

  • 分布式存储可以用于OLTP数据库吗?

带着这些问题,笔者采访到黄岩老师,且听他细细道来……

尺有所短:

可扩展性差和云端不友好成为集中式存储的瓶颈

“2010年,我进入了企业存储领域。那时候传统的集中式SAN存储(磁盘阵列或阵列)已经很成熟了。EMC、IBM、HDS都在销售相关产品。”黄岩回忆道,“NetApp的集中式NAS(文件服务器)产品也很受欢迎。但是随着业务的不断发展和数字化转型的推进,集中式存储的弊端越来越凸显。”

说起集中式存储的弊端,可扩展性差是绕不开的问题。一般来说,集中式存储的中低端产品可以支持两个控制器,高端产品最多支持32个控制器,面对更多的存储要求时,无法再进行有效扩展。因此,客户在购买集中式存储产品之前,必须根据对未来业务发展情况的预测确定存储性能和容量需求,从而决定自己所选存储产品的类型。

预测未来总是困难的。“预测不准确可能导致所选产品与业务发展不匹配的情况。”黄岩进一步解释道,“根据预测,企业选择了低端产品。但业务成长比预估快,存储性能或者容量无法拓展,限制了企业发展。客户直接选择高端产品,价格高昂不说,如果后期业务没有充分利用这些性能或容量资源,就会造成浪费。”

此外,在数字化转型的过程中,为了应对以“烟囱式架构”为主的系统在资源利用、运维管理等方面的挑战,越来越多的企业开始搭建云平台。“在私有云模式下,企业某个部门如果有建设新IT系统的需求,只需填写电子流申请虚拟机、存储资源、数据库PaaS服务即可。只要电子流审批通过,部门就获得了所需的底层计算和存储资源,不再需要走招标、采购流程来购买新硬件。但实现这一过程的前提是各种资源可以统一调配。显然,集中式存储做不到这一点。”

在私有云平台上,集中式存储的局限性主要体现在存储空间和性能资源的相互隔离。“打个比方,当我们发现电脑C盘空间不足而D盘还有剩余时,是无法把D盘空间划分给C盘使用的。私有云平台也存在类似问题。”黄岩说,“现在平台有两套集中式存储设备,分别给A、B两个部门使用。由于隔离的存在,如果A部门的存储空间或者性能不足,B部门的资源无法分配给A使用。”

乘势而兴:

分布式存储动态扩展、向云而生,满足企业发展需求

有需求就会有解决方案,分布式存储恰好弥补了集中式存储的短板。“企业希望存储做到‘随机应变’,而分布式存储具有很高的可扩展性。”黄岩说,“分布式存储能够添加多个服务器节点,可扩展至几十、几百,甚至几千个,来实现储存容量的线性扩展。这样一来,用户不需要对未来业务发展做出准确的预测,就能做到游刃有余。此外,当扩展了多个节点后,存储数据会转移到新节点,实现负载均衡,这样就不会出现单个储存区域负载过重的情况。”

分布式存储的竞争力不止于此。对于私有云平台来说,分布式存储具有天然优势。“云平台的重要特征之一是帮助用户实现即需即用,灵活高效地利用网络资源。分布式存储资源之间没有隔离,可以帮助企业用户打造统一的容量和性能资源池。”黄岩补充道。

此外,多数分布式存储产品都属于软件定义存储(SDS),不需要配置专用硬件。用户在通用服务器上安装软件,并将这些服务器用网络链接起来,就完成了分布式存储系统的搭建工作。“客户可以分开购买软、硬件,自由选择更合适的通用服务器,不再受存储厂家限制。这种灵活性是集中式存储无法比拟的。”黄岩说。

虽然有效弥补了集中式存储的短板,但是分布式存储存在一个较为明显的缺点——时延高。“集中式存储在两个控制器之间使用了专门设计的高速通信通道,处理写请求复制数据的时候,时延低。分布式存储要通过通用网络,也就是网卡和交换机来复制数据,时延比较高。”黄岩解释到,“同时,集中式存储一般配备电池备电单元,写请求数据放到内存就可以返回成功,而分布式存储使用通用服务器,必须要写硬盘成功才能返回。这是导致其时延高的另外一个原因。”

由于这个局限性,分布式存储主要应用在对时延要求不高的场景中,比如虚拟桌面(VDI)、存储资源池、存储图片、存储视频等场景。“那么,我们能不能降低分布式存储的时延,使其能应用于OLTP场景呢?这是一个机会!”谈到这里,黄岩明显兴奋了很多。

择善而从:

低时延的分布式存储在OLTP数据库中大有可为

据IDC预测,适用于事务型数据库的分布式块存储市场将保持快速增长,仅在中国,2026年这个细分市场会达到接近15亿美元的规模。

“我们清晰地感知到了市场对于数据库专用分布式存储的强烈需求。”黄岩说,“基于现有成熟的基础技术,我们可以开发一款高IOPS、低时延的数据库专用分布式存储产品,它不仅能够满足OLTP应用对用户极致体验的追求,也具有通用分布式存储高可扩展、灵活易用的特点。”

谋定而后动。在云和恩墨确认进军数据库专用分布式存储市场后,黄岩开始牵头研发存储产品 zStorage。他曾经担任某下一代NAS和某备份介质产品架构师,带领团队研发了自研分布式文件系统原型机,在架构设计和主要框架代码编写上具有丰富的经验。“现在 zStorage 的3节点原型机随机读写IOPS达到了100万(读写比例7:3),平均时延低于0.8ms。”黄岩说,“据我们了解,目前市场上的大多数分布式存储产品还没有达到这个水平。随着技术创新迭代,时延达到集中式存储的水平也只是时间问题。”

黄岩提到的 zStorage 是云和恩墨正在研发的数据库专用分布式存储产品,可以为金融、运营商、政务等高价值数据行业构建稳固的数据基础设施。“左晖曾提出‘做难而正确的事’,而我选择走一条难而正确的路。也就是说,我们要做的与市场上多数Ceph分布式存储产品并不相同。”黄岩说。

Ceph是由学术界在2006年提出的分布式存储系统的解决方案。目前,很多研发分布式存储的厂商都在基于Ceph做产品化。黄岩指出,数据库OLTP应用最重要的需求是低时延,Ceph在这方面并不具备优势,对其进行优化也比较困难

黄岩认为,Ceph优化难的原因在于其编程模式:(1)为了充分利用CPU的多核能力,Ceph在一个进程内部创建很多线程;(2)多线程之间共享工作队列,工作队列必须用锁来保护;(3)大量全局数据结构在多线程之间共享,为避免并发访问造成的数据损坏,也需要锁来保护;(4)线程用同步IO操作访问,网络和硬盘可能发生阻塞,因此创建的线程数量必须远远大于CPU核的数量,这样就会造成多个线程在一个CPU核上频繁切换,性能消耗大,对业务代码的优化无法完全抵消这种消耗。

黄岩说:“Ceph的这种编程模式很难改变。如果非要改变,就必须把所有代码重写,这显然不现实。因此,我们决心换一种模式—— zStorage 采用每个CPU核只有一个线程,这个线程上任何一个处理函数中都不允许调用可能发生阻塞的系统函数、不允许访问全局变量、不允许用锁。虽然这种模式编程更困难,工作量更大,但性能更优,能更好地满足企业用户对低时延数据库专用分布式存储的需求。”

谈到对 zStorage 的产品规划时,黄岩感慨地说:“都说台上一分钟,台下十年功。我们既然选择走一条难而正确的路,就意味着研发时间会更长、投入也会更大,但我坚信这是一条通往成功的路,且我们正在按自己的节奏和计划稳步推进中。我希望团队能够在深刻理解用户需求的基础上,充分发挥创造力,不断实现产品灵活、高效、低时延的目标。”

据悉,zStorage 将于今年10月份和大家正式见面,敬请持续关注。

数据驱动,成就未来,云和恩墨,不负所托!


云和恩墨创立于2011年,以“数据驱动,成就未来”为使命,是智能的数据技术提供商。我们致力于将数据技术带给每个行业、每个组织、每个人,构建数据驱动的智能未来。

云和恩墨在数据承载(分布式存储、数据持续保护)、管理(数据库软件、数据库云管平台、数据技术服务)、加工(应用开发质量管控、数据模型管控、数字化转型咨询)和应用(数据服务化管理平台、数据智能、隐私计算数据联邦平台)等领域为各个组织提供可信赖的产品、服务和解决方案,围绕用户需求,持续为客户创造价值,激发数据潜能,为成就未来敏捷高效的数字世界而不懈努力。

当OLTP数据库遇上分布式存储,我选择走一条难而正确的路相关推荐

  1. 当数据库遇上自动驾驶,阿里云 DAS 在自治诊断的突破

    导读:VLDB 2020(The 46th International Conference on Very Large Data Bases)学术会议是数据库领域的顶级会议,今年VLDB收录多篇AI ...

  2. 雍培:电力遇上大数据,使我的科研如鱼得水 | 提升之路系列(九)

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  3. 【服装设计作品集】珠宝设计转服装设计?走那条未被众人选择的路

    ▲莱佛士设计学院学生作品 "两条路在一片树林中分叉,我选择了一条人较少的路,使这一切都变得不同."   这句话不仅是对莱佛士学生Hay Mar WIN人生旅途中某一阶段的诠释,也是 ...

  4. 理想汽车×OceanBase:当造车新势力遇上数据库新势力

    6 月 21 日晚 20:00,理想发布了 2022 年的旗舰车型 L9.三维空间交互.超强计算平台.五屏视听系统.AD Max 旗舰级智能驾驶......作为一款大型家庭智能旗舰全尺寸 SUV,不论 ...

  5. 阿里云HBase全新发布X-Pack NoSQL数据库再上新台阶

    一.八年双十一,造就国内最大最专业HBase技术团队 阿里巴巴集团早在2010开始研究并把HBase投入生产环境使用,从最初的淘宝历史交易记录,到蚂蚁安全风控数据存储.持续8年的投入,历经8年双十一锻 ...

  6. 阿里云HBase全新发布X-Pack NoSQL数据库再上新台阶 1

    一.八年双十一,造就国内最大最专业HBase技术团队 阿里巴巴集团早在2010开始研究并把HBase投入生产环境使用,从最初的淘宝历史交易记录,到蚂蚁安全风控数据存储.持续8年的投入,历经8年双十一锻 ...

  7. 工智能遇上银行反欺诈,到底能帮什么忙

    工智能遇上银行反欺诈,到底能帮什么忙 晚来风急 2017-08-02 11:42:00 浏览39 评论0 深度学习 大数据 算法 人工智能 神经网络 摘要: 说到人工智能,大多会联想到聊天机器人.人脸 ...

  8. [当人工智能遇上安全] 6.基于机器学习的入侵检测和攻击识别——以KDD CUP99数据集为例

    您或许知道,作者后续分享网络安全的文章会越来越少.但如果您想学习人工智能和安全结合的应用,您就有福利了,作者将重新打造一个<当人工智能遇上安全>系列博客,详细介绍人工智能与安全相关的论文. ...

  9. dts数据库迁移工具_传统数据库迁移上云利器-ADAM

    自1970年关系型数据库被提出以来,至今已有50年历史.但在关系型数据库领域正在发生着巨大的变化,首先是互联网的发展,使得开源数据库越来越受欢迎,可扩展性成为支撑业务发展的重要特性,比如WebScal ...

最新文章

  1. 新同事说工厂模式有啥用,别学了
  2. python3 pip3 install 报错 ModuleNotFoundError: No module named ‘_ctypes‘ 解决方法
  3. [转] apache配置rewrite及.htaccess文件
  4. 数十亿次数学运算只消耗几毫瓦电力,谷歌开源Pixel 4背后的视觉模型
  5. ubuntu重置root密码
  6. JSON 之 SuperObject(3): 访问
  7. Xcode5 取消项目ARC,或者单个类ARC切换
  8. apache多域名403配置
  9. awk当中使用外部变量
  10. Java8-为什么选择java8
  11. 【C++】大小端转换
  12. 信安从业者认证一览【建议收藏】
  13. EDEM - Fluent - CFD风道耦合
  14. python 矩阵对应元素相乘,python 矩阵对应元素相乘_Numpy——numpy的基本运算
  15. HYPERLEDGER FABRIC-CA学习
  16. STM32并口驱动AD9854——HAL库
  17. 输入参数varargin
  18. Python 视频、图片、音频爬取下载 you-get
  19. 数据结构(七)高级排序算法——归并、快速排序
  20. 模块regsvr32 c:\Windows\SysWOW64\comdlg32.ocx 加载失败

热门文章

  1. 求数组长度的几个函数
  2. 【愚公系列】2022年03月 ASP.NET Core中间件-功能开关
  3. 六石管理学:话不投机半句多,注意谈话中的抬杠及对策
  4. 6,少年白_因为我还小
  5. SGD,Adam,momentum等优化算法比较
  6. Android学习笔记:Handler
  7. CHAPTER 5 Docker数据管理
  8. 计算机截取最高分和最低分的函数,Excel中竟真的有一函数,可以去掉最高分、最低分,计算最终得分...
  9. 《问道》1月28日三区组体验1.43新版
  10. java web应用程序设计填空题_Java Web程序设计题库答案