近年来各个行业对超融合(Hyperconverged Infrastructure, 简称 HCI)的关注度越来越高,但各家厂商的超融合架构实现方法各有不同。我们在这里不评判对错,也不去探究这些是不是真正的超融合,而是重新追本溯源,思考为什么超融合现在被关注,什么样的 IT 架构更 “合适” 于当今的商业。

首先,SmartX 选择超融合架构的原因,是传统存储解决不了现在企业数据中心的问题。据麦肯锡研究显示,全球的 IT 数据每年在以 40% 的速度增加中。数据正在逐步影响商业,企业通过数据的分析来做决策与管理。完成快速的分析决策和管理,就需要借助强大的数据中心。下图为传统 SAN 存储:

https://www.smartx.com/blog/2016/03/hci-essence-arcticle-1/

SAN.png
传统 SAN 存储
但是,光靠越来越快、核数越来越多的 CPU 是不够的,瓶颈在于传统存储的硬盘太慢了,CPU 大部分计算能力都空闲或者说在等待存储数据传输过来。传统存储容量和性能不具备和计算能力匹配的可扩展性,不能满足企业进行数据访问的需求。

IO of SAN.jpg
传统 SAN 存储遭遇 I/O 瓶颈
这个问题并不是现在才有。Google 很早遇到这个问题。那么 Google 是如何做的呢?

作为一个给全世界互联网网民提供数据检索的企业,Google 考虑过 EMC、IBM,还有当年的 SUN 存储产品,但是都解决不了它的问题。无论是容量还是性能,这些公司的产品都无法满足 Google 的规模需求。于是 Google 只能自己建立一个适合自己的数据搜索的存储结构了。
添加链接描述
Google 优秀的计算机科学家们,打破了传统的存储思维,利用服务器的本地硬盘和软件构建了一个容量和性能不断可扩展的分布式文件系统,并在其上构建了其搜索和分析的计算引擎:

不用把数据从存储端取出来,然后通过网络传输到计算端,而是将计算直接分发到存储上运行,将 “计算” 作为传输单元进行传输,这样大量的存储数据都是本地访问,不需要再跨网络上传输了,自然访问很快。于是乎,自然而然地,“计算” 和 “存储” 运行(“融合”)在了一个服务器上,这里也看到超融合架构的一个优势就是,本地访问数据,不必跨网络。

HCI.png
超融合架构示意图
现代企业的数据量越来越大,应用越来越多,他们开始面临当年 Google 遇到的问题,CIO 要考虑怎么更高效的构建自己的计算和存储的基础架构,来满足应用的数据访问需求。

虚拟化为更容易的管理应用而生,它解决了 CPU、内存资源闲置的问题。但随着虚拟化的大规模应用,虚拟机越来越多,虚拟机在传统存储上运行却越来越慢了。“慢” 造成 “体验差”,“体验差” 成为了限制虚拟化应用的最大的瓶颈。这里面的最重要原因自然是,存储的 I/O 性能不够,大量的虚拟机和容器同时运行,I/O 的混合,使得随机读写急剧增加,传统存储的结构无法承受大量的随机 I/O。

超融合恰恰是为了解决这个问题,才被带到了虚拟化和容器领域。同时,业内也存在不同的解决 I/O 问题的方法,我们先尝试分析下其他的解决方法:

解决方法一:在存储设备采用 SSD 做 Cache,加速 I/O。这在一定的规模下可能有效,但是存储设备的 SSD Cache 通常比例较小,不足 5% 的容量比的情况下,自然满足不了用户的热数据的缓存需求。另外,仍然无法随需扩展,所有的数据仍然要从集中的存储控制器流出,这个集中的 “收费站” 势必堵塞 “高速公路”。

解决方法二:使用服务器侧 SSD 做 Cache,加速 I/O。这种类似的解决方案,通常缺乏高可靠性软件的支撑,服务器端的 Cache 如果用做写 Cache,存在单点失效的问题,需要在多个服务器的 Cache 设备上,做副本来提供可靠性,可以说这是一个阉割版的超融合架构,将 Cache 放到服务器端,仍然使用传统存储,当 Cache 满,需要被写回传统存储的时候,仍然被传统存储的 “控制器” 限制整体性能。

我们看到,上面的两种方案都是受限于传统存储的结构。超融合存储则不一样,通过完全去掉传统存储,利用分布式文件系统来提供 “不可限量” 的性能和容量,在这个基础上,再通过 Cache 进行加速,甚至全部使用闪存(全闪存产品)来构建都是自然而然,不被限制了。

因此,超融合架构不是为了让单台服务器的存储飞快,而是为了让每增加一台服务器,存储的性能就有线性的提升,这样的存储结构才不限制企业业务的运行,并保证业务的可靠性。

IO of HCI.png
超融合将存储池化,性能线性提升
正因为这种扩展性很好的共享存储,使得整个 Google 的业务得以顺畅地运转。SmartX 在做的就是这样的更好的、更稳定的基础服务。

另外,超融合近几年得以快速发展的原因,这要归功于硬件设备。CPU 核数越来越多,服务器的内存容量越来越大,SSD 设备和网络互联网设备越来越快,这意味着:

服务器的资源除了运行业务以外,仍然可以预留出来足够的CPU,内存资源来运行存储软件。将存储软件和业务运行到一块,既减少了设备量,减少了电力使用,本地读取也提高了 I/O 的存取效率。这在几年前是做不到的,因为 CPU 和内存太有限了。
网络互联越来越快,无论是万兆,40Gb 以太网,还是 Infiniband(无限宽带技术),使得我们的软件能够将独立的存储设备进行互连,通过分布式文件系统形成共享的存储池,供上层应用使用。
如果说 SSD 等硬件厂商让单个存储设备跑的更快,我们的软件的意义在于,让超大量的这些存储设备,一起工作,提供无止境的整体性能和容量。
本篇的内容就是这样,下篇文章我们还将讨论超融合架构的一些基本问题。

HCI 基础系列:超融合架构的本质是什么(上)相关推荐

  1. 超融合架构的本质是什么(上)

    注:本文转载自[SmartX超融合]微信官方公众号,点击这里可阅读原文. 整个市场近年来对超融合的关注度越来越高,但各家厂商的超融合架构实现方法各有不同.笔者不评判对错,也不去探究这些是不是真正的超融 ...

  2. 戴尔XC系列超融合基础架构全新升级 进一步帮助用户提升效率与经济性

    客户往往想要大幅简化其基础架构,因此超融合基础架构已成为IT基础架构中增长最快的部分.据IDC数据显示,全球超融合系统市场在2016年仍然是广泛的融合基础架构市场中发展速度最快的细分市场,其在全球范围 ...

  3. 赠书 | 年终盘点:超融合架构(HCI)的现状和前景; 中国HCI厂商列表; 全球有哪些HCI厂商?

    [编者按] 这篇文章可能会引起一些朋友或读者的不满,但确实是我个人在现阶段的真实看法.欢迎交流,用你的思考.依据来影响我.说服我. 临近年底,会议比较多,也借这个机会见到了一些存储圈和微信群里的朋友, ...

  4. 超融合架构HCI和传统数据中心三层架构的比较

    超融合基础架构(Hyper-Converged Infrastructure,或简称"HCI")是指在同一套单元设备中不仅仅具备计算.网络.存储和服务器虚拟化等资源和技术,而且还包 ...

  5. 超融合架构(HCI)和软件定义存储(SDS)的关系和发展

    作者简介:叶毓睿,现任VMware存储架构师,曾任职于EMC, Compellent, DELL.<软件定义存储:原理,实践与生态>作者,同时也是微信公众号"乐生活与爱IT&qu ...

  6. 超融合架构的优缺点_知道 超融合基础架构吗

    一"融合"架构的起源 "融合"架构最初的解决方案通常包括了服务器.SAN存储和网络(以太网或InfiniBand).一般是由单一供应商提供的包括服务器.存储和网 ...

  7. 超融合架构与容器超融合

    原文链接: http://geek.csdn.net/news/detail/96101 最早大概是由NUTANIX知道"超融合"概念,原本以为这又是厂商的噱头和炒作,谁知不然,超 ...

  8. 深度剖析——超融合架构应用与实践分享

    大家好,我是青云的 lester ,目前负责青云QingCloud 的超融合产品系列.今天由我向大家分享 QingCloud 对超融合架构的理解,以及在超融合架构方面的实践经验. 今天分享的话题主要分 ...

  9. 超融合架构下的数据中心

    超融合基础架构(Hyper-Converged Infrastructure,简称HCI)将虚拟计算平台和存储融合到一起,将每台服务器里面自带的硬盘组成存储池,以虚拟化的形式提供数据中心所需要的计算. ...

最新文章

  1. fckeditor编辑器上传文件出现invalid Request问题解决
  2. 计算机维修工国家职业标准,计算机维修工国家职业标准.pdf
  3. EJB----消息驱动bean--Topic 消息的发送与接收(Pub/sub 消息传递模型)
  4. MySQL事务autocommit自动提交
  5. Hibernate @OneToMany 及 @Cascade级联操作
  6. java七大_Java 7七大新功能
  7. 2021新职业教育行业发展研究报告
  8. pip install keras_常用基本pip命令及报错问题解决(不断更新)
  9. JetBrains 2017/2018全系列产品激活工具
  10. 国内游戏产业现状十一谈
  11. 安卓智能手机完全装机手册,让安卓拥有无限可能!
  12. [含论文+答辩PPT+任务书+源码等]javaweb户籍户口管理系统
  13. html5 canvas 涂鸦画板
  14. 知识图谱在教育行业的应用
  15. linux shell 命令记录
  16. 国内的 App 推广渠道有哪些?
  17. Structed Streaming(Continuous Processing报错):StreamingQueryException;java.util.NoSuchElementException
  18. 证券投资深度学习_基于风险中性的深度学习选股策略
  19. 离散数学学习笔记(一)
  20. 孤立森林算法 python_孤立森林(isolation forest)

热门文章

  1. 建筑模式语言(美)c.亚历山大.pdf,建筑模式语言下街区设计.pdf
  2. excel如何拆分表格为多个
  3. 手机如何批量导入通讯录,批量删除通讯录?
  4. Matlab 泰勒图
  5. 在线靶场-墨者-安全意识3星-日常密码泄露分析溯源
  6. 【前端】wepy/mpvue/taro/uni-app,多端开发框架哪家强?
  7. 【uniApp 个推推送功能】
  8. dedecms 模板引用php文件名,织梦DEDECMS模板文件名介绍与说明
  9. 强悍!基于Vue的无渲染的富文本编辑器——tiptap!
  10. mysql中cube是什么意思中文,什么是EC-CUBE