云存储可靠性的计算方法

最近在做云存储EC集群数据可靠性的计算,上网查阅了一下资料,却发现相关的计算方法过于复杂,而且还是错误的。经过了仔细思考以后,捋顺数据可靠性的计算方法。现在在这里写出来,供同样做数据存储的朋友研究。如果有不正确的地方,欢迎指正。

云存储可靠性

我们在说一个云存储的可靠性,一般都会说它的可靠性是多少个9,比如11个9,12个9之类的。就是说,数据存储到这个集群里面,出现问题的概率是1- 0.99…9。这个数值用来表示出现问题的概率非常低。比如3个9,1- 0.999 = 0.0001。出现问题的概率就是万分之一。
从出现问题的位置来看,云存储的可靠性应该从2个方面加以考虑:集群中服务器是否可用,磁盘上面的数据是否损坏。

数据可靠性

我们说数据可靠性,是指硬盘上面的数据出现损坏的概率是多少。这种情况下,服务器可以正常工作,也可以停机。
这个主要是取决于硬盘的MTBF值,磁盘的冗余方式,和盘数目

服务可靠性

这种情况是指服务器停机,不能提高服务,也就是哪怕数据在磁盘上面完好,依然不能提供数据读取的服务。
这个主要取决于服务器停止服务的时间长短

硬盘的MTBF

我们在查看硬盘的参数时,其中很重要的一个参数就是MTBF。就以某捷的硬盘来说,参数表里面这个值就是2500000小时。
MTBF: 硬盘不出现故障的时间间隔。
我们说一个硬盘损坏,总是指在一段时间内损坏
为了衡量,我们设定这个时间是1年。
下面,我们就要计算1年之内,一个硬盘出现故障的概率。
硬盘故障概率 = 1年时间 / MTBF = (24*365)/ 2500000 = 0.35%
所以说一个硬盘1年的故障概率是千分之三点五
经验值是100块盘中,一年之内会坏掉4块。故障率是0.04,比MTBF计算出来的值要高多了

这个很重要,想像一下,如果一个集群里面的硬盘出现故障的概率很高,就很难把数据存储做得非常可靠

计算例子

为了说明存储可靠性的计算方法,我们用一个实际例子做说明。
假设有一个存储集群,里面有10台服务器,每台服务器上面有60个硬盘,采用的数据冗余模式是EC 28 + 4。每个EC数据块都分散到不同的磁盘上面。

数据可靠性的计算

对于一个用户来说,一个数据出现错误,不能恢复的情况,必须是同一个EC组里面的硬盘出现超过4块坏掉,才算是数据损坏。否则就可以通过EC算法把数据恢复回来。这时,一组磁盘32块,这时的数据出现错误的概率k = 0.0035:
y=k5∗C(32,5)+k6∗C(32,6)+...+k32∗C(32,32)y = k^5*C(32, 5) + k^6*C(32, 6) + ... + k^{32}*C(32, 32) y=k5∗C(32,5)+k6∗C(32,6)+...+k32∗C(32,32)
这个数据可靠性大约是6个9。
那个数学上面常见的求和符号太难写了,就不勉强了。
C(32, 5)代表32块盘中任意选择5块的组合数目。

服务可靠性的计算

假设集群里面有10台服务器,必须同时出现2台不可用,平均一台上面有3.2个数据块。两台坏掉,就可能出现6.4个数据块得不到。这时的服务才算是出现故障。
我们假定一台服务器在1年的时间里面,出现服务不可访问的时间长度是1个小时。
这时,单台服务器出现故障的概率就是
k=1/(24∗365)=1.14e−4k = 1 / (24 * 365) = 1.14e^{-4} k=1/(24∗365)=1.14e−4
两台同时出现故障的概率就是
k2=1.3e−8k^2 = 1.3e^{-8} k2=1.3e−8
这时,我们说服务的可靠性是7个9。

云存储的可靠性

云存储的可靠性就是由上面着两个要素决定。
我们发现数据的可靠性明显要比服务的可靠性要高。
一个云存储的可靠性就是两者之中,取决于那个最不可靠的。
要提升整个云存储的可靠性,只能增加更多的服务器,把数据打散到更多的机器上面。

三副本模式的可靠性

三副本模式下,数据有3个副本,必须这3个磁盘全部损坏,数据才算丢失。
这种情况下,数据的可靠性就是
y=0.00353=4.28∗10−8y= 0.0035^3 = 4.28 * 10^{-8} y=0.00353=4.28∗10−8

经过计算,我们可以发现,三副本的可靠性要超过EC28+4。
三副本虽然坏掉组中三块盘,数据就全部坏掉。EC组需要坏掉5块及5块以上盘才发生故障。但是由于EC组中有32块盘,出现4块以上坏盘的概率要高多了。所以三副本要更可靠。

云存储可靠性的计算方法相关推荐

  1. Storj:A Peer-to-Peer Cloud Storage Network(点对点云存储网络)

    最近在研究关于区块链存储相关的问题,于是在网上搜罗了一下相关的文章,本文是在14年出现的,在网上没有看见相应的中文文档,于是自己试着翻译了一下,不当之处,欢迎指正. 摘要 一种点对点的云存储网络,利用 ...

  2. 六个方法助您优化云存储成本

    如果你不小心控制你的云存储成本,你最终可能会得到远远超过你期望的总存储费用.考虑到这一挑战,这里列出了在不牺牲存储可靠性和性能的情况下最小化云存储成本的优秀实践. 如果不小心的话,云存储的成本很快就会 ...

  3. 安防业内人士对云存储未来的发展充满信心

    近年来,全球数据量暴涨,世界进入大数据时代,存储系统面临严峻挑战,云存储(cloudstorage)概念应运而生.将目光聚焦于安防行业,随着数字安防技术的普及,监控技术逐渐往高清化.网络化及智能化发展 ...

  4. 混合云存储开启企业上云新路径--阿里云混合云备份容灾方案发布

    摘要:当前,数据已经成为了企业的核心资产.而如果数据中心发生故障不仅会给企业带来巨大损失,甚至会直接迫使企业走向倒闭.对于企业而言,每一字节业务数据的丢失都是一场重大的灾难!那么,如何保证企业的核心数 ...

  5. 云存储巧解三大存储难题

    "自从云主机平台上线以来,我们开通一个新业务通常只需要半个小时,最长也不会超过1个小时.与以前相比,新业务上线的速度大大提高了."海南航空信息系统有限公司技术服务事业部服务规划经理 ...

  6. 【云计算】5_云存储产品介绍

    目录 1 云存储基础知识 1.1存储发展历程 1.2存储类型与特点 ​1.3存储介质 1.4存储分级 2 云存储产品介绍 2.1云硬盘CBS ​2.2文件存储CFS ​2.3对象存储COS 2.4归档 ...

  7. 混合云存储开启企业上云新路径--阿里云混合云备份容灾方案发布 1

    摘要: 当前,数据已经成为了企业的核心资产.而如果数据中心发生故障不仅会给企业带来巨大损失,甚至会直接迫使企业走向倒闭.对于企业而言,每一字节业务数据的丢失都是一场重大的灾难!那么,如何保证企业的核心 ...

  8. 星辰天合:为云存储而生 Ceph社区代码贡献领先的国产企业

    OpenStack发展了这么多年,实际上已经成为云计算架构的标准之一.它为什么能够在短短几年内发生如此巨大的变化,并且快速得到用户的应用和部署呢?我认为这离不开众多传统IT厂商和初创厂商的支持,大家都 ...

  9. 企业云存储:为什么中大型企业偏爱自建私有云?

    "上云?我们通常自建企业私有云." 9102年了,在云存储服务的选择上,中大型企业基本步调一致,统筹规划自建企业私有云. 为什么中大型企业都偏爱自建企业私有云? 一.长久的成本考量 ...

  10. 第四十六期:关于云存储的五大优势

    5G时代,越来越多的企业开始选择在云上存储数据,对于IT部门来说,了解云存储的优势是很有必要的.今天给大家介绍云存储的五大优势,以及它们如何帮助用户解决一些常见IT问题. 1.可扩展性 传统存储系统以 ...

最新文章

  1. ios 自定义加载动画效果
  2. sql数据迁移到oracle数据库,从Oracle到SQL Server数据库主键的迁移
  3. ZeroMQ全面介绍
  4. GNN手绘草图识别新架构:Multi-Graph Transformer 网络
  5. java数组 规定数量_java – 如何在数组中保持不同事物的数量?
  6. python代码性能优化技巧
  7. shell脚本:一次读取文件的一行,并输出
  8. PCA、CCA、PLS
  9. 这难道是原子、比特and供应链的新内涵?京东如是说……
  10. java 清除文本框数据_Java 添加、读取、删除Excel文本框
  11. QCC3071与QCC3072有什么区别?
  12. 湘潭大学数据库考试(郭云飞)
  13. (转)无法启动服务,原因可能是已被禁用或与其相关联的设备没有启动
  14. 高一数学试题-2022年秋期末试卷
  15. Oracle 快速入门 同义词序列视图索引
  16. Idea在Maven项目中使用支付宝沙箱环境
  17. SQLite 表达式索引的概念和作用
  18. [Linux] 什么是 段错误(吐核)?
  19. ES分页查询时报错“Result window is too large ...”
  20. R/RStudio 常用函数

热门文章

  1. 2000坐标系xy坐标几位_2000国家大地坐标系
  2. 小学计算机英语,小学英语电脑版
  3. 鸿蒙OS产业链上市公司梳理
  4. 三菱 J2 J2S J3 J4 编码器 电机文件 修改ID 修改功率 修改型号
  5. 如何用python解码base32/base64
  6. python手写字体程序,Python3生成手写体数字方法
  7. 【跨境电商学习指南】
  8. tabbar角标 小程序_关于小程序tabbar不支持传参的处理办法
  9. ILSVRC2012数据集介绍
  10. 前端数据可视化插件(一)图表