存储--盘古,阿里云飞天分布式存储系统设计深度解析
本文依据盘古团队的吴洋分享了《盘古:飞天分布式存储系统实践》视频整理而成。
他主要从以下三个方面进行了分享:盘古是什么?盘古是用来解决什么问题的?盘古是怎么解决问题的?他主要介绍了盘古的分布式系统架构和设计理念。
上图列举了目前主流的云计算厂商,我们发现一个很有趣的事情:所有云计算厂商都是“富二代”,它们的分布式存储技术全部采用自研技术,而没有用大家耳熟能详的开源分布式系统。
飞天梦
第一代飞天人的梦想是在大量廉价的PC服务器上,对外提供各种计算和存储服务。具体到以下几个组件:夸父,主要负责网络;女娲,主要负责协同;伏羲,主要负责调度;盘古,主要负责存储;神农,主要负责监控。
上图介绍了盘古的底层存储平台,其承担承上启下的作用。盘古作为分布式存储系统,主要提供两种类型的接口:Append Only接口,Random Access接口。
盘古是用来解决什么问题的?
单机的硬件或者系统总是不完美的,总是会小概率的出错,但是它又需要具有大规模下水平扩展的能力,因为它要管理大量的机器。这两个层面放在一起意味着出错是常态。
大规模下,小概率事件是常态
- 4%磁盘年损坏率,1%%机器日宕机率
- Raid卡崩溃、电容充放电导致write back模式变成write through
- 网络分割、交换机丢包、升级重启、光纤损坏带宽降低90%、两地机房路由错误
- 机架断电、整个机房掉电
- 网卡TCP校验出错,磁盘访问数据校验出错
- NTP时间漂移、内核IO线程D状态、dirty page cache无法写回
- 系统热点无时不在,瞬时转移
- 程序缺陷导致资源泄露、创建大量文件、访问脏数据
- 误操作:误删数据、拔错磁盘、没有清理测试机器环境上线……
盘古面临的问题和挑战
盘古是怎么解决问题的?
数据高可靠
盘古主要做了两件事:端到端的数据校验,静默错误检查。在小概率下,内存存储的数据是可能发生变化的,磁盘上存储的数据也会发生变化。每段数据后面都有CRC,这样,一旦写入磁盘,数据和CRC是能够匹配上的,后台周期性扫描,发现数据和CRC不匹配时就判定这段数据发生了位反转,那么用其他好的副本将其覆盖。
合理成本
盘古进行了合理成本的优化。比如,线下运行的单集群有上万台,数百PB的数据。单组Master也进行了优化,读能达到15W QPS,写能达到5W QPS。单数据节点进行了软件栈极限优化,使得软件的消耗非常低,并且分层存储。最后,为了实现低成本,使用了普通PC服务器、Erasure Code。
自主服务
面向容错的设计
分布式系统的核心是面向容错的设计:
- 数据安全是一种信仰:E2E Checksum;后台静默扫描;系统bug,硬件故障,运维操作的容错。大规模的系统中,总会遇到各种各样的问题,当这些问题搅在一起时就会变得非常棘手。
- 环境检查排除隐患:磁盘分区;机架分布;配置错误;软件错误;硬件错误。
- 单机失效无感知:数据复制保证安全;换机器重试保证读写成功;记忆并规避故障机器。
- 监控+自愈:Master自我健康检查进行切换;Chunkserver发现故障磁盘或机器进行隔离;Client检测服务状况进行Master切换;Client自我健康检测并汇报状态。
以上的设计大大减小了运维的压力。
Master
Chunkserver
Client
存储--盘古,阿里云飞天分布式存储系统设计深度解析相关推荐
- 存储--盘古_阿里云飞天分布式存储系统设计深度解析
摘要: 本文依据盘古团队的吴洋分享了<盘古:飞天分布式存储系统实践>视频整理而成. 他主要从以下三个方面进行了分享:盘古是什么?盘古是用来解决什么问题的?盘古是怎么解决问题的?他主要介绍了 ...
- 阿里云飞天技术总架构师唐洪:飞天技术与应用
一年一度的阿里技术论坛(Alibaba Technology Forum)已走进第7个年头,4月15日,阿里众多技术领军人走进清华校园.通过特设的三大技术论坛,参会人员近距离接触了阿里巴巴在云计算.大 ...
- 阿里云飞天系统的技术架构
阿里云飞天系统的技术架构 阿里云有以下五大优势: 中国万网,提供虚拟主机托管的服务,而且还提供域名等服务,其客户群非常庞大: 淘宝.阿里巴巴(内部称:B2B).支付宝等其他子公司有大量的数据分析业务, ...
- 从混合云存储看阿里云对下一代企业计算架构的思考
摘要:在公共云视角下,把企业本地存储视为一整套存储与计算方案中的一个部分与环节,通过公共云对云上云下存储和计算统一管理,以满足脉冲计算.基因计算.AI与机器学习等新型计算与数据存储的需求,这就是阿里云 ...
- 【云计算与大数据计算】大数据物理、集成、安全架构及阿里云飞天系统架构讲解(超详细)
一.物理架构 物理架构 - 企业大数据系统的各层次系统最终要部署到主机节点中,这些节点通过网络连接成 为一个整体,为企业的大数据应用提供物理支撑 ,企业大数据系统由多个逻辑层组成,多个逻辑层可以映射到 ...
- 8月6日云栖精选夜读 | 阿里云CPFS在人工智能/深度学习领域的实践
2019独角兽企业重金招聘Python工程师标准>>> AI/DL在迅速发展 随着数据量的爆发式增长和计算能力的不断提升,以及在算法上的不断突破,人工智能(AI,Artificial ...
- 阿里云飞天论文获国际架构顶会 ATC 2021最佳论文:全球仅三篇
简介:近日,计算机系统结构国际顶级学术会议 USENIX ATC在线上举行.ATC 始办于1992年,是由USENIX组织的计算机系统领域的顶级会议,至今已成功举办31届,计算机系统领域中Oak语言( ...
- 阿里云天池大赛赛题解析(深度学习篇)--阅读笔记1--赛题一
阿里云天池大赛赛题解析(深度学习篇)–阅读笔记1 [x]表示遇到不懂的知识,将在[知识补充]给出具体讲解. 文章目录 阿里云天池大赛赛题解析(深度学习篇)--阅读笔记1 前言 赛题一 瑞金医院MMC人 ...
- 阿里云飞天会员体系企业用户及个人用户准入门槛说明
阿里云飞天会员上线了,阿里云飞天会员的准入门槛为企业用户,加入飞天会员有什么好处呢?加入飞天会员可以转向飞天会员代金券,购买云服务器等产品可以享受飞天会员优惠折扣,阿里云百科来详细说下飞天会员体系及加 ...
最新文章
- 一个很不错的支持Ext JS 4的上传按钮
- /usr/bin/time -v 显示内容含义
- 关于C++模版的连接错误问题
- android项目允许命令,android 项目 gradle 命令
- java list 重复数据_java 查找list中重复数据实例详解
- javascript问题积累
- document.write() 和writeln()方法注意事项
- iSPRINT:Google 最高能的创新加速课程,让你 5 天就能验证创业想法!
- 中药说明书实体识别抽取top1
- 关于有偿提供拼图响应式后台的通知.
- IntelliCAD 2009 Pro Plus v6.4.23.2 1CD
- Fortan写出数据到CSV文件中
- java poi jar包下载_poi.jar下载-poi.jar包 3.8/3.9/3.10 免费版 - 河东下载站
- 仿京东的注册页面, 使用jQuery进行表单验证
- 面试又被问高并发,哑口无言?一份高并发核心文档助你吊打面试官
- win7系统没有计算机睡眠状态,win7旗舰版系统休眠模式和睡眠模式的区别
- Scratch精通之列表的使用
- 使用Nginx访问图片报404
- 透明小电视上线——GitHub 热点速览 v.21.05
- POJ 3009 Curling 2.0 {深度优先搜索}