OneFS的文件系统的block size是8KB。这是OneFS上最小的数据存储单位了,比8KB小的文件都要占掉8KB大小的空间。连续的8KB的block会被用来存储文件的数据,但最多不会超过16个。为啥呢?因为,16个连续的block会组成一个大小为128KB的stripe unit。一个文件在存储在Isilon上的时候,如果其大小超过128KB,那么这个文件会被切分为多个128KB的stripe unit。然后这些stripe unit会散布在Isilon集群的多个节点的多块盘上。

这些stripe unit是怎么放在Isilon cluster的节点中的呢?这取决于四个因素:

  • Isilon集群的节点数 - 集群的节点数直接决定了data stripe的宽度。数据是尽可能的跨多个节点的多块盘来存放的。
  • 文件的保护等级 - 越高,那么同一个stripe里所包含的protection data block (FEC)就要越多。在data stripe宽度(node数)固定的情况下,单条data stripe里包含的数据块就要更少了。
  • 文件的大小 - 小于128KB的文件都不会跨多个盘,对于这么小的文件的保护只有使用Mirror的方式。同时,被存储文件的protection level,直接决定了这个文件需要多少份mirror。
  • 文件所在的文件夹的磁盘访问模式(access pattern)- 下面有两个举例,concurrent模式,为了支持并发读写,一个读写尽量不去影响另一个读写,所以同样的文件,尽可能放在少的盘上。Stream模式,为了让同一个文件能用到更多的磁盘,所以存储的时候会放在尽可能多的盘上。

首先,一个大文件的许许多多的stripe unit会被以一个叫做data stripe的逻辑单位来存放,一个data stripe会包含多少个stripe unit呢?这个data stripe是如何跨越多个节点的呢?这取决于两个因素,protection level和cluster node number。

集群的节点数直接决定stripe的宽度.

假设一个1024KB的文件,存储在Isilon上,它会被切分为8个128KB的stripe unit。假设这个cluster有3个节点,每个节点上有12块盘。那么这8个stripe units会怎么在这36块盘上分布呢?

这里需要涉及到一个protection level的问题,因为protection level不同,那么data stripe的大小就不同。

为了简化,假设我们的文件的protection level是N+1,即允许down掉一个节点或一块盘。

因为我们的集群只有3个节点,那么每两个data的stripe unit就应该带一个Protection stripe unit。这样,坏一个节点,所丢失的数据就可以通过另外两块数据计算出来。

来看两个例子:

Concurrent access pattern的1兆文件的存储方式举例:

Streaming access pattern的1兆文件的存储方式举例:

一些问题

============

问题1:假设我们有个大于128KB,小于256KB的文件,那么这个文件在2d:1n的protection level下,集群有4个节点,如何存储?

答:这个文件会被切成两部分,一部分是128KB的data stripe unit,与另外两个节点提供的两个protection stripe unit组成一个data stripe。另一部分小于128KB,OneFS会为这块数据添加两份mirror,从而达到坏两块盘数据依然可用的保护级别。

问题2:假设我们有一个Isilon的集群,其中有80个节点,那么对于一个足够大的文件来讲,data stripe的长度可以达到80么?

答:单个文件在Isilon上存储最多跨20个节点。

问题3:Isilon Gen5的S210有两块SSD,22块HDD,请问这个节点的disk pool是怎样的?

答:SSD由于有不同的使用方式,先不予考虑。22块HDD会被分为四个disk pool,两个pool里分别有5块HDD,另两个pool里有6块HDD.

问题4: MTTDL跟节点数量,文件的protection level有什么关系?

答:MTTDL的定义是大概多长时间之后会发生这样的情况:坏盘同时出现从而导致数据丢失,这个时间是多久。数据在节点的盘中的打散程度越高,节点越多,文件保护等级越低,那么MTTDL就会越低。

参考资料

==============

OneFS File System Data Layout

https://community.emc.com/docs/DOC-42741

Dell EMC Isilon OneFS: A Technical Overview

https://www.emc.com/collateral/hardware/white-papers/h10719-isilon-onefs-technical-overview-wp.pdf

HIGH AVAILABILITY AND DATA PROTECTION WITH DELL EMC ISILON SCALE-OUT NAS

https://www.emc.com/collateral/hardware/white-papers/h10588-isilon-data-availability-protection-wp.pdf

Isilon上数据是如何存放的?相关推荐

  1. SWPU-DS)若有 n 阶对称矩阵 A,以行序为主序方式,将其下三角形的元素(包括主对角线上所有元素)依次存放于一维数组B[1..(n(n+1))/2]中,则在 B 中确定 a[i, j](i<j)

    SWPU-DS)若有 n 阶对称矩阵 A,以行序为主序方式,将其下三角形的元素(包括主对角线上所有元素)依次存放于一维数组B[1-(n(n+1))/2]中,则在 B 中确定 a[i, j](i< ...

  2. 《大数据大创新:阿里巴巴云上数据中台之道》-读书笔记

    目录 0. 前言 1. 大数据的发展历程和价值探索 1.1 大数据发展的关键事件 1.2 大数据的内涵和外延 2.阿里的大数据主张 2.1 云上数据中台赋能业务运行图 2.2 阿里数据中台赋能业务全景 ...

  3. 【板栗糖GIS】如何修改arcmap数据的默认存放位置

    如何修改arcmap数据的默认存放位置 目录 如何修改arcmap数据的默认存放位置 1. 运行软件 2. 打开文件-地图文档属性 3. 修改默认地理数据库 1. 运行软件 2. 打开文件-地图文档属 ...

  4. 实践篇 | 构建下一代云上数据湖,助力车企数字化转型

    近几年,汽车行业全面拥抱电气化和数字化,一方面有行业先行者和政策法规的激励作用,另外一方面随着无线网络升级换代以及云计算技术越发成熟,车机端到企业端能够更加实时稳定传输丰富数据.如何利用好这些数据,为 ...

  5. Spark Machine Learning 03 Spark上数据的获取、处理与准备

    Chap 03 Spark上数据的获取处理 Spark上数据的获取.处理与准备 MovieStream,数据包括网站提供的电影数据.用户的服务信息数据以及行为数据. 这些数据涉及电影和相关内容(比如标 ...

  6. 汇编语言 利用栈 将数据逆序存放

    题目要求 利用栈,将程序中定义的数据逆序存放 数据如下: 0123h,0456h,0789h,0abch,0defh,0fedh,0cbah,0987h 数据段DS 076A:0000存放的内容 交换 ...

  7. 设有n 个程序{1,2,…, n }要存放在长度为L的磁带上。程序i存放在磁带上的长度是Li, 1<= i<= n。这n 个程序的读取概率分别是p1,p2,...,pn,且pi+p2+...+pn =

    设有n 个程序{1,2,-, n }要存放在长度为L的磁带上.程序i存放在磁带上的长度是Li, 1<= i<= n.这n 个程序的读取概率分别是p1,p2,-,pn,且pi+p2+-+pn ...

  8. 让威胁管理跟上数据中心奔跑的速度

    在移动互联.大数据.云计算.物联网蓬勃发展的今天,网络已经遍及社会经济的各个领域,但是网络威胁无处不在.一连串高危漏洞写满了2014年的时间卷轴,但这并未让数据中心技术在前进的路上倒下,尤其是在&qu ...

  9. 【汇编语言】王爽第六章程序6.3解答,8086汇编语言实现数据的倒序存放

    程序很简单,就是利用栈,实现数据的倒序存放. ; 将数据逆序存放 assume ds:data data segment dw 0123h,0456h,0789h,0abch,0defh,0fedh, ...

  10. javaweb和ajax使用查询出来的数据做下拉菜单_区块链浏览器实用指南篇:利用链上数据把握减半行情...

    进入2020年,加密货币市场最热的话题当属"减半"了.在减半行情的推动下,以BTC为首的减半币种展现出了极强的上行趋势.如何抓住这一波行情,评估正确时机?当然,这个问题的答案可以说 ...

最新文章

  1. 《Tuning I/O Performance》读后笔记
  2. server2012 图文安装流程
  3. 高斯混合模型 GMM
  4. 【渝粤教育】广东开放大学 文化田野调查 形成性考核 (22)
  5. (229)DPU加速数据处理
  6. 通通玩blend美工(3)——可爱的云
  7. 苹果mac轻量级思维导图软件:Xmind
  8. eclipse 插件 subclipse plugin 中修改已经登录的帐户密码的方法
  9. python 新手常见问题
  10. java前端开发_Java前端开发学习什么内容
  11. Servlet+jsp入门教程
  12. 为什么测网速时不显示服务器,为什么每个网站的网速测试结果不一样
  13. 运用Doolitle分解法解线性方程组
  14. 思科服务器如何重装系统,思科路由器系列软件安装与升级步骤
  15. 跳出都市 赏不一样的月光
  16. 解决笔记本屏幕颜色偏变白问题
  17. 双月楼月饼荣获茂名在线月饼品鉴佳绩
  18. 微信支付宝刷脸支付竞争已经枕戈待旦
  19. Matlab 打不开 无法运行 win10 系统 卡在启动界面没有反应 语言bug
  20. 《软件测试》读书笔记

热门文章

  1. 面试被问到:测试计划和测试方案有什么区别?你会回答吗~
  2. 模型中出现欠拟合与过拟合的应对策略
  3. Matlab中对坐标轴的对数转化,loglog,semilogx与semilogy
  4. win10无线网 服务器,win10专业版wifi变成地球怎么办_win10 wifi图标变成小地球无法连接网络如何解决...
  5. 浙大玉泉校区路由器L2TP设置(极路由1s)
  6. 移动端关于手机横屏时样式修改
  7. 计算机网络pop3是什么意思,smtp服务器是什么 pop3服务器是什么?
  8. 谈谈自己学习Linux的心得
  9. 第6期:大学生应该选择哪种主流编程语言
  10. 细分领域:偏门的色流玩法+简单的色流变现套路