文章目录

  • 1 文件的物理结构 (文件分配方式)
    • 1.1 文件块、磁盘块
    • 1.2 文件分配方式——连续分配
    • 1.3 文件分配方式——链接分配
      • 1.3.1 链接分配——隐式链接
      • 1.3.2 链接分配——显式链接
      • 1.3.3 链接分配(总结)
    • 1.4 文件分配方式——索引分配
      • 1.4.1 链接方案
      • 1.4.2 多层索引
      • 1.4.3 混合索引
      • 1.4.4 索引分配(总结)
    • 1.5 文件分配总结
  • 2 文件存储空间管理
    • 2.1 存储空间的划分与初始化
    • 2.2 存储空间管理——空闲表法
    • 2.3 存储空间管理——空闲链表法
    • 2.4 存储空间管理一一位示图法
    • 2.5 存储空间管理一—成组链接法
    • 2.6 文件存储空间管理小结

1 文件的物理结构 (文件分配方式)


1.1 文件块、磁盘块

类似于内存分页,磁盘中的存储单元也会被分为一个个“块/磁盘块/物理块”。很多操作系统中,磁盘块的大小与内存块、页面的大小相同

在内存管理中,进程的逻辑地址空间被分为一个一个页面同样的,在外存管理中,为了方便对文件数据的管理,文件的逻辑地址空间也被分为了一个一个的文件“块”。 于是文件的逻辑地址也可以表示为(逻辑块号,块内地址)的形式。

1.2 文件分配方式——连续分配

连续分配方式要求每个文件在磁盘上占有一组连续的块。

问题:用户通过逻辑地址来操作自己的文件,操作系统如何实现从逻辑地址到物理地址的映射?
(逻辑块号,块内地址)→(物理块号,块内地址)。只需转换块号就行,块内地址保持不变

  1. 用户给出要访问的逻辑块号,操作系统找到该文件对应的目录项(FCB)…
  2. 当然,还需要检查用户提供的逻辑块号是否合法(逻辑块号≥ 长度就不合法)
    可以直接算出逻辑块号对应的物理块号,物理块号=起始块号+逻辑块号
    因此连续分配支持顺序访问和直接访问(即随机访问)

连续分配读取某个磁盘块时,需要移动磁头。访问的两个磁盘块相隔越远,移动磁头所需时间就越长。

结论:

  1. 连续分配的文件在顺序读/写时速度最快
  2. 物理上采用连续分配的文件不方便拓展。
  3. 物理上采用连续分配, 存储空间利用率低,会产生难以利用的磁盘碎片
    可以用紧凑来处理碎片,但是需要耗费很大的时间代价。

连续分配优缺点总结:

优点:支持顺序访问和直接访问(即随机访问);连续分配的文件在顺序访问时速度最快
缺点:不方便文件拓展;存储空间利用率低,会产生磁盘碎片

1.3 文件分配方式——链接分配

链接分配采取离散分配的方式,可以为文件分配离散的磁盘块。分为隐式链接和显式链接两种。

1.3.1 链接分配——隐式链接


问题1:隐式链接如何实现文件的逻辑块号到物理块号的转变?

  1. 用户给出要访问的逻辑块号i,操作系统找到该文件对应的目录项(FCB)…
  2. 从目录项中找到起始块号(即0号块),将0 号逻辑块读入内存,由此知道1号逻辑块存 放的物理块号,于是读入1号逻辑块,再找 到2号逻辑块的存放位置……以此类推。
  3. 因此,读入i号逻辑块,总共需要i+1次磁盘 I/O。

结论:采用链式分配(隐式链接)方式的文件,只支持顺序访问,不支持随机访问,查找效率低。另外,指向下一个盘块的指针也需要耗费少量的存储空间。

问题2:是否方便拓展文件?

若此时要拓展文件,则可以随便找一个空闲磁盘块,挂到文件的磁盘块链尾,并修改文件的FCB

结论:采用隐式链接的链接分配方式,很方便文件拓展。 另外,所有的空闲磁盘块都可以被利用,不会有碎片问题, 外存利用率高。

隐式链接分配优缺点总结:
隐式链接——除文件的最后一个盘块之外,每个盘块中都存有指向下一个盘块的指针。文件目录 包括文件第一块的指针和最后一块的指针。

优点:很方便文件拓展,不会有碎片问题,外存利用率高。
缺点:只支持顺序访问,不支持随机访问,查找效率低,指向下一个盘块的指针也需要耗费少量的存储空间。

1.3.2 链接分配——显式链接

显式链接把用于链接文件各物理块的指针显式地存放在一张表中。即文件分配表(FAT,File Allocation Table

假设某个新创建的文件“aaa”依 次存放在磁盘块2→5→0→1
假设某个新创建的文件“bbb”依 次存放在磁盘块4→23→3
则FAT表如下:

注意:一个磁盘仅设置一张FAT。 开机时,将FAT读入内存,并常驻内存。FAT 的各个表项在物理上连续存储,且每一个表项长度相同,因此“物理块号”字段可以是隐含的。

问题1:如何实现文件的逻辑块号到物理块号的转变?

  1. 用户给出要访问的逻辑块号i,操作系统找到该文件对应的目录项 (FCB)…
  2. 从目录项中找到起始块号,若i>0,则查询内存中的文件分配表FAT, 往后找到i号逻辑块对应的物理块号。逻辑块号转换成物理块号的过程不需要读磁盘操作。

结论:采用链式分配(显式链接)方式的文件,支持顺序访问,也支持随机访问(想访问i号逻辑块时,并不需要依次访问之前的0~i-1号逻辑块),由于块号转换的过程不需要访问磁盘,因此相比于隐式链接来说,访问速度快很多。
显然,显式链接也不会产生外部碎片,也可以很方便地对文件进行拓展。

1.3.3 链接分配(总结)
  1. 隐式链接——除文件的最后一个盘块之外,每个盘块中都存有指向下一个盘块的指针。文件目录包括文件第一块的指针和最后一块的指针。
    优点:很方便文件拓展,不会有碎片问题,外存利用率高。
    缺点:只支持顺序访问,不支持随机访问,查找效率低,指向下一个盘块的指针也需要耗费少量的存储空间。
  1. 显式链接——把用于链接文件各物理块的指针显式地存放在一张表中,即 文件分配表(FAT,File AllocationTable)。一个磁盘只会建立一张文件分配表。开机时文件分配表放入内存,并常驻内存。
    优点:很方便文件拓展,不会有碎片问题,外存利用率高,并且支持随机访问。相比于隐式链接来说,地址转换时不需要访问磁盘,因此文件的访问效率更高。
    缺点:文件分配表的需要占用一定的存储空间。

考试题目中遇到未指明隐式/显式的“链接 分配”,默认指的是隐式链接的链接分配

1.4 文件分配方式——索引分配

索引分配允许文件离散地分配在各个磁盘块中,系统会为每个文件建立一张索引表,索引表中记录了文件的各个逻辑块对应的物理块(索引表的功能类似于内存管理中的页表——建立逻辑页面到物理页之间的映射关系)。索引表存放的磁盘块称为索引块。文件数据存放的磁盘块称为数据块。

假设某个新创建的文件“aaa”的数 据依次存放在磁盘块2→5→13→9。 7号磁盘块作为“aaa”的索引块, 索引块中保存了索引表的内容。

注:在显式链接的链式分配方式中,文件分配表FAT 是一个磁盘对应一张。而索引分配方式中,索引表是一个文件对应一张。

可以用固定的长度表示物理块号(如: 假设磁盘总容量为1TB=240B,磁盘块大小为1KB,则共有230个磁盘块,则可用4B表示磁盘块号),因此,索引表中的“逻辑块号”可以是隐含的。

问题:索引分配如何实现文件的逻辑块号到物理块号的转换?

  1. 用户给出要访问的逻辑块号i,操作系统找到该文件对应的目录项(FCB)…
  2. 从目录项中可知索引表存放位置,将索引表从外存读入内存,并查找索引表即可只i号逻辑块在外存中的存放位置。

可见,索引分配方式可以支持随机访问。 文件拓展也很容易实现(只需要给文件分配 一个空闲块,并增加一个索引表项即可) 但是索引表需要占用一定的存储空间

若每个磁盘块1KB,一个索引表项4B,则一个磁盘块只能存放1024/4=256个索引项

如果一个文件的大小超过了256 块,也就意味着这个文件对应的索引表超过了256个索引项,那么一个磁盘块是装不下文件的整张索引表的,如何解决这个问题?
解决方案:①链接方案 ②多层索引 ③混合索引

1.4.1 链接方案

链接方案:如果索引表太大,一个索引块装不下,那么可以将多个索引块链接起来存放

假设磁盘块大小为1KB,一个索引表项占4B,则一个磁盘块只能存放1024/4=256个索引项。
若一个文件大小为256X256KB= 65,536KB=64MB 该文件共有256X256个块,也就对应 256X256个索引项,也就需要256个索引块来存储,这些索引块用链接方案连起来。 若想要访问文件的最后一个逻辑块, 就必须找到最后一个索引块(第256 个索引块),而各个索引块之间是用指针链接起来的,因此必须先顺序地读入前255个索引块。
这显然是很低效的。如何解决呢?

1.4.2 多层索引

多层索引:建立多层索引(原理类似于多级页表)。使第一层索引块指向第二层的索引块。还可根据 文件大小的要求再建立第三层、第四层索引块。

假设磁盘块大小为1KB,一个索引表项占4B,则一个磁盘块只能存放256个索引项。
若某文件采用两层索引,则该文件的最大长度可以到256X256X1KB=65,536KB=64MB
最大长度:第一级索引表最多有256个索引项,也就是会指向256个第二季索引表,而第二级索引表最多也是256个索引项,每个索引项分别指向一个数据块,数据块大小1KB,则采用两层索引,文件最大256X256X1KB=65,536KB=64MB

可根据逻辑块号算出应该查找索引表中的哪个表项。 如:要访问1026号逻辑块,则 1026/256=4,1026%256=2
1026/256=4说明1026号逻辑块对应的索引项是4号二级索引表中存放的
1026%256=2 则需要查询4号索引表中的2号表项

因此可以先将一级索引表调入内存,查询4号表项, 将其对应的二级索引表调入内存,再查询二级索引表的2号表项即可知道1026号逻辑块存放的磁盘块号了。 访问目标数据块,需要3次磁盘I/O。第一次读入一级索引表,第二次读入二级索引表,第三次读入最终要访问的数据块。

若采用三层索引,则文件的最大长度为256X256X256X1KB=16GB
类似的,访问目标数据块,需要4次磁盘I/O

重要结论:若采用多层索引,则各层索引表大小不能超过一个磁盘块

采用K层索引结构,且顶级索引表未调入内存,则访问一个数据块只需要K+1次读磁盘操作

1.4.3 混合索引

混合索引:多种索引分配方式的结合。例如,一个文件的顶级索引表中,既包含直接地址索引(直接 指向数据块),又包含一级间接索引(指向单层索引表)、还包含两级间接索引(指向两层索引表) 。

由上可见:
若顶级索引表还没读入内存
访问0~7号逻辑块:两次读磁盘
访问8~263:三次读磁盘盘次数。
访问264~65799:因次读磁盘
对于小文件,只需较少的读磁盘次数就可以访问目标数据块(一般计算机中小文件更多)
这种结构索引支持的最大文件长度为8+256+65536=65800KB常考混合索引的最大文件长度

1.4.4 索引分配(总结)

索引分配允许文件离散地分配在各个磁盘块中,系统会为每个文件建立一张索引表,索引表中记录了文件的各个逻辑块对应的物理块(索引表的功能类似于内存管理中的页表——建立逻辑页面到物理页之间的映射关系) 。

索引表存放的磁盘块称为索引块。文件数据存放的磁盘块称为数据块。 若文件太大,索引表项太多,可以采取以下三种方法解决:

  1. 链接方案:如果索引表太大,一个索引块装不下,那么可以将多个索引块链接起来存放。
    缺点:若文件很大,索引表很长,就需要将很多个索引块链接起来。想要找到i号索引块,必须先依次读入0~i-1 号索引块,这就导致磁盘I/O次数过多,查找效率低下。
  2. 多层索引:建立多层索引(原理类似于多级页表)。使第一层索引块指向第二层的索引块。还可根据文件大小的要求再建立第三层、第四层索引块。采用K层索引结构,且顶级索引表未调入内存,则访问 一个数据块只需要K+1次读磁盘操作。
    缺点:即使是小文件,访问一个数据块依然需要K+1次读磁盘。
  3. 混合索引:多种索引分配方式的结合。例如,一个文件的顶级索引表中,既包含直接地址索引(直接指向数据块),又包含一级间接索引(指向单层索引表)、还包含两级间接索引(指向两层索引表) 。
    优点:对于小文件来说,访问一个数据块所需的读磁盘次数更少。

超级超级超级重要考点:

  1. 要会根据多层索引、混合索引的结构计算出文件的最大长度(Key:各级索引表最大不能超过一个块);
  2. 要能自己分析访问某个数据块所需要的读磁盘次数(Key:FCB中会存有指向顶级索引块的指针,因此可以根据FCB读入顶级索引块。每次读入下一级的索引块都需要一次读磁 盘操作。另外,要注意题目条件——顶级索引块是否已调入内存)

1.5 文件分配总结

2 文件存储空间管理

2.1 存储空间的划分与初始化

安装Windows操作系统的时候,一个必经步骤是为磁盘分区(C盘、D盘、E盘等)

存储空间的划分:将物理磁盘划分为一个个文件卷(逻辑卷、逻辑盘)

2.2 存储空间管理——空闲表法

适用于“连续分配方式”

某时刻磁盘使用如下:

对应的空闲表:

第一个空闲盘块号 空闲盘块数
0 2
5 1
10 5
18 3
23 1

空闲分区表

  1. 如何分配磁盘块:

与内存管理中的动态分区分配很类似,为一个文件分配连续的存储空间。同样可采用首次适应、最佳适应、最坏适应等算法来决定要为文件分配哪个区间。

  1. 如何回收磁盘块:

与内存管理中的动态分区分配很类似,当回收某个存储区时需要有四种情况:
(1)回收区的前后都没有相邻空闲区;
(2)回收区的前后都是空闲区;
(3)回收区前面是空闲区;
(4)回收区后面是空闲区。
总之,回收时需要注意表项的合并问题。

2.3 存储空间管理——空闲链表法

  1. 空闲盘块链

    操作系统保存着链头、链尾指针。
    如何分配:若某文件申请K个盘块,则从链头开始依次摘下K个盘块分配,并修改空闲链的链头指针。
    如何回收:回收的盘块依次挂到链尾,并修改空闲链的链尾指针。

特点:适用于离散分配的物理结构。为文件分配多个盘块时可能要重复多次操作

  1. 空闲盘区链

    操作系统保存着链头、链尾指针。
    如何分配:若某文件申请K个盘块,则可以采用首次适应、最佳适应等算法,从链头开始检索,按照算法规则找到一个大小符合要求的空闲盘区,分配给文件。若没有合适的连续空闲块,也可以将不同盘区的盘块同时分配给一个文件,注意分配后可能要修改相应的链指针、盘区大小等数据。
    如何回收:若回收区和某个空闲盘区相邻,则需要将回收区合并到空闲盘区中。若回收区没有和任何空闲区相邻,将回收区作为单独的一个空闲盘区挂到链尾。

特点:离散分配、连续分配都适用。为一个文件分配多个盘块时效率更高

2.4 存储空间管理一一位示图法

位示图:每个二进制位对应一个盘块。

某时刻磁盘利用情况如下:

对应的位示图:

在本例中,“0”代表盘块空闲,“1”代表盘块已分配。位示图一般用连续的“字”来表示,如本例中一个字的字长是16位,字中的每一位对应一个盘块。因此可以用(字号,位号)对应一个盘块号。当然有的题目中也描述为(行号,列号)

重点重点:要能自己推出盘块号与(字号位号)相互转换的公式。
注意题目条件:盘块号、字号、位号到底是从0开始还是从1开始
如本例中盘块号、字号、位号从0开始,若n表示字长,则.
(字号,位号)=(i,j)的二进制位对应的盘块号b=ni+j

本例中:
(0,1)→b=16X0+1
(1,10)→b=16X1+10
b号盘块对应的字号i=b/n,位号j=b%n
b=13→i=13/16=0,j=13%16=13

如何分配:若文件需要K个块,
①顺序扫描位示图,找到K个相邻或不相邻的“0”;
②根据字号、位号算出对应的盘块号,将相应盘块分配给文件;
③将相应位设置为“1”。
如何回收:①根据回收的盘块号计算出对应的字号、位号;②将相应二进制位设为“0”

特点:连续分配、离散分配都适用

2.5 存储空间管理一—成组链接法

空闲表法、空闲链表法不适用于大型文件系统,因为空闲表或空闲链表可能过大。UNIX系统中采用了成组链接法对磁盘空闲块进行管理。
文件卷的目录区中专门用一个磁盘块作为“超级块”,当系统启动时需要将超级块读入内存。并且要保证内存与外存中的“超级块”数据一致。

2.6 文件存储空间管理小结

15 操作系统第四章 文件管理 文件的物理结构 文件存储空间管理相关推荐

  1. (王道408考研操作系统)第四章文件管理-第一节7:文件共享

    文章目录 一:基于索引结点的共享方式(硬链接) (1)介绍 (2)Linux演示 二:基于符号链的共享方式(软链接) (1)介绍 (2)Linux演示 所谓文件共享就是指 使多个用户(进程)共享同一个 ...

  2. 操作系统第四章-文件管理

    写在前面:本文参考王道论坛的 操作系统考研复习指导单科书 文章目录 第四章 文件管理 4.1 内存管理概念 4.1.1 文件的概念 4.1.2 文件的逻辑结构 1. 无结构文件(流式文件) 2.有结构 ...

  3. 16 操作系统第四章 文件管理 文件的基本操作 文件共享 文件保护 文件系统的层次结构

    文章目录 1 文件的基本操作 1.1 创建文件 1.2 删除文件 1.3 打开文件 1.4 关闭文件 1.5 读文件 1.6 写文件 1.7 文件基本操作小结 2 文件共享 2.1 基于索引结点的共享 ...

  4. 14 操作系统第四章 文件管理 文件逻辑结构 文件目录结构

    文章目录 1 初识文件管理 1.1文件属性 1.2 文件内部的数据应该怎样组织起来? 1.3 文件之间应该怎样组织起来? 1.4 操作系统应该向上提供哪些功能? 1.5 文件应如何存放在外存? 1.6 ...

  5. (王道408考研操作系统)第四章文件管理-第一节4:文件物理结构(文件分配方式)

    文章目录 一:连续分配 二:链接分配 A:隐式链接 B:显式链接 三:索引分配 (1)基本概念 (2)一个问题 A:链接方案 B:多层索引 C:混合索引 文件分配方式大总结 文件的物理结构是指如何为文 ...

  6. (王道408考研操作系统)第四章文件管理-第一节2:文件的逻辑结构

    文章目录 一:无结构文件 二:有结构文件 (1)顺序文件 (2)索引文件 (3)索引顺序文件 和数据结构中的逻辑结构与物理结构一样,文件也具有逻辑结构和物理结构 逻辑结构:从用户角度看,文件内部的数据 ...

  7. (王道408考研操作系统)第四章文件管理-第一节1:文件管理初识

    注意本节只是对本章所涉及的内容简单介绍,便于入门,可以不看 文章目录 一:文件基本概念 二:文件的组织方式 (1)文件内部数据如何组织 (2)文件与文件如何组织 三:操作系统需要提供的功能 四:操作系 ...

  8. 操作系统 第四章 文件管理

    4.1 文件系统基础 所谓文件,指的是以计算机硬盘为载体的存储在计算机上的信息的集合.系统运行时,计算机以进程为基本单位进行资源的分配调度,而在用户的输入输出时则以文件为基本单位. 可以采取自底向上的 ...

  9. (王道408考研操作系统)第四章文件管理-第一节6:文件基本操作

    文章目录 一:创建文件(create系统调用) 二:删除文件(delete系统调用) 三:打开文件(open系统调用) 四:关闭文件(close系统调用) 五:读文件(read系统调用) 六:写文件( ...

最新文章

  1. 南航计算机硬件实验,南航80X86微机原理及接口技术实验指导书.pdf
  2. AI机器人不认同人类语言 产生自己的交流方式 Facebook关闭了他们的人工智能系统...
  3. 带参数的URLconf
  4. TNN 量化_加量化港美股打新群!
  5. 【AI视野·今日CV 计算机视觉论文速览 第227期】Fri, 25 Jun 2021
  6. 云中漫步 - 3:2013-4-27 微软云体验营北京站
  7. 特斯拉电动皮卡量产时间还会推迟 内部人士称已被推迟到2023年
  8. hadoop hdfs 集群模板机配置
  9. Python - re - 正则表达式 - 怎么用
  10. 微软:免费杀毒软件Morro即将发布Beta版
  11. R与Python手牵手:数据框的构建、读取与基本描述
  12. Tip3 百度网盘PC版去除广告和游戏运营位教程(百度网盘破解教程)
  13. 输入今天的日期,输出明天的日期
  14. 电脑桌面图标不见了怎么办如果电脑图标不见了,可以尝试以下方法:
  15. JavaScript 使用js修改页面元素
  16. python argparse 和opencv模块的组合使用_如何利用Python3和OpenCV对比两张图片的不同,提取差异性...
  17. [转帖] 部分收费的Oracle JDK VS 完全免费的OpenJDK
  18. 爬虫爬取qq看点视频
  19. 计算机切换用户神魔意思,快速切换用户是什么意思?
  20. clickhouse连接Tableau

热门文章

  1. git commit查找提交的关键字
  2. Python3——简单的UDP实例
  3. Linux下打印调试管理
  4. fprintf/fscanf函数分析
  5. 人脸识别案例:【实战】opencv人脸检测+Haar特征分类器
  6. php解析xml数据格式,PHP解析xml格式数据工具类实例分享
  7. LeetCode 2062. 统计字符串中的元音子字符串
  8. python 全局变量、局部变量
  9. 接口 vs 抽象类 的区别
  10. LeetCode 553. 最优除法(数学)