原标题:文件系统:隐匿在Linux背后的机制

在 Linux 中,最直观、最可见的部分就是 文件系统(file system) 。下面我们就来一起探讨一下关于 Linux 中国的文件系统,系统调用以及文件系统实现背后的原理和思想。这些思想中有一些来源于 MULTICS,现在已经被 Windows 等其他操作系统使用。Linux 的设计理念就是 小的就是好的(Small is Beautiful) 。虽然 Linux 只是使用了最简单的机制和少量的系统调用,但是 Linux 却提供了强大而优雅的文件系统。

Linux 文件系统基本概念

Linux 在最初的设计是 MINIX1 文件系统,它只支持 14 字节的文件名,它的最大文件只支持到 64 MB。在 MINIX 1 之后的文件系统是 ext 文件系统。ext 系统相较于 MINIX 1 来说,在支持字节大小和文件大小上均有很大提升,但是 ext 的速度仍没有 MINIX 1 快,于是,ext 2 被开发出来,它能够支持长文件名和大文件,而且具有比 MINIX 1 更好的性能。这使他成为 Linux 的主要文件系统。只不过 Linux 会使用 VFS 曾支持多种文件系统。在 Linux 链接时,用户可以动态的将不同的文件系统挂载倒 VFS 上。

Linux 中的文件是一个任意长度的字节序列,Linux 中的文件可以包含任意信息,比如 ASCII 码、二进制文件和其他类型的文件是不加区分的。

为了方便起见,文件可以被组织在一个目录中,目录存储成文件的形式在很大程度上可以作为文件处理。目录可以有子目录,这样形成有层次的文件系统,Linux 系统下面的根目录是 / ,它通常包含了多个子目录。字符 / 还用于对目录名进行区分,例如 /usr/cxuan表示的就是根目录下面的 usr 目录,其中有一个叫做 cxuan 的子目录。

下面我们介绍一下 Linux 系统根目录下面的目录名

/bin ,它是重要的二进制应用程序,包含二进制文件,系统的所有用户使用的命令都在这里

/boot ,启动包含引导加载程序的相关文件

/dev ,包含设备文件,终端文件,USB 或者连接到系统的任何设备

/etc ,配置文件,启动脚本等,包含所有程序所需要的配置文件,也包含了启动/停止单个应用程序的启动和关闭 shell 脚本

/home ,本地主要路径,所有用户用 home 目录存储个人信息

/lib ,系统库文件,包含支持位于 /bin 和 /sbin 下的二进制库文件

/lost+found ,在根目录下提供一个遗失+查找系统,必须在 root 用户下才能查看当前目录下的内容

/media ,挂载可移动介质

/mnt ,挂载文件系统

/opt ,提供一个可选的应用程序安装目录

/proc ,特殊的动态目录,用于维护系统信息和状态,包括当前运行中进程信息

/root ,root 用户的主要目录文件夹

/sbin ,重要的二进制系统文件

/tmp , 系统和用户创建的临时文件,系统重启时,这个目录下的文件都会被删除

/usr ,包含绝大多数用户都能访问的应用程序和文件

/var ,经常变化的文件,诸如日志文件或数据库等

在 Linux 中,有两种路径,一种是 绝对路径(absolute path) ,绝对路径告诉你从根目录下查找文件,绝对路径的缺点是太长而且不太方便。还有一种是 相对路径(relative path) ,相对路径所在的目录也叫做 工作目录(working directory) 。

如果 /usr/local/books 是工作目录,那么 shell 命令

cp /usr/ local/books/books /usr/ local/books/books-replica

则表示的是绝对路径。

在 Linux 中经常出现一个用户使用另一个用户的文件或者使用文件树结构中的文件。两个用户共享同一个文件,这个文件位于某个用户的目录结构中,另一个用户需要使用这个文件时,必须通过绝对路径才能引用到他。如果绝对路径很长,那么每次输入起来会变的非常麻烦,所以 Linux 提供了一种 链接(link) 机制。

举个例子,下面是一个使用链接之前的图

以上所示,比如有两个工作账户 jianshe 和 cxuan,jianshe 想要使用 cxuan 账户下的 A 目录,那么它可能会输入 /usr/cxuan/A ,这是一种未使用链接之后的图。

使用链接后的示意如下

现在,jianshe 可以创建一个链接来使用 cxuan 下面的目录了。‘

当一个目录被创建出来后,有两个目录项也同时被创建出来,它们就是 . 和 .. ,前者代表工作目录自身,后者代表该目录的父目录,也就是该目录所在的目录。这样一来,在 /usr/jianshe 中访问 cxuan 中的目录就是 ../cxuan/xxx

Linux 文件系统不区分磁盘的,这是什么意思呢?一般来说,一个磁盘中的文件系统相互之间保持独立,如果一个文件系统目录想要访问另一个磁盘中的文件系统,在 Windows 中你可以像下面这样。

两个文件系统分别在不同的磁盘中,彼此保持独立。

而在 Linux 中,是支持 挂载 的,它允许一个磁盘挂在到另外一个磁盘上,那么上面的关系会变成下面这样

挂在之后,两个文件系统就不再需要关心文件系统在哪个磁盘上了,两个文件系统彼此可见。

Linux 文件系统的另外一个特性是支持 加锁(locking) 。在一些应用中会出现两个或者更多的进程同时使用同一个文件的情况,这样很可能会导致 竞争条件(race condition) 。一种解决方法是对其进行加不同粒度的锁,就是为了防止某一个进程只修改某一行记录从而导致整个文件都不能使用的情况。

POSIX 提供了一种灵活的、不同粒度级别的锁机制,允许一个进程使用一个不可分割的操作对一个字节或者整个文件进行加锁。加锁机制要求尝试加锁的进程指定其 要加锁的文件,开始位置以及要加锁的字节

Linux 系统提供了两种锁: 共享锁和互斥锁。如果文件的一部分已经加上了共享锁,那么再加排他锁是不会成功的;如果文件系统的一部分已经被加了互斥锁,那么在互斥锁解除之前的任何加锁都不会成功。为了成功加锁、请求加锁的部分的所有字节都必须是可用的。

在加锁阶段,进程需要设计好加锁失败后的情况,也就是判断加锁失败后是否选择阻塞,如果选择阻塞式,那么当已经加锁的进程中的锁被删除时,这个进程会解除阻塞并替换锁。如果进程选择非阻塞式的,那么就不会替换这个锁,会立刻从系统调用中返回,标记状态码表示是否加锁成功,然后进程会选择下一个时间再次尝试。

加锁区域是可以重叠的。下面我们演示了三种不同条件的加锁区域。

如上图所示,A 的共享锁在第四字节到第八字节进行加锁

如上图所示,进程在 A 和 B 上同时加了共享锁,其中 6 - 8 字节是重叠锁

如上图所示,进程 A 和 B 和 C 同时加了共享锁,那么第六字节和第七字节是共享锁。

如果此时一个进程尝试在第 6 个字节处加锁,此时会设置失败并阻塞,由于该区域被 A B C 同时加锁,那么只有等到 A B C 都释放锁后,进程才能加锁成功。

Linux 文件系统调用

许多系统调用都会和文件与文件系统有关。我们首先先看一下对单个文件的系统调用,然后再来看一下对整个目录和文件的系统调用。

为了创建一个新的文件,会使用到 creat 方法,注意没有 e 。

这里说一个小插曲,曾经有人问 UNIX 创始人 Ken Thompson,如果有机会重新写 UNIX ,你会怎么办,他回答自己要把 creat 改成 create ,哈哈哈哈。

这个系统调用的两个参数是文件名和保护模式

lseek( intfildes, off_toffset, intwhence);

lseek 的返回值是更改文件指针后文件中的绝对位置。lseek 是唯一从来不会造成真正磁盘查找的系统调用,它只是更新当前的文件位置,这个文件位置就是内存中的数字。

对于每个文件,Linux 都会跟踪文件模式(常规,目录,特殊文件),大小,最后修改时间以及其他信息。程序能够通过 stat 系统调用看到这些信息。第一个参数就是文件名,第二个是指向要放置请求信息结构的指针。这些结构的属性如下图所示。

fstat 调用和 stat 相同,只有一点区别,fstat 可以对打开文件进行操作,而 stat 只能对路径进行操作。

pipe 文件系统调用被用来创建 shell 管道。它会创建一系列的 伪文件 ,来缓冲和管道组件之间的数据,并且返回读取或者写入缓冲区的文件描述符。在管道中,像是如下操作

sort

sort 进程将会输出到文件描述符1,也就是标准输出,写入管道中,而 head 进程将从管道中读入。在这种方式中,sort 只是从文件描述符 0 中读取并写入到文件描述符 1 (管道)中,甚至不知道它们已经被重定向了。如果没有重定向的话,sort 会自动的从键盘读入并输出到屏幕中。

最后一个系统调用是 fcntl ,它用来锁定和解锁文件,应用共享锁和互斥锁,或者是执行一些文件相关的其他操作。

现在我们来关心一下和整体目录和文件系统相关的系统调用,而不是把精力放在单个的文件上,下面列出了这些系统调用,我们一起来看一下。

系统调用

描述

s = mkdir(path,mode)

创建一个新的目录

s = rmdir(path)

移除一个目录

s = link(oldpath,newpath)

创建指向已有文件的链接

s = unlink(path)

取消文件的链接

s = chdir(path)

改变工作目录

dir = opendir(path)

打开一个目录读取

s = closedir(dir)

关闭一个目录

dirent = readdir(dir)

读取一个目录项

rewinddir(dir)

回转目录使其在此使用

可以使用 mkdir 和 rmdir 创建和删除目录。但是需要注意,只有目录为空时才可以删除。

创建一个指向已有文件的链接时会创建一个 目录项(directory entry) 。系统调用 link 来创建链接,oldpath 代表已有的路径,newpath 代表需要链接的路径,使用 unlink 可以删除目录项。当文件的最后一个链接被删除时,这个文件会被自动删除。

使用 chdir 系统调用可以改变工作目录。

最后四个系统调用是用于读取目录的。和普通文件类似,他们可以被打开、关闭和读取。每次调用 readdir 都会以固定的格式返回一个目录项。用户不能对目录执行写操作,但是可以使用 creat 或者 link 在文件夹中创建一个目录,或使用 unlink 删除一个目录。用户不能在目录中查找某个特定文件,但是可以使用 rewindir 作用于一个打开的目录,使他能在此从头开始读取。

责任编辑:

文件名为空linux,文件系统:隐匿在Linux背后的机制相关推荐

  1. linux 文件系统覆盖目录,Linux内核裁减及根文件系统定制

    一.内核编译 1.准备工作 (1)整理出系统需要支持的硬件.文件系统类型以及网络协议等内容. (2)建议用命令uname –r 查看一下系统的版本号,如果你的系统版本与将要编译的内核版本一致,建议将/ ...

  2. 磁盘、分区及Linux文件系统 [Disk, Partition, Linux File System]

    1.磁盘基础知识 1.1 物理结构 硬盘的物理结构一般由磁头与碟片.电动机.主控芯片与排线等部件组成:当主电动机带动碟片旋转时,副电动机带动一组(磁头)到相对应的碟片上并确定读取正面还是反面的碟面,磁 ...

  3. Linux文件系统为,浅析Linux文件系统

    原标题:浅析Linux文件系统 一.文件系统层次分析 由上而下主要分为用户层.VFS层.文件系统层.缓存层.块设备层.磁盘驱动层.磁盘物理层 用户层 最上面用户层就是我们日常使用的各种程序,需要的接口 ...

  4. 嵌入式linux文件系统格式,嵌入式Linux的文件系统分区及数据读写方法与流程

    本发明涉及Linux系统的数据存储管理领域,特别是涉及一种基于NANDFlash存储器和UBIFS文件系统的嵌入式Linux的文件系统分区及数据读写方法. 背景技术: ::目前Linux操作系统由于源 ...

  5. 以下关于linux文件系统中inode,linux文件系统—inode及相关概念.docx

    linux文件系统-inode及相关概念 linux文件系统-inode及相关概念 博客分类: /category/156693Linux/blogs/tag/LinuxLinux/blogs/tag ...

  6. linux文件系统碎片,为什么 Linux 不需要碎片整理

    如果你是一个Linux用户,你可能听说过,不需要对你的Linux文件系统进行碎片整理.你可能还会注意到,Linux发行版并没有附带磁盘碎片整理工具.这是为什么呢? 想要知道为什么在正常使用中,Linu ...

  7. linux文件系统变成只读,Linux文件系统变成只读解决办法

    this.p={ m:2, b:2, loftPermalink:'', id:'fks_0950650870810800660930850870950850840830690920860850740 ...

  8. 不是Linux文件系统的权限,Linux中文件系统的权限管理(普通权限,特殊权限,文件的扩展属性,FACL)...

    文件系统的权限管理(DAC体系:自主访问控制体系): 普通权限 特殊权限 文件的扩展属性 FACL(文件系统访问控制列表) 安全上下文: 任何在计算机中执行的任务都是由进程来实现的,所以进程就有必要访 ...

  9. 嵌入式linux文件系统类型,嵌入式Linux 的Cramfs 根文件系统配置的解决方案

    当系统启动并执行到系统初始化脚本/etc/init.d/rcS 时,mount 命令将/mnt/yaffs 目录挂载 为ramfs 类型的随机存储文件系统,并在此文件系统上建立Qtopia 和Qtop ...

  10. linux文件系统添加pcm,linux下用sox批量将pcm文件加wav头、批量修改采样率、切音频...

    linux下用sox可以给pcm文件加头 例如:test.pcm是不带wav头的pcm文件 $ sox -t raw -c 1 -e signed-integer -b 16 -r 16000 tes ...

最新文章

  1. [2015-11-10]iis远程发布配置
  2. golang获取结构体中的tag_26. Go 语言中结构体的 Tag 用法
  3. [并查集][排序][dfs][启发式合并] JZOJ P3635 Peaks
  4. 格力手机没有放弃!将跟上5G和柔性屏的大势
  5. jsp、css中引入外部资源相对路径的问题
  6. 数据--第42课 - 图的遍历
  7. CronTrigger使用
  8. JAVA音视频解决方案----JTT1078-2016文档梳理与一些难点梳理
  9. 透析澳大利亚大学计算机硕士课程 .转
  10. 如何搭建一个网站,访问量一天几千人如何购买服务器?...
  11. html调用短信接口发送消息的实例,HTTP电脑发送短信接口调用示例
  12. 如何去除图片上的文字(PS使用教程)
  13. 交通管理PDA手持机
  14. 超酷的javascript文字云/标签云效果 - D3 Cloud
  15. Cisco Visio Stencil 实体图标下载
  16. Win10系统图片打开方式恢复默认照片查看器
  17. org.apache.maven.archiver.MavenArchiver.getManifest(org.apache.maven.project.Mav
  18. 浅谈二维和三维图像数据
  19. 文字图片滚动代码-无缝滚动,强!!!
  20. Kaldi单音子建模

热门文章

  1. xp打印服务器win10的系统连接不上,Win10系统访问WinXP系统共享打印机却连接不了的解决方法...
  2. Linux 的 diff 命令
  3. 可以叫板Google的一个搜索引擎 —— DuckDuckGo
  4. 大话设计模式-策略模式与简单工厂模式
  5. select ... into ... 与 insert into .... select .... 语句
  6. 性能测量工具类——TimeMeasureUtil TimeMeasureProxy
  7. python runtimeeeror_Python3基础 raise 产生RuntimeError 异常
  8. php邮件中文乱码,phpmailer 发送邮件中文乱码问题的解决方法总结
  9. matlab算hht,关于MATLAB中HHT谱图的问题【百度知道悬赏100积分】
  10. java 线程池 资源回收_JAVA线程池资源回收的问题