1 read系统调用流程

本文内核版本:4.1.15
文件系统:ext3

read()vfs_read()rw_verify_area()__vfs_read()new_sync_read()generic_file_read_iter()  do_generic_file_read()

2 调用函数分析

2.1 read()

系统调用 read() :SYSCALL_DEFINE3(read, unsigned int, fd, char __user *, buf, size_t, count)

SYSCALL_DEFINE3(read, unsigned int, fd, char __user *, buf, size_t, count)
{struct fd f = fdget_pos(fd);                      //get struct fd from fd arrayssize_t ret = -EBADF;if (f.file) {loff_t pos = file_pos_read(f.file);                //get read pos from fileret = vfs_read(f.file, buf, count, &pos);      // vfs_readif (ret >= 0)file_pos_write(f.file, pos);                // update read pos to filefdput_pos(f);                                 // update struct fd to fd array}return ret;
}

每个进程都会保存一个 struct fd 的数组代表进程打开的文件。所以根据 fd 数组的偏移地址就能找到 struct fd 。

1.2 vfs_read()

ssize_t vfs_read(struct file *file, char __user *buf, size_t count, loff_t *pos)
{ssize_t ret;if (!(file->f_mode & FMODE_READ))               // is file open for readreturn -EBADF;if (!(file->f_mode & FMODE_CAN_READ))          // can file readreturn -EINVAL;if (unlikely(!access_ok(VERIFY_WRITE, buf, count)))return -EFAULT;ret = rw_verify_area(READ, file, pos, count);     // read or write verifyif (ret >= 0) {count = ret;ret = __vfs_read(file, buf, count, pos);        // __vfs_readif (ret > 0) {fsnotify_access(file);add_rchar(current, ret);}inc_syscr(current);}return ret;
}

1.3 __vfs_read()

ssize_t __vfs_read(struct file *file, char __user *buf, size_t count,loff_t *pos)
{if (file->f_op->read)return file->f_op->read(file, buf, count, pos);else if (file->f_op->read_iter)return new_sync_read(file, buf, count, pos);elsereturn -EINVAL;
}

根据文件的注册 file_operations 调用相应的 read 方法:

  • 注册的 file_operations 有 read 方法,调用 read 方法,一般的设备文件会注册此类接口
  • 若 file_operations 有 read_iter 方法,调用 new_sync_read()。一般普通文件注册此类方法。

下面分别是 tty 设备与 ext3 文件系统注册的 file_operations:

static const struct file_operations tty_fops = {.llseek     = no_llseek,.read      = tty_read,.write      = tty_write,.poll      = tty_poll,.unlocked_ioctl = tty_ioctl,.compat_ioctl  = tty_compat_ioctl,.open       = tty_open,.release    = tty_release,.fasync      = tty_fasync,
};const struct file_operations ext3_file_operations = {.llseek     = generic_file_llseek,.read_iter   = generic_file_read_iter,.write_iter   = generic_file_write_iter,.unlocked_ioctl  = ext3_ioctl,
#ifdef CONFIG_COMPAT.compat_ioctl   = ext3_compat_ioctl,
#endif.mmap     = generic_file_mmap,.open      = dquot_file_open,.release = ext3_release_file,.fsync     = ext3_sync_file,.splice_read  = generic_file_splice_read,.splice_write   = iter_file_splice_write,
};

1.4 new_sync_read()

static ssize_t new_sync_read(struct file *filp, char __user *buf, size_t len, loff_t *ppos)
{struct iovec iov = { .iov_base = buf, .iov_len = len };struct kiocb kiocb;struct iov_iter iter;ssize_t ret;init_sync_kiocb(&kiocb, filp);kiocb.ki_pos = *ppos;iov_iter_init(&iter, READ, &iov, 1, len);ret = filp->f_op->read_iter(&kiocb, &iter);          //fs/ext3/file.c/line53BUG_ON(ret == -EIOCBQUEUED);*ppos = kiocb.ki_pos;return ret;
}

这里采用了 散布读(scatter read)和聚集写(gather writer)技术。具体参见 UNIX 环境高级编程14.6节。

1.5 generic_file_read_iter()

ssize_t
generic_file_read_iter(struct kiocb *iocb, struct iov_iter *iter)
{struct file *file = iocb->ki_filp;ssize_t retval = 0;loff_t *ppos = &iocb->ki_pos;loff_t pos = *ppos;if (iocb->ki_flags & IOCB_DIRECT) {      // open direct I/O, copy data from disk to user, not use page cachestruct address_space *mapping = file->f_mapping;struct inode *inode = mapping->host;size_t count = iov_iter_count(iter);loff_t size;if (!count)goto out; /* skip atime */size = i_size_read(inode);retval = filemap_write_and_wait_range(mapping, pos,pos + count - 1);if (!retval) {struct iov_iter data = *iter;retval = mapping->a_ops->direct_IO(iocb, &data, pos);}if (retval > 0) {*ppos = pos + retval;iov_iter_advance(iter, retval);}/** Btrfs can have a short DIO read if we encounter* compressed extents, so if there was an error, or if* we've already read everything we wanted to, or if* there was a short read because we hit EOF, go ahead* and return.  Otherwise fallthrough to buffered io for* the rest of the read.  Buffered reads will not work for* DAX files, so don't bother trying.*/if (retval < 0 || !iov_iter_count(iter) || *ppos >= size ||IS_DAX(inode)) {file_accessed(file);goto out;}}retval = do_generic_file_read(file, ppos, iter, retval);
out:return retval;
}

该函数分为两个部分:

  • 若是在直接 I/O 模式下打开,任何读写操作都将数据在用户态地址与磁盘间直接传送而不通过页高速缓存。这种情况暂时不分析。
  • 经过高速缓存读取文件,调用 do_generic_file_read()

do_generic_file_read() 函数是读文件的核心,同时函数也比较长,我们下篇文章再来分析。

Linux read系统调用相关推荐

  1. 文件编程之Linux下系统调用

    说明: linux下文件编程可使用两种方法: ****linux系统调用 ****C语言库函数 前者依赖于linux系统,后者与操作系统是独立的. 在任何操作系统下,使用C语言库函数操作文件的方法都是 ...

  2. linux中系统调用和库函数的区别

    linux中系统调用和库函数的区别 2013-05-03 22:18:20 分类: LINUX 首先,要说一下两者的概念: 系统调用 :是操作系统为用户态运行的进程和硬件设备(如CPU.磁盘.打印机等 ...

  3. open函数返回-1_4.6 linux的系统调用执行探究(1)

    arm64大约支持280个系统调用,我们平时使用的这些系统调用,到底工作原理是什么,调用后又是到哪里实现的呢,这篇文章初步了解下内核系统调用的流程,并告诉跟踪这个流程的方法. 废话不多说,如上就是li ...

  4. linux系统列表,Linux常用系统调用列表-20210415054405.docx-原创力文档

    Linux Linux常用系统调用列表作者:雷震 2002年3月 本文列出了大部分常见的Linux系统调用,并附有简要中文说明. 以下是Linux系统调用的一个列表,包含了大部分常用系统调用和由系统调 ...

  5. linux mkdir 系统调用,Linux Rootkit 系列四:对于系统调用挂钩方法的补充

    免责声明:本文介绍的安全知识方法以及代码仅用于渗透测试及安全教学使用,禁止任何非法用途,后果自负 前言 我将会把系列文章继续写下去,由于本系列文章novice同学也在写,所以我俩的顺序可能有点乱,不过 ...

  6. linux网络系统调用,Linux网络系统调用接口--待续

    [内核版本:linux-2.6.30] Linux网络系统调用接口其定义在:linux/net/socket.c 其中主要的接口,如下所示. 1. socket Function: Definitio ...

  7. linux内核中获取虚拟地址api,Linux内核-系统调用

    Linux内核-系统调用 1.与内核通信 #系统调用在用户空间进程和硬件设备之间添加了一个中间层 作用:1.为用户空间提供了一种硬件的抽象接口 2.系统调用保证了系统的稳定和安全 3.出于每一个进程都 ...

  8. linux内核-系统调用execve()

    读者在linux内核-系统调用fork.vfork与clone中已经看到,进程通常是按其父进程的原样复制出来的,在多数情况下,如果复制出来的子进程不能与父进程分道扬镳,走自己的路,那就没多大意义.所以 ...

  9. Linux进程调用execve,linux内核系统调用函数do_execve()解析实例源码

    linux内核系统调用函数do_execve()解析,彻底解析内核调用用户空间代码入口函数do_execve() sys_execve() –> do_execve() /usr/src/lin ...

  10. 浅谈阻塞/非阻塞、同步/异步——从linux read()系统调用出发

    浅谈阻塞/非阻塞.同步/异步 –从linux IO系统调用出发 阻塞与非阻塞主要从进程/线程的角度出发: 阻塞(blocking):教科书年年考的概念--调用方(主线程)发起调用之后挂起直到被调用方法 ...

最新文章

  1. 一行代码实现微光效果
  2. 在switch case 语句中能否使用continue 关键字?为什么?
  3. linux vnc用户,给CentOS服务器添加用户并开启vncserver的方法
  4. PHP算法为数组补全不存在的键
  5. ext 部署到 tomcat服务器下,通过http8080端口查看
  6. 干货 一文看尽 mysql
  7. 鸿蒙OS应用开发_基础篇_编写第一个HarmonyOs应用_体会HarmonyOs的一次开发多端部署_以及分布式任务调度_IDE安装_了解应用组件以及应用布局---HarmonyOs开发工作笔记001
  8. 第 91 章 SMS
  9. Angular2 初识
  10. sqlyog备份数据和导入备份数据
  11. 如何安装Vmware ESXi 6.7(图文介绍)
  12. 基于java的网络电子通讯录的设计_网络电子通讯录管理系统
  13. 有符号与无符号,长整型与短整型
  14. VC++实现禁止上网
  15. 【Linux c】sipc
  16. Kali使用中文输入法
  17. arduino小车,准备(一):TB6612FNG电机驱动器
  18. 从 电影《飞驰人生》中想到
  19. 用python编写乒乓球小游戏--Turtle功能的应用
  20. oracle中的crs,Oracle CRS简介

热门文章

  1. 高通QCA9531方案定制开发主板300M 2.4G无线模块面板AP wifi路由模块 用的是什么网络变压器
  2. 浅谈IT隔离电源系统在医疗场所的接地设计研究与应用
  3. 微信小程序上传图片和文件
  4. python plt 画图
  5. 计算机联锁控制台操作演示,车站计算机联锁控制台的设计.doc
  6. 清明上河图对计算机技术的启发,风俗画的定义与《清明上河图》的启示
  7. Mac、M1怎么安装Maven
  8. 计算机基础构建,构建高职《计算机网页设计》课程教学过程设计模式_计算机基础大一考试题...
  9. 文件已被其他应用程序锁定该怎么解决
  10. 高性能 TCP/UDP/HTTP 通信框架 HP-Socket v4.1.1