一、MMU的产生

许多年以前,当人们还在使用DOS或是更古老的操作系统的时候,计算机的内存还非常小,一般都是以K为单位进行计算,相应的,当时的程序规模也不大,所以内存容量虽然小,但还是可以容纳当时的程序。但随着图形界面的兴起还用用户需求的不断增大,应用程序的规模也随之膨胀起来,终于一个难题出现在程序员的面前,那就是应用程序太大以至于内存容纳不下该程序,通常解决的办法是把程序分割成许多称为覆盖块(overlay)的片段。覆盖块0首先运行,结束时他将调用另一个覆盖块。虽然覆盖块的交换是由OS完成的,但是必须先由程序员把程序先进行分割,这是一个费时费力的工作,而且相当枯燥。人们必须找到更好的办法从根本上解决这个问题。不久人们找到了一个办法,这就是 虚拟存储器(virtual memory) .虚拟存储器的基本思想是程序,数据,堆栈的总的大小可以超过物理存储器的大小,操作系统把当前使用的部分保留在内存中,而把其他未被使用的部分保存在磁盘上比如对一个16MB的程序和一个内存只有4MB的机器,OS通过选择,可以决定各个时刻将哪4M的内容保留在内存中,并在需要时在内存和磁盘间交换程序片段,这样就可以把这个16M的程序运行在一个只具有4M内存机器上了。而这个16M的程序在运行前不必由程序员进行分割。

任何时候,计算机上都存在一个程序能够产生的地址集合,我们称之为 地址范围 。这个范围的大小由CPU的位数决定,例如一个32位的CPU,它的地址范围是0~0xFFFFFFFF (4G)而对于一个64位的CPU,它的地址范围为0~0xFFFFFFFFFFFFFFFF (64T),这个范围就是我们的程序能够产生的地址范围,我们把这个地址范围称为 虚拟地址空间 ,该空间中的某一个地址我们称之为 虚拟地址 。与虚拟地址空间和虚拟地址相对应的则是 物理地址空间和物理地址 ,大多数时候我们的系统所具备的物理地址空间只是虚拟地址空间的一个子集,这里举一个最简单的例子直观地说明这两者,对于一台内存为256MB的32bit x86主机来说,它的虚拟地址空间范围是0~0xFFFFFFFF(4G),而物理地址空间范围是0x000000000~0x0FFFFFFF(256MB)。

在没有使用虚拟存储器的机器上,虚拟地址被直接送到内存总线上,使具有相同地址的物理存储器被读写。而在使用了虚拟存储器的情况下,虚拟地址不是被直接送到内存地址总线上,而是送到内存管理单元—— MMU (主角终于出现了)。他由一个或一组芯片组成,一般存在与协处理器中,其功能是 把虚拟地址映射为物理地址

二、MMU工作过程

大多数使用虚拟存储器的系统都使用一种称为分页(paging)。虚拟地址空间划分成称为页(page)的单位,而相应的物理地址空间也被进行划分,单位是页框(frame).页和页框的大小必须相同。接下来配合图片我以一个例子说明页与页框之间在MMU的调度下是如何进行映射的:

这里提到了一个概念,就是 页表,下面将详细介绍 页表。

三、页表

         首先让我们来介绍一个概念-页表(page table)。页表就是存储在内存中的一张表,表中记录了将虚拟地址转换成物理地址的关键信息。MMU正是通过对页表进行查询,实现了地址之间的转换。也就是说,MMU每次工作的时候都要去查这张表,从中找出与虚拟地址相对应的物理地址,然后再进行数据存取。页表的作用如下图所示



页表中的条目被称为页表项(page table entry),一个页表项负责记录一段虚拟地址到物理地址的映射关系,稍后我们会详细介绍。

既然页表是存储在内存中的,那么程序每次完成一次内存读取时都至少会访问内存两次,相比于不使用MMU时的一次内存访问,效率被大大降低了,如果所使用的内存的性能比较差的话,这种效率的降低将会更明显。因此,如何在发挥MMU优势的同时使系统消耗尽量减小,就成为了一个亟待解决的问题。

于是,TLB产生了。TLB是什么呢?我们叫它转换旁路缓冲器,它实际上是MMU中临时存放转换数据的一组重定位寄存器。既然TLB本质上是一组寄存器,那么不难理解,相比于访问内存中的页表,访问TLB的速度要快很多。因此如果页表的内容全部存放于TLB中,就可以解决访问效率的问题了。

然而,由于制造成本等诸多限制,所有页表都存储在TLB中几乎是不可能的。这样一来,我们只能通过在有限容量的TLB中存储一部分最常用的页表,从而在一定程度上提高MMU的工作效率。

这一方法能够产生效果的理论依据叫做存储器访问的局部性原理。它的意思是说,程序在执行过程中访问与当前位置临近的代码的概率更高一些。因此,从理论上我们可以说,TLB中存储了当前时间段需要使用的大多数页表项,所以可以在很大程度上提高MMU的运行效率。

让我们接着聊页表。页表是由页表项组成的,每一个页表项都能够将一段虚拟地址空间映射到一段物理地址空间中。这里所谓的这段虚拟地址空间,更专业地讲,应该叫页,一个页对应了页表中的一项,页的大小通常是可选的。在ARM中,一个页可以被配置成1K、4K、64K或1M大小(ARM v6体系以后,不再支持1K大小的页),分别叫做微页、小页、大页和段页。页的大小决定了映射的粒度,是根据实际应用有选择地配置的。以1M为例,按照我们前面的描述,假设系统中将有64M内存需要被映射,那么我们一共需要64M/1M个页表项,而每个页表项需要占据4个字节,也就是说,有256字节的内存要专门负责地址映射,不能用于其他用途。

对于1K、4K和64K大小的页,MMU采用二级查表的方法,即首先由虚拟地址索引出第一张表的某一段内容,然后再根据这段内容搜索第二张表,最后才能确定物理地址。这里的第一张表,我们叫它一级页表,第二张表被称为是二级页表。采用二级查表法的主要目的是减小页表自身占据的内存空间,但缺点是进一步降低了内存的寻址效率。不同大小的页对查表方法的支持程度如表3-1所示。

表3-1  不同大小页的查表方法

页大小

查表方法

1K

4K

64K

1M

一级查表

不支持

不支持

不支持

支持

二级查表

支持

支持

支持

不支持

下面,首先来研究一下相对简单的一级查表。

1、一级查表

一级查表只支持大小为1M的页。准确地讲,这里所谓的1M大小的页,应称为段(section)。此时,一级页表也被称为段页表。图3-4描述了段页表的内存分布情况和段页表项的具体格式。

图3-4  段页表项的结构

段页表中的每一项都类似于上图中的形式,其中:

(1)31~20位段表示物理地址的基地址,一共12位,也就是说,如果我们通过虚拟地址找到某一个段页表项,那么就可以确定这段虚拟地址所对应的物理地址的高12位了。因为段页表项后20位正好可以描述1M的内存,因此基地址每增加一个单位,物理地址就会增加1M空间。所以,我们也可以说该基地址表示了虚拟地址属于哪1M范围的物理地址。由此可知,使用段页表进行地址映射时,每一页能够描述1M的物理地址空间。进一步讲,段页表最多支持1024个页,最多占用系统4K字节的内存来存放页表。

(2)11~10位是AP位,区分了用户模式和特权模式对同一个页的不同访问权限。例如,当AP位为"11"时,表示任何模式下都可以对该空间进行读写,"10"则表示特权模式可读写该页,而用户模式只能读取该页。对AP位详细的描述请参考页权限一节。

(3)8~5位代表该页所属的域。在ARM体系结构中,系统中规定了16个域,因此使用4个位就能表示该页属于哪个域,而每一个域又有各自独立的访问权限,从而实现了初级的存储器保护。

(4)3位和2位分别代表cache和write buffer。相应的位为1则表示被映射的物理地址将使用cache或write buffer。关于cache和write buffer的有关内容,我们稍后会详述。

(5)1~0位。这两位用来区分页表类型,对于段页表,这两位的值总是为"10"。

总的来说,段页表项的内容虽然复杂,但归结起来无非就是两个问题,一是,如何解决某一虚拟地址属于哪段物理地址,二是,如何确定这段地址的访问权限。使用其他形式的页表,本质上也是要解决这两个问题。

现在,假设段页表已经被成功地添加到内存之中了,那么接下来的问题是我们应该怎样通过一个虚拟地址找到与之对应的段页表项呢找到页表项之后,又是怎样找到对应的物理地址的呢?

很显然,虚拟地址本身就可以解决上述问题。

如下图所示,首先,我们要让MMU知道段页表在内存中的首地址,也就是图中所说的页表基地址,因为段页表是我们通过程序确定的,存储在什么位置程序员自然清楚。然后,在CPU需要寻址的时候,MMU就可以自动地利用页表将虚拟地址映射为物理地址并寻址物理地址,其步骤如下:

(1)MMU取出虚拟地址的前12位作为页表项的偏移,结合页表基地址,找到对应的页表项。具体来说,就是将这12位数取出,然后左移两位和页表基地址相或,就能得到相应页表项的地址了。例如,页表基地址是0x10000000,如果虚拟地址是0x00101000,则前12位数是0x001,那么根据上述步骤将其左移两位,结果为0x004,那么页表项地址就应该是0x10000000|0x004=0x10000004,从该地址中读取的32位的数据即是该虚拟地址所对应的页表项。

(2)找到与虚拟地址对应的页表项之后,就可以从该页表项中读出一个重要信息,如图3-4所示,页表项的前12位定位了该虚拟地址所对应的物理地址在哪个范围内。例如,从0x10000004中读出的页表项的内容为0x30000c12,那么我们就已经知道了,虚拟地址0x00101000对应的物理地址在0x30000000与0x30100000之间。既然地址范围已经清楚了,那么虚拟地址又该定位到该范围的哪个位置呢?这就要靠虚拟地址的后20位了。

图3-5  段页表映射过程

3)MMU将虚拟地址后20位和页表项内容清除掉后20位之后的结果做与的操作,就得到了与虚拟地址对应的实际物理地址了。例如,页表项的内容为0x30000c12,清除掉后20位的结果为0x30000000,虚拟地址的后20位为0x01000,将其和0x30000000相与,结果为0x30001000,这便是最终的物理地址。

当然,MMU在进行地址映射期间,还要进行访问权限的检查,方法是读出页表项的权限位,按照既定规则去检查,如果允许对该地址进行访问则正常访问,如果不允许访问,则抛出异常,通过程序将其捕获并处理。这便是使用段页表时MMU的地址映射过程。

示例:viraddr是0xc000 0000 映射到 phyaddr 0x2000 000


2、二级页表:

可以让我们访问的内存不是连续的

我们也可以选择使用二级查表的方式去实现地址映射。从原理上讲,一级查表和二级查表其实并没有太大的差别。使用二级查表法,经过一级页表得到的数据不再是记录了物理地址信息的数据了,而是二级页表项的索引信息。而这些信息除了相应位和标志与一级页表项略有不同之外,与一级查表并无不同。

线性地址高10位---------索引页目录表----------->找到相应页表

线性地址中间10位---------索引页表----------->得到页表中相应的项,其中的高20位就是物理地址的高20位

线性地址低12位-------------------->物理地址的低12位

Exynos4412 内核移植(四)—— MMU 相关知识解析相关推荐

  1. linux的内核和发行版本号,【编测编学】linux内核及发行版本相关知识

    之前很多孩子就和我说老师我会linux,我就会反问,你学软件测试,你会linux你知道linux的东西如何和企业结合吗? 不是你只会一些cd.chmod.chown.ps.find.tar.vim.v ...

  2. Linux 字符设备驱动结构(三)—— file、inode结构体及chardevs数组等相关知识解析

    前面我们学习了字符设备结构体cdev Linux 字符设备驱动开发 (一)-- 字符设备驱动结构(上)  下面继续学习字符设备另外几个重要的数据结构. 先看下面这张图,这是Linux 中虚拟文件系统. ...

  3. Exynos4412 内核移植(五)—— 驱动的移植

    以移植自己制作的驱动,学习内核移植中的驱动移植,及 驱动程序的动态编译和静态编译 硬件环境: Linux 内核版本:Linux 3.14 主机:Ubuntu 12.04发行版 目标机:FS4412平台 ...

  4. Exynos4412 内核移植(七)—— 内核相关知识补充

    一.内核调试方法简单分析 1.addr2line: 解决oops错误   a -- oops消息 oops(也称 panic),称程序运行崩溃,程序崩溃后会产生oops消息.应用程序或内核线程的崩溃都 ...

  5. Exynos4412 内核移植(六)—— 设备树解析

    一.描述 ARM Device Tree起源于OpenFirmware (OF),在过去的Linux中,arch/arm/plat-xxx和arch/arm/mach-xxx中充斥着大量的垃圾代码,相 ...

  6. Exynos4412 内核移植(三)—— 内核启动过程分析

    内核启动所用函数如下: 与移植U-Boot 的过程相似,在移植Linux 之前,先了解它的启动过程.Linux 的过程可以分为两部分:架构/开发板相关的引导过程.后续的通用启动过程.对于uImage. ...

  7. Exynos4412 内核移植(二)—— 内核编译过程分析

    内核的编译同样是从Makefile 来分析: 一.内核源码结构 Linux内核文件数目近2万,出去其他架构CPU的相关文件,他们分别位于顶层目录下的17个子目录,各个目录功能独立,下面是常用目录: a ...

  8. Linux 字符设备驱动结构(一)—— cdev 结构体、设备号相关知识解析

    一.字符设备基础知识 1.设备驱动分类 linux系统将设备分为3类:字符设备.块设备.网络设备.使用驱动程序: 字符设备:是指只能一个字节一个字节读写的设备,不能随机读取设备内存中的某一数据,读取数 ...

  9. 创建vue项目(四)路由相关知识、路由守卫、插槽、打包小细节

    一.路由相关点 1. 路由跳转传参以及接参 https://segmentfault.com/a/1190000012393587 方法一: (1) 参数配置: { path : 'xx/:参数变量' ...

最新文章

  1. MyEclipse设置JSP页面默认编码方式
  2. HTML导航页面结构
  3. 跨域产生的原因和解决方法_幼儿语言障碍产生的原因及其解决方法
  4. Android互联网访问,get方式,post方式等方式
  5. 从戈君离开B站,聊聊技术人如何面对期权不踩坑
  6. Spring浅入浅出——不吹牛逼不装逼
  7. iOS关于iPhone6和iPhone6 Plus的屏幕适配问题
  8. YUY2转RGB 的各种版本
  9. 数据结构之C语言实现线性表
  10. java 移位运算符
  11. 用WPS2000制作勾股定理教学课件(转)
  12. java交接文档_如何写好交接文档
  13. AI教程视频 - 零基础玩转illustrator科研绘图-内容介绍-目录
  14. Ubuntu 18.04上使用snort3搭建NIDS(一)| 安装篇
  15. 软件库App源码+后端源码
  16. 必看 logit回归分析步骤汇总
  17. 英语音乐---三、Cry on my shoulder
  18. Kademlia详解
  19. python爬取碧蓝航线所有战舰头像
  20. Nexus 07 制品库制品晋级实践

热门文章

  1. cardsui-for-android
  2. Photoshop切图学习
  3. 第11章 路由器OSPF动态路由配置
  4. 翻译:Asp.net中多彩下拉框的实现
  5. PyTorch官方教程中文版:入门强化教程代码学习
  6. Pytorch中BN层入门思想及实现
  7. 1893. 检查是否区域内所有整数都被覆盖
  8. git 代码推送流程_Git 101:一个让您开始推送代码的Git工作流程
  9. 客户旅程_我如何充分利用freeCodeCamp的旅程
  10. angular 动画_如何在Angular 6中使用动画