计算机组成原理课后答案(唐朔飞第三版) 第四章

计算机组成原理课后答案(唐朔飞第三版) 第3章

第4章存储器

教材课后思考题与习题：

4.1 解释概念：主存、辅存、Cache、RAM、SRAM、DRAM、ROM、PROM、EPROM、EEPROM、CDROM、Flash Memory

主存：主存储器，用于存放正在执行的程序和数据。CPU可以直接进行随机读写，访问速度较高。

RAM：（Random Access Memory），随机存取存储器，是一种可读/写存储器，一般用于计算机的主存。
- SRAM：（Static RAM），静态随机存储器
- DRAM：（Dynamic RAM），动态随机存储器
ROM：（Read Only Memory），掩膜式半导体只读存储器
- PROM：（Programmable ROM），可编程只读存储器 -
- EPROM：（Erasable Programmable ROM），可擦写可编程只读存储器
- EEPROM：（Electrically Erasable Programmable ROM），用电可擦除可编程只读存储器
辅存：辅助存储器，作为主存的后备存储器，不直接与CPU交换信息，容量比主存大，速度比主存慢。
- CDROM：只读型光盘
Cache：为解决主存和CPU的速度匹配，提高访存速度的一种存储器，设在CPU和主存之间，存放CPU近期要用的信息。
Flash Memory：闪速存储器。或称快擦型存储器

4.2 计算机中哪些部件可以用于存储信息？按速度、容量和价格/位排序说明。

计算机中的寄存器、Cache、主存、硬盘可以用于存储信息，这个顺序：速度从高到低、容量从小到大、价格从高到低。

4.3 存储器的层次结构主要体现在什么地方？为什么要分这些层次？计算机如何管理这些层次？

存储器的层次结构主要体现在下面两个层次上：Cache—主存、主存—辅存。
”Cache—主存“层次在存储系统中主要对CPU访存起加速作用，即从整体运行的效果分析，CPU访存速度加快，接近于Cache的速度，而寻址空间和位价却接近于主存。
”主存—辅存“层次在存储系统中主要起扩容作用，即从程序员的角度看，他所使用的存储器其容量和位价接近于辅存，而速度接近于主存。
综合上述两个存储层次的作用，从整个存储系统来看，就达到了速度快、容量大、位价低的优化效果。
主存与Cache之间的信息调度功能全部由硬件自动完成。而主存与辅存层次的调度目前广泛采用虚拟存储技术实现，即将主存与辅存的一部分通过软硬结合的技术组成虚拟存储器，程序员可使用这个比主存实际空间（物理地址空间）大得多的虚拟地址空间（逻辑地址空间）编程，当程序运行时，再由软、硬件自动配合完成虚拟地址空间与主存实际物理空间的转换。因此，这两个层次上的调度或转换操作对于程序员来说都是透明的。

4.4 说明存取周期和存取时间的区别。

存取周期和存取时间的主要区别是：存取时间仅为完成一次操作的时间，而存取周期不仅包含操作时间，还包含操作后线路的恢复时间。即：存取周期 = 存取时间 + 恢复时间

4.5 什么是存储器的带宽？若存储器的数据总线宽度为32位，存取周期为200ns，则存储器的带宽是多少？

存储器带宽：单位时间内存储器存取的信息量，单位用：字/秒 or 字节/秒 or 位/秒
带宽计算：1/200ns ×32位 = 160M位/秒 = 20MB/秒 = 5M字/秒

4.6 某机字长为32位，其存储容量是64KB，按字编址它的寻址范围是多少？若主存以字节编址，试画出主存字地址和字节地址的分配情况。

按“字”编址寻址范围：64KB /（32/8） = 16K
按“字节”编址寻址范围：就是64K
字地址与字节地址的分配情况如下图：

4.7 一个容量为16K×32位的存储器，其地址线和数据线的总和是多少？当选用下列不同规格的存储芯片时，各需要多少片？

1K×4位，2K×8位，4K×4位，16K×1位，4K×8位，8K×8位

地址线总数：log2(16×1024) = 14根
数据线总数：32根
1K×4位：（16K×32） / （1K×4） = 16×8 = 128片；每组8片，共16组。每次读出一个存储字，只需选中一组芯片（8片）。
2K×8位：（16K×32） / （2K×8） = 8×4 = 32片
4K×4位：（16K×32） / （4K×4） = 4×8 = 32片
16K×1位：（16K×32）/ （16K×1） = 1×32 = 32片
4K×8位：（16K×32）/ （4K×8） = 4×4 = 16片
8K×8位：（16K×32） / （8K×8） = 2×4 = 8片

4.8 试比较静态RAM和动态RAM。

静态RAM和动态RAM都属于随机存储器，即在程序的执行过程中既可读出信息又可写入信息。但静态RAM靠触发器原理存储信息，只要电源不掉电，信息就不会丢失；
动态RAM靠电容存储电荷原理存储信息，即使电源不掉电，由于电容要放电，信息也会丢失，故需再生。

4.9 什么叫刷新？为什么要刷新？说明刷新有几种方法。

动态RAM靠电容存储电荷原理存储信息，电容上的电荷要放电，信息即丢失。为了维持所存信息，需要再一定时间（2ms）内，将所存信息读出再重新写入（恢复），这一过程称为刷新，刷新是一行一行进行的，由CPU自动完成。
刷新方式有三种：
集中刷新： 即在2ms时间内，集中一段时间对存储芯片的每行刷新一遍，在这段时间里不能对存储器进行访问，即所谓的死时间。
分散刷新： 是将存储系统周期分为两半，前半段时间用来读/写操作，后半段时间用来刷新操作，显然整个系统的速度降低了，但分散刷新没有存储器的死时间。
异步刷新： 为集中刷新和分散刷新的结合。这种刷新可在2ms时间内对存储芯片的每一行刷新一遍，两行之间的刷新时间间隔为 2ms/芯片的片数。

4.10 半导体存储器芯片的译码驱动方式有几种？

线选法：地址信号只需经过一个方向的译码就可选中某一存储单元的所有位，适用于地址线较少的芯片。
重合法：适用于地址线较多的芯片。地址线分为两组，分别经过行、列两个方向译码，只有行、列两个方向均被选中的存储元才能进行读/写信息。

4.11 一个8K×8位的动态RAM芯片，其内部结构排列成256×256形式，存取周期为0.1μs。试问采用集中刷新、分散刷新和异步刷新三种方式的刷新间隔各为多少？

集中刷新方式：刷新时间间隔：2ms，其中刷新的死时间为：256×0.1μs=25.6μs
分散刷新方式：刷新时间间隔：256×（0.1μs+×0.1μs）=51.2μs
异步刷新方式：刷新时间间隔：2ms

4.12 画出用1024×4位的存储芯片组成一个容量为64K×8位的存储器逻辑框图。要求将64K分成4个页面，每个页面分16组，指出共需多少片存储芯片。

将存储器分成若干个容量相等的区域，每一个区域可看作一个页面。假设采用SRAM芯片：
- 总片数：64K×8位 / （1024×4位）= 128片
本题设计的存储器结构上，分为‘总体’、‘页面’、‘组’三级，因此画图时，也应分成三级画，首先应确定各级的容量：
- 页面容量：64K×8位 / 4 = 16K×8位
- 组容量：页面容量 / 组数 = 16K×8位 / 16 = 1K×8位
- 组内片数：组容量 / 片容量 = 1K×8位 / （1K×4位） = 2片
因此地址分配：页面号（2位）+组号（4位）+组内地址（10位）

4.13 设有一个64K×8位的RAM芯片，试问该芯片共有多少个基本单元电路（简称存储基元）？欲设计一种具有上述同样多存储基元的芯片，要求对芯片字长的选择应满足地址线和数据线的总和为最小，试确定这种芯片的地址线和数据线，并说明有几种解答。

存储基元总数：64K×8位 = 64×2×10×8 = 512K位 = 2^19位。
-如果要满足地址线和数据线总和最小，应尽量把存储元安排在字向，因为地址位数和字数成2的幂关系，可较好的压缩线数。设地址线根数为a，数据线根数为b，则片容量为：（2^a）× b = 2^19位，b = 2^(19-a)。
若a = 19，b = 1，总和 = 19+1 = 20；

           a = 18，b = 2，总和 = 18+2 = 20；a = 17，b = 4，总和 = 17+4 = 21；a = 16，b = 8，总和 = 16+8 = 24；……     ……由上可看出：芯片字数越少，芯片字长越长，引脚数越多。芯片字数减1、芯片位数均按2的幂变化。结论：如果满足地址线和数据线的总和为最小，这种芯片的引脚分配方案有两种：地址线 = 19根，数据线 = 1根；或地                 址线 = 18根，数据线 = 2根。

4.14 某8位微型机地址码为18位，若使用4K×4位的RAM芯片组成模块板结构的存储器，试问：

（1）该机所允许的最大主存空间是多少？

（2）若每个模块板为32K×8位，共需几个模块板？

（3）每个模块板内共有几片RAM芯片？

（4）共有多少片RAM？

（5）CPU如何选择各模块板？

该机所允许的最大主存空间是：2^18 × 8位 = 2^8 × 1K × 8位 = 256K × 8位 = 256KB
模板快总数：256K × 8位 / （32K ×8位）= 8块
板内片数：32K × 8位 / （4K×4位） = 16片
总片数：16片 × 8快 = 128片
CPU通过最高3位地址译码输出选择模板，次高3位地址译码选择芯片。地址格式分配如下：

4.15 设CPU共有16根地址线，8根数据线，并用MREQ（低电平有效）作访存控制信号，R / W 作读写命令信号（高电平为读，低电平为写）。现有下列存储芯片：ROM（2K×8位，4K×4位，8K×8位），RAM（1K×4位，2K×8位，4K×8位），及74138译码器和其他门电路（门电路自定）。试从上述规格中选用合适芯片，画出CPU和存储芯片的连接图。要求：

（1）最小4K地址为系统程序区，4096~16383地址范围为用户程序区。
（2）指出选用的存储芯片类型及数量。
（3）详细画出片选逻辑。
解：（1）地址空间分配图：
系统程序区（ROM 共 4KB）：0000H-0FFFH
用户程序区（RAM 共 12KB）：1000H-FFFFH
（2）选片：ROM：选择 4K×4 位芯片 2 片，位并联
RAM ：选择 4K×8 位芯片 3 片，字串联 (RAM1 地址范围
为:1000H-1FFFH,RAM2 地址范围为 2000H-2FFFH, RAM3 地址范围为:3000H-3FFFH)
（3）各芯片二进制地址分配如下：

CPU 和存储器连接逻辑图及片选逻辑如下图(3)所示：

4.16 CPU假设同上题，现有8片8K×8位的RAM芯片与CPU相连，试回答：

（1）用74138译码器画出CPU与存储芯片的连接图；
（2）写出每片RAM的地址范围；
（3）如果运行时发现不论往哪片RAM写入数据后，以A000H为起始地址的存储芯片都有与其相同的数据，分析故障原因。
（4）根据（1）的连接图，若出现地址线A13与CPU断线，并搭接到高电平上，将出现什么后果？
解：
（1）CPU 与存储器芯片连接逻辑图：

（2）地址空间分配图：
RAM0:0000H-1FFFH
RAM1:2000H-3FFFH
RAM2:4000H-5FFFH
RAM3:6000H-7FFFH
RAM4:8000H-9FFFH
RAM5:A000H-BFFFH
RAM6:C000H-DFFFH
RAM7:E000H-FFFFH
（3）如果运行时发现不论往哪片 RAM 写入数据后，以 A000H 为起始地址的存储芯片(RAM5)都有与其相同的数据，则根本的故障原因为：该存储芯片的片选输入端很可能总是处于低电平。
假设芯片与译码器本身都是好的，可能的情况有：

1）该片的-CS 端与-WE 端错连或短路；
2）该片的-CS 端与 CPU 的-MREQ 端错连或短路；
3）该片的-CS 端与地线错连或短路。在此假设芯片与译码器本身都是好的。译码器故障等。
（4）如果地址线 A13 与 CPU 断线，并搭接到高电平上，将会出现 A13 恒为“1”的情况。此时存储器只能寻址 A13=1 的地址空间(奇数片)，A13=0 的另一半地址空间（偶数片）将永远访问不到。若对 A13=0 的地址空间（偶数片）进行访问，只能错误地访问到 A13=1 的对应空间(奇数片)中去。

4.17 写出1100、1101、1110、1111对应的汉明码。

有效信息位均为n=4位，假设有效信息用b4b3b2b1表示
校验位位数 k=3位（2^k >= n+k+1）
设校验位分别位c1、c2、c3，则汉明码共 4 + 3 = 7位，即c1c2b4c3b3b2b1
校验码在汉明码中分别处于第1、2、4位
c1=b4⊕b3⊕b1
c2=b4⊕b2⊕b1
c3=b3⊕b2⊕b1
当有效信息为1100时，c3c2c1=110,汉明码为0111100。
当有效信息为1101时，c3c2c1=001,汉明码为1010101。
当有效信息为1110时，c3c2c1=000,汉明码为0010110。
当有效信息为1111时，c3c2c1=111,汉明码为1111111。

4.18 已知收到的汉明码（按配偶原则配置）为1100100、1100111、1100000、1100001，检查上述代码是否出错？第几位出错？

假设接收到的汉明码为：c1’ c2’ b4’ c3’ b3’ b2’ b1’
纠错过程如下：

P1=c1’⊕b4’⊕b3’⊕b1’

P2=c2’⊕b4’⊕b2’⊕b1’

P3=c3’⊕b3’⊕b2’⊕b1’

如果收到的汉明码为1100100，则p3p2p1=011，说明代码有错，第3位（b4’）出错，有效信息为：1100

如果收到的汉明码为1100111，则p3p2p1=111，说明代码有错，第7位（b1’）出错，有效信息为：0110

如果收到的汉明码为1100000，则p3p2p1=110，说明代码有错，第6位（b2’）出错，有效信息为：0010

如果收到的汉明码为1100001，则p3p2p1=001，说明代码有错，第1位（c1’）出错，有效信息为：0001

4.19 已经接收到下列汉明码，分别写出它们所对应的欲传送代码。

（1）1100000（按偶性配置）

（2）1100010（按偶性配置）

（3）1101001（按偶性配置）

（4）0011001（按奇性配置）

（5）1000000（按奇性配置）

（6）1110001（按奇性配置）

（一）假设接收到的汉明码为C1’C2’B4’C3’B3’B2’B1’，按偶性配置则：

P1=C1’⊕B4’⊕B3’⊕B1’

P2=C2’⊕B4’⊕B2’⊕B1’

P3=C3’⊕B3’⊕B1’

（1）如接收到的汉明码为1100000，

P1=1⊕0⊕0⊕0=1

P2=1⊕0⊕0⊕0=1

P3=0⊕0⊕0=0

P3P2P1=011，第3位出错，可纠正为1110000，故欲传送的信息为1000。

（2）如接收到的汉明码为1100010，

P1=1⊕0⊕0⊕0=1

P2=1⊕0⊕1⊕0=0

P3=0⊕0⊕0=0

P3P2P1=001，第1位出错，可纠正为0100010，故欲传送的信息为0010。

（3）如接收到的汉明码为1101001，

P1=1⊕0⊕0⊕1=0

P2=1⊕0⊕0⊕1=0

P3=1⊕0⊕1=0

P3P2P1=000，传送无错，故欲传送的信息为0001。

（二）假设接收到的汉明码为C1’C2’B4’C3’B3’B2’B1’，按奇性配置则：

P1=C1’⊕B4’⊕B3’⊕B1’⊕1

P2=C2’⊕B4’⊕B2’⊕B1’⊕1

P3=C3’⊕B3’⊕B1’⊕1

（4）如接收到的汉明码为0011001，

P1=0⊕1⊕0⊕1⊕1=1

P2=0⊕1⊕0⊕1⊕1=1

P3=1⊕0⊕1⊕1=1

P3P2P1=111，第7位出错，可纠正为0011000，故欲传送的信息为1000。

（5）如接收到的汉明码为1000000，

P1=1⊕0⊕0⊕0⊕1=0

P2=0⊕1⊕0⊕0⊕1=0

P3=0⊕0⊕0⊕1=1

P3P2P1=100，第4位出错，可纠正为1001000，故欲传送的信息为0000。

（6）如接收到的汉明码为1110001，

P1=1⊕1⊕0⊕1⊕1=0

P2=1⊕1⊕0⊕1⊕1=0

P3=0⊕0⊕1⊕1=0

P3P2P1=000，传送无错，故欲传送的信息为1001。

4.20 欲传送的二进制代码为1001101，用奇校验来确定其对应的汉明码，若在第6位出错，说明纠错过程。

欲传送的二进制代码为1001101，有效信息位数为n=7位，则汉明校验的校验位为k位，则：2^k >= n+k+1，k=4，进行奇校验设校验位为C1C2C3C4，汉明码为C1C2B7C3B6B5B4C4B3B2B1，

C1=1⊕B7⊕B6⊕B4⊕B3⊕B1=1⊕1⊕0⊕1⊕1⊕1=1

C2=1⊕B7⊕B5⊕B4⊕B2⊕B1=1⊕1⊕0⊕1⊕0⊕1=0

C3=1⊕B6⊕B5⊕B4=1⊕0⊕0⊕1=0

C4=1⊕B3⊕B2⊕B1=1⊕1⊕0⊕1=1

故传送的汉明码为10100011101，若第6位(B5)出错，即接收的码字为10100111101，则

P1=1⊕C1’⊕B7’⊕B6’⊕B4’⊕B3’⊕B1’=1⊕1⊕1⊕0⊕1⊕1⊕1=0

P2=1⊕C2’⊕B7’⊕B5’⊕B4’⊕B2’⊕B1’=1⊕0⊕1⊕1⊕1⊕0⊕1=1

P3=1⊕C3’⊕B6’⊕B5’⊕B4’=1⊕0⊕0⊕1⊕1=1

P4=1⊕C4’⊕B3’⊕B2’⊕B1’=1⊕1⊕1⊕0⊕1=0

P4P3P2P1=0110说明第6位出错，对第6位取反即完成纠错。

4.21 为什么在汉明码纠错过程中，新的检测位P4P2P1的状态即指出了编码中错误的信息位？

答：汉明码属于分组奇偶校验，P4P2P1=000，说明接收方生成的校验位和收到的校验位相同，否则不同说明出错。由于分组时校验位只参加一组奇偶校验，有效信息参加至少两组奇偶校验，若果校验位出错，P4P2P1的某一位将为1，刚好对应位号4、2、1；若果有效信息出错，将引起P4P2P1中至少两位为1，如B1出错，将使P4P1均为1，P2=0，P4P2P1=101,

4.22 某机字长16位，常规的存储空间为64K字，若想不改用其他高速的存储芯片，而使访存速度提高到8倍，可采取什么措施？画图说明。

解：
机器字长为16位，说明CPU一次能处理的数据位数是16位，不过这和本题无关。
存储空间为64K字，如果是采用单个存储体，每个存取周期的时间内，该单个存储体能向CPU提供 1个存储字长（具体是几位题干未给出）的二进制代码。
现在，若想不改用高速存储芯片，而使访存速度提高到8倍，也就是希望在一个存取周期的时间内，向CPU提供8个存储字长的二进制代码，则可采取八体交叉存取技术，8体交叉访问的结构图和时序图：

由下图可知，每隔1/8 个存期周期就可在存储总线上获得一个数据。

4.23 设CPU共有16根地址线，8根数据线，并用 M/IO 作为访问存储器或I/O的控制信号（高电平为访存，低电平为访I/O），WR（低电平有效）为写命令，RD（低电平有效）为读命令。设计一个容量为64KB的采用低位交叉编址的8体并行结构存储器。现有下图所示的存储器芯片和138译码器。

画出CPU和存储器芯片（芯片容量自定）的连接图，并写出图中每个存储芯片的地址范围（用十六进制数表示）。
解答：
8体低位交叉并行存储器的每个存储体的容量：64KB / 8 = 8KB，因此选择 8KB 的 RAM芯片。
8体存储器的低位交叉，地址编址范围如下图：

方案1：8体交叉编址的CPU和存储芯片的连接图：
注：此设计方案只能实现八体之间的低位交叉寻址，但并不能实现八体并行操作。

方案2：八体交叉并行存取系统体内逻辑如下图：

在这里插入图片描述

4.24 一个4体低位交叉的存储器，假设存储周期为T，CPU每隔1/4存取周期启动一个存储体，试问依次访问64个字需多少个存取周期？

解答：
只有访问第1个字需要一个存取周期，从第2个字开始，每隔1 / 4存取周期即可访问一个字，因此，依次访问64个字需：
存取周期个数 = （64-1）× （1/4）T + T = 16.75T
与常规存储器的速度相比，加快了（64 - 16.75）T = 47.25T
注：4体交叉存取虽然从理论上讲可讲存取速度提高到4倍，但实现时哟由于并行存取的分时启动需要一定的时间，故实际上只能提高到接近4倍。

4.25 什么是“程序访问的局部性”？存储系统中哪一级采用了程序访问的局部性原理？

解答：
程序运行的局部性原理指：
在一小段时间内，最近被访问过的程序和数据很可能再次被访问；
在空间上，这些被访问的程序和数据往往集中在一小片存储区；
在访问顺序上，指令顺序执行比转移执行的可能性大（大约 5:1）。
存储系统中Cache - 主存层次采用了程序访问的局部性原理。

4.26 计算机中设置Cache的作用是什么？能否将Cache的容量扩大，最后取代主存，为什么？

解答：
计算机中设置Cache主要是为了加速CPU访存速度。

不能把Cache的容量扩大到最后取代主存，主要因为Cache和主存的结构原理以及访问机制不同（主存是按地址访问，Cache是按内容及地址访问）。

4.27 Cache做在CPU芯片内有什么好处？将指令Cache和数据Cache分开又有什么好处？

答：
Cache 做在 CPU 芯片内主要有下面几个好处：

1）可提高外部总线的利用率。因为 Cache 在 CPU 芯片内，CPU 访问 Cache 时不必占用外部
总线。
2）Cache 不占用外部总线就意味着外部总线可更多地支持 I/O 设备与主存的信息传输，增
强了系统的整体效率。
3）可提高存取速度。因为 Cache 与 CPU 之间的数据通路大大缩短,故存取速度得以提高。
将指令 Cache 和数据 Cache 分开有如下好处：
1）可支持超前控制和流水线控制，有利于这类控制方式下指令预取操作的完成。
2）指令 Cache 可用 ROM 实现，以提高指令存取的可靠性。
3）数据 Cache 对不同数据类型的支持更为灵活，既可支持整数（例 32 位），也可支持浮点数据（如 64 位）
补充：

Cache 结构改进的第三个措施是分级实现，如二级缓存结构，即在片内 Cache（L1）和主存之间再设一个片外 Cache（L2），片外缓存既可以弥补片内缓存容量不够大的缺点，又可在主存与片内缓存间起到平滑速度差的作用，加速片内缓存的调入调出速度

4.28 设主存容量为256K字，Cache容量为2K字，块长为4。

（1）设计Cache地址格式，Cache中可装入多少块数据？
（2）在直接映射方式下，设计主存地址格式。
（3）在四路组相联映射方式下，设计主存地址格式。
（4）在全相联映射方式下，设计主存地址格式。
（5）若存储字长为32位，存储器按字节寻址，写出上述三种映射方式下主存的地址格式。

解答：
Cache中可装入块数：2K字 / 4字 = 2×2^10 / 4 = 2^9 = 512块，因此缓存块的地址需要9位。每一块4个字，且访存地址为字地址，因此块内地址为2位。
主存容量为 256K字 = 2^18字。因此主存地址共18位。直接映射方式下，由于Cache中共有512块，因此主存中需要分区成512个区，512个区 ×（每个区 y个字块）×4字 = 256K 字 = 2^18字。得 y = 2^{7，即每个区域需要2}7个字块。因此直接映射方式下主存地址格式为：
主存字块标记（7位）缓存块地址（9位）字块内地址（2位）
缓存块地址：可以找到主存块中的哪一个区域；主存字块标记：可以找到主存某个区域下的哪一块；字块内地址：可以找到某个块的某个块的哪一个字
四路组相连映射时，对Cache进行分组，每个组中共有4个块，因此可以讲Cache分成512 / 4 = 2^7 组，因此Cache组地址需要7位。四路组相连下地址格式为：
主存字块标记（9位）组地址（7位）字块内地址（2位）
映射的时候，也需要将主存分为2^{7个区域，每个区域则需要有2}9个块，每个块有4个字。映射规则：主存每个区域的第 i 块，都可以映射到Cache的第 i 组中去。
全相连映射下，主存地址格式为：主存字块标记（16位）+块内地址（2位）
若存储字长为32位，存储器按字节寻址，则主存容量为256K*32/4=221B，

Cache容量为2K32/4=214B，块长为432/4=32B=25B，字块内地址为5位，

在直接映射方式下，主存字块标记为21-9-5=7位，主存地址格式为：
主存字块标记（7位）
Cache字块地址（9位）
字块内地址（5位）
在四路组相联映射方式下，主存字块标记为21-7-5=9位，主存地址格式为：
主存字块标记（9位）
组地址（7位）
字块内地址（5位）
在全相联映射方式下，主存字块标记为21-5=16位，主存地址格式为
主存字块标记（16位）
字块内地址（5位）

4.29 假设CPU执行某段程序时共访问Cache命中4800次，访问主存200次，已知Cache的存取周期为30ns，主存的存取周期为150ns，求Cache的命中率以及Cache-主存系统的平均访问时间和效率，试问该系统的性能提高了多少倍？

解答：
命中率 H = 4800 / （4800 + 200） = 0.96
Cache - 主存的平均访问时间 ta = 0.96 × 30ns + （1 - 0.96）× 150ns = 34.8ns
访问效率 e = tc / ta × 100% = 86.2%
性能为原来的 150ns / 34.8ns = 4.31倍，即提高了 3.31倍。

4.30 一个组相连映射的CACHE由64块组成，每组内包含4块。主存包含4096块，每块由128字组成，访存地址为字地址。试问主存和高速存储器的地址各为几位？画出主存地址格式。

解：
cache组数：64/4=16 ，
Cache容量为：64128=213字，cache地址13位
主存共分：4096/16=256区，每区16块
主存容量为：4096128=219字，主存地址19位，地址格式如下：
主存字块标记（8位）
组地址（4位）
字块内地址（7位）

4.31 设主存容量为1MB，采用直接映射方式的Cache容量为16KB，块长为4，每字32位。试问主存地址为ABCDEH的存储单元在Cache中的什么位置？

解：主存和Cache按字节编址，

Cache容量16KB=214B，地址共格式为14位，分为16KB/(432/8B)=210块，每块432/8=16B=24B，Cache地址格式为：

Cache字块地址（10位）

字块内地址（4位）

主存容量1MB=220B，地址共格式为20位，分为1MB/(4*32/8B)=216块，每块24B，采用直接映射方式，主存字块标记为20-14=6位，主存地址格式为：

主存字块标记（6位）

Cache字块地址（10位）

字块内地址（4位）

主存地址为ABCDEH=1010 1011 1100 1101 1110B，主存字块标记为101010，Cache字块地址为11 1100 1101，字块内地址为1110，故该主存单元应映射到Cache的101010块的第1110字节，即第42块第14字节位置。或者在Cache的第11 1100 1101 1110=3CDEH字节位置。

4.32 设某机主存容量为4MB，Cache容量为16KB，每字块有8个字，每字32位，设计一个四路组相联映射（即Cache每组内共有4个字块）的Cache组织。

（1）画出主存地址字段中各段的位数。

（2）设Cache的初态为空，CPU依次从主存第0，1，2，…，89号单元读出90个字（主存一次读出一个字），并重复按此次序读8次，问命中率是多少？

（3）若Cache的速度是主存的6倍，试问有Cache和无Cache相比，速度约提高多少倍？

解：

（1）根据每字块有8个字，每字32位（4字节），得出主存地址字段中字块内地址为3+2=5位。

     根据Cache容量为16KB=214B，字块大小为8*32/8=32=25B，得Cache地址共14位，Cache共有214-5=29块。根据四路组相联映射，Cache共分为29/22=27组。根据主存容量为4MB=222B，得主存地址共22位，主存字块标记为22-7-5=10位，故主存地址格式为：

主存字块标记（10位）

组地址（7位）

字块内地址（5位）

（2）由于每个字块中有8个字，而且初态为空，因此CPU读第0号单元时，未命中，必须访问主存，同时将该字所在的主存块调入Cache第0组中的任一块内，接着CPU读第1~7号单元时均命中。同理，CPU读第8，16，…，88号时均未命中。可见，CPU在连续读90个字中共有12次未命中，而后8次循环读90个字全部命中，命中率为：（908 - 12）/（908） = 0.984

（3）设Cache的周期为t，则主存周期为6t，没有Cache的访问时间为6t908，有Cache的访问时间为t（908-12）+6t12，则有Cache和无Cache相比，速度提高的倍数为：（6t908）/ { (90 * 8 - 12)t + 6t * 12 } - 1 = 5.54

4.33 简要说明提高访存速度可采取的措施。

解答：提高访存速度可采取三种措施：

（1）采用高速器件。即采用存储周期短的芯片，可提高访存速度。

（2）采用Cache。CPU最近要使用的信息先调入Cache，而Cache的速度比主存快得多，这样CPU每次只需从Cache中读写信息，从而缩短访存时间，提高访存速度。

（3）调整主存结构。如采用单体多字或采用多体结构存储器。

4.34 反映主存和外存的速度指标有何不同？

由于主存采用RAM，所以其主要速度指标存期周期对所有存储单元来说是个常数，寻址时间很短且不受单元物理位置影响。另外，主存的存期周期、存取时间、带宽等几个常用速度指标之间是相关的。

外存主要采用DAM 或 SAM，其寻址时间较长，且信息所存物理位置绝对有关，因此外存的速度通常受寻址时间和数据传输时间两个因素决定，需要用平均寻址时间和数据传输率两个指标来共同描述。

而平均寻址时间和数据传输率分别描述了外存的两个性质完全不同、时间段完全不同的操作，这两个指标之间没有多少相关性。

4.38. 磁盘组有6片磁盘，最外两侧盘面可以记录，存储区域内径22cm，外径33cm，道密度为40道/cm，内层密度为400位/cm，转速3600转/分，问：

（1）共有多少存储面可用？
（2）共有多少柱面？
（3）盘组总存储容量是多少？
（4）数据传输率是多少？

4.39. 某磁盘存储器转速为3000转/分，共有4个记录盘面，每毫米5道，每道记录信息12 288字节，最小磁道直径为230mm，共有275道，求：

（1）磁盘存储器的存储容量。
（2）最高位密度（最小磁道的位密度）和最低位密度。
（3）磁盘数据传输率。
（4）平均等待时间。