1 Overview

This section introduces someting that maybe you need to know before learning.

Note:This CPU is based on MIPS instruction set.

1.1 Tools

  • Logisim
  • CS 3410 Components
  • MARS MIPS simulator
  • Win10 or Mac OS

1.2 Courses

  • 自己动手画CPU《计算机组织与结构实验》
  • 计算机硬件系统设计

1.3 Front Knowledge & Reference Books

  • Computer Organization and Design
  • Degital Logic Applications and Design
  • See MIPS Run

2 Core Thinking

本小节将会介绍设计单周期CPU的核心思想和重要观念。

注:本文讨论的单周期CPU完全理想化,不考虑时间延迟问题。

2.1 基于组合逻辑的单周期CPU

我们先来谈谈 组合逻辑器件存储器件

  • 组合逻辑器件:就像一个两边开口的水管,水进水口(输入端)进入,经过水管“处理”(指组合逻辑器件的功能),从出水口(输出端)流出,没有任何的阻拦
  • 存储器件:就像两边都带阀门的水管,在闸门没有开的时候,既不能进入,也不能出去
    • 读取:将出水口(输出端)的阀门打开
    • 写入:将进水口(输入端)的阀门打开

我们再来看一个做好的单周期CPU

图中框出的部分是存储器件,其余部分全是组合逻辑器件

紫色框的器件是指令存储器,它的读取是不受限制的,给出地址就能立即读出,因此它的功能可以理解为一个组合逻辑。

红色框的器件自左到右分别是PC寄存器、寄存器堆和数据存储器,它们的读取是不受限制的,但是写入受到限制,这些确实发挥了存储器件的功能。

  • PC寄存器的写入是下降沿触发,当时钟变化为1-->0的时候,能够写入新的值
  • 寄存器堆和数据存储器是上升沿触发,写入控制信号为1且时钟变化为1-->0的时候,能够写入新的数据

显然,这个系统是一个由时钟控制、由组合逻辑器件和存储器件共同构成的时序逻辑电路,它的工作情况是(以add指令为例):

  • 当时钟1-->0的时候,PC写入新的值,这个值就是指令的地址,指令由指令寄存器输出
  • 指令被译码,发送给中心控制器,ALU控制器,以及寄存器堆
  • 寄存器堆的数据被读出,送给ALU,ALU根据译码结果运算,得到的结果被送到寄存器堆的门口,等待写入

以上的过程,都是在时钟信号为0的时候,以极快的速度,按顺序地、无阻拦地执行和完成的。 很明显,这具备组合逻辑器件的特征,看起来,这就像是一个复杂的组合逻辑器件而已。

简化来说,这就像是

  • 将指令码输入该器件
  • 该器件直接输出add的结果,该结果会被拦在寄存器堆的“入口”

当然,如果是sw指令的话,数据一样会被运算出来,然后被拦在数据存储器的“入口”。

以上过程,是近乎完全的组合逻辑,这也就意味着,它非常容易设计,甚至,只需要给出输入和输出,就能被自动地生成,现代计算机完全可以做到这点。

接下来,我们再看看被拦在寄存器堆(Register Files)入口的数据吧。

  • 时钟信号变化:0-->1,如果允许写入的信号有效,“门”就会被打开
  • 之后数据就能够被写入进去了

再之后,时钟1-->0又开始重复之前的过程……

回看本小节的标题,我像你能够理解什么是基于组合逻辑的单周期CPU了。

2.2 信号的设计:受外部约束的信号 与 自由设计的内部信号

在CPU的设计中,我们需要指令译码,通过控制器生成控制信号,来控制CPU各部件的工作,因此,我们就需要设计合理的控制信号。

我们来看看CPU的控制部件:

这里的CPU设计了4个控制部件

  • 中心控制器
  • ALU控制器
  • 移位操作控制器
  • jr操作控制器

我们这里只说关注两种,了解后两种。

分治思想

首先,我们要分清楚,必须遵循的MIPS指令集信号自行设计的内部信号

我们的CPU要实现MIPS指令集的一部分,因此,必须遵循它的设计规范,例如

  • 中心控制器的输入端必须是MIPS的Op字段中的信号
  • ALU控制器的func输入端必须是MIPS的func字段的信号
  • 移位控制器的输入必须是MIPS的Shamt字段的信号

而我们内部信号的设计,是可以自己决定的,只要能够正确地完成指令规定的功能就可以,当然要考虑复杂度等问题,这点我们先不关注,例如:

  • 中心控制器的输出信号,控制着各部件的运行状态,必须与指令功能匹配
  • ALU控制器的输出信号,决定了ALU的运算类型,必须与指令功能匹配
  • ……

这里,我们也可以将中心控制器和ALU控制器合并在一起,拆开是为了硬件设计的降低复杂度,你可以看到,我们还拆开出了移位控制器和jr控制器,事实上,都可以任意地合并,甚至ALU本身也可以集成进去,这完全取决于你的设计,这很自由,唯一可能的constraint可能就是你要让器件逻辑清晰并且性能较好

3 Design a CPU: A Top-Down Approach

本节介绍了设计CPU的核心方法,我们采用自顶向下和知识屏蔽的方法,快速完成一个简易CPU的设计。

3.1 CS 3410 Components Guide

  • CS 3410 Components Guide

我们先来简要地介绍一下我们需要使用的CS 3410器件,在此特别感谢加利福尼亚大学提供的宝贵资源!

3.1.1 Register Files

A 32-bit wide by 32-registers deep register file. Register $0 is hard-wired to zero at all times, and writes to $0 are ignored. You can rely on register $0 always containing 0, and do not need to test that its value does not change. Inputs rA and rB are used to select register values to output on the A and B outputs. When the clock is triggered, if WE is high, the data value at input W is stored in register rW. The register file can be configured to use rising clock edges as trigger (the default), falling edge, or to be level sensitive.

3.1.2 MIPS ALU


Computes a result as follows. You do not need to test the provided ALU, and can assume it will work exactly as specified.

为简化起见,我们最开始只使用这两个器件,其余的使用Logisim自动的就好。

3.1.2 MIPS Program ROM


我们不使用提供的指令ROM器件,但是,有一些重要的东西需要强调,非常重要!

An interesting aspect of the ROM is that the offset for branch instructions must be a multiple of 4, which assembles to an output offset divided by 4. This output offset follows the MIPS specification and needs to be left shifted by 2 to be added to PC. For example, given an instruction BEQ $0, $0, 4, the outputted offset in binary is 1.

我们采用的ROM是存储单元是32位的,并不是8位,这也就意味着我们的指令地址是1的倍数而不是4的倍数,我们的PC自动机,先PC << 2,然后+4,之后再PC << 2,而对于branch指令,我们需要先offset << 2然后与PC + 4相加,之后再>> 2,最后赋给PC,这一点在设计的时候要尤为注意,后面的示例中,这个地方的设计是错误的,请读者来修改。

3.2 The soul of CPU design:Abstract and Logic Design

CPU设计最重要的就是逻辑和抽象设计,实现是将抽象转化为现实,并且反过来验证它,毫无疑问的是,无设计,无实现,这可不可能像你最开始学习C语言那样,随便想想就开始写,一个复杂系统的实现,必须:

  1. 先有现实世界的需求
  2. 再有抽象的逻辑设计
  3. 再进行计算机世界的实现
  4. 反复迭代上述3个过程

让我们来看看CPU的设计,需要做哪些工作吧。

现在我们拥有的

  • MIPS Instruction Set
  • ALU Control Signal

我们需要设计的

  • 中心控制器的信号
  • ALU控制器的信号

我们只需要将这几个控制器协调好,帮助我们完成MIPS指令的功能,就能够让CPU执行对应的指令了。

我们可以使用Excel表格来记录,这很方便,并且很清晰,例如:

具体CPU的设计,你可以在开头提及的MOOC的CPU设计的章节进行学习。

3.3 Implement our design: A Minimum System

让我们先来实现一个最小的,最简单的CPU,并且验证它的正确性,之后我们可以根据成功的经验,来实现更多的指令了。

完成了CPU的逻辑设计,我们就可以按照逻辑设计进行实现了,对于组合逻辑我们完全可以使用自动生成电路功能来完成它,没有必要手动完成。

看示例:

这是一个极简功能的CPU,甚至可能,它的设计是有些问题的,但是不妨碍我们真的实现了一个CPU,你可以参考它完成自己的CPU。

注意:我们前面提到的ROM器件中特别强调了地址是4的整数倍的问题,这里的设计有问题,在branch指令中并没有移位就直接加了PC,请读者自行学习改进。

3.4 Verify our design using MARS MIPS simulator

现在,我们设计了一个简单的CPU,现在需要验证正确性了,我们需要使用MARS模拟器,编辑一些简单的MIPS指令。

然后我们将其编译,运行


这样,我们就可以获得寄存器堆数据存储器的值了。

之后我们将指令导出,加载到我们刚刚设计的CPU的存储器中去,执行指令,看看结果与MARS的结果是否一致,如果一致,就设计正确,不一样就依次查找,找到出错的信息,然后纠正它。

在导出之前,我们需要设置一下MARS,将其数据段地址从0开始。


然后,我们就可以导出了


可以分别导出.text.data,以十六进制形式,然后加载到我们的Logsim指令存储器和数据存储器中去。

右键单击,选择加载即可。

4 Surprise

好吧,我想现在还没有惊喜……后续我会将一些可参考的CPU上传,这样大家就可以参考学习了。

【Computer Organization】The Core Design Thinking of single cycle CPU相关推荐

  1. 【Spring开发】—— Spring Core

    原文:[Spring开发]-- Spring Core 前言 最近由于一些工作的需要,还有自己知识的匮乏再次翻开spring.正好整理了一下相关的知识,弥补了之前对spring的一些错误认知.这一次学 ...

  2. 【Computer Vision】基于卷积神经网络实现美食分类

    [Computer Vision]基于卷积神经网络实现美食分类 活动地址:[CSDN21天学习挑战赛](https://marketing.csdn.net/p/bdabfb52c5d56532133 ...

  3. 【Computer Vision】基于VGG-16实现中草药分类

    [Computer Vision]基于VGG-16实现中草药分类 活动地址:[CSDN21天学习挑战赛](https://marketing.csdn.net/p/bdabfb52c5d5653213 ...

  4. 【Computer Organization笔记01】计算机组成原理课程要求、计算机的层次结构、计算机的发展历史

    资源Bilibili AV58129929 计算机组成原理 清华大学 刘卫东 本次笔记内容: P1 计算机组成原理(01) P2 计算机组成原理(02) 文章目录 课程信息 预热内容-课程介绍 学习目 ...

  5. 计算机网络【Computer Networks】学习记录01

    教材使用:计算机网络 英文版·第五版 课程目标 1.运用计算机网络中的计算机和通信相关基础理论知识,结合计算机网络体系结构的分层思想,通过掌握的网络参考模型及其设计原理分析实际网络,对比不同网络系统的 ...

  6. 【论文笔记】:PyramidBox :A Context-assisted Single Shot Face Detector

    &Title ECCV2018 . baidu PyramidBox :A Context-assisted Single Shot Face Detector [论文翻译]:PyramidB ...

  7. 【Computer Organization笔记11】多周期CPU

    本次笔记内容: P21 计算机组成原理(21) P22 计算机组成原理(22) 本节课对应幻灯片: 组成原理25 multicycle.pptx 文章目录 本讲提要 单周期CPU特点 单周期CPU的性 ...

  8. 【Computer Organization笔记06】浮点数的数据表示,浮点数加减运算

    本次笔记内容: P11 计算机组成原理(11) P12 计算机组成原理(12) 本节课对应幻灯片:组成原理13 data,第72页起.此外,本节课内容"浮点数"已经在"汇 ...

  9. 【Computer Organization笔记29】大作业展示

    本次笔记内容: P57 计算机组成原理(57) P58 计算机组成原理(58) 我的计组笔记汇总:计算机组原理成笔记 视频地址:计算机组成原理 清华大学刘卫东 全58讲 国家精品课程 1080P 更完 ...

最新文章

  1. AI在智能建筑中的应用和发展
  2. centertrack
  3. 从零点五开始用Unity做半个2D战棋小游戏(六)
  4. php %3f,PHP
  5. vs无法写入量的大数据_一个每天服务数万人的企业食堂:自助餐按重计价,大数据支持食材预备量...
  6. Taro+react开发(74):taro架构使用
  7. 连微信红包都在催我们长大:90后首次成为红包主力军
  8. [Ext JS 4] 实战之Load Mask(加载遮罩)的显示与隐藏
  9. Markdown数学符号
  10. 使用phpStudyy运行tipask
  11. python应用-pycharm新建模板默认添加shebang编码作者时间等信息
  12. @scheduled注解配置时间_「玩转SpringBoot」用好条件相关注解,开启自动配置之门...
  13. Mustache.js语法
  14. java基础 包装类
  15. 员工因上厕所时间超长被开除了,法院:超出正常生理需求范围!
  16. js加html连线实现流程,(jsPlumb开发入门教程实现html5拖拽连线.doc
  17. ffmpeg bt709 to bt601
  18. centos查询php目录大小,Linux CentOS下找到大于10M 小于100M的文件列出来的命令
  19. 【软件工程】第一、二章总结
  20. 类似QQ农场的html模板,这个机器人种菜像玩QQ农场一样简单 你只需收割

热门文章

  1. NoSQL入门第一天——NoSQL入门与基本概述
  2. ZooKeeper启动过程2:FastLeaderElection
  3. Keilc的中断号计算方法
  4. Jquery 寻找父、子、兄弟节点
  5. 猫眼html源码,50 行代码教你爬取猫眼电影 TOP100 榜所有信息
  6. python concat_python中merge、concat用法
  7. android怎么垂直居中且靠右,placeholder 靠右垂直居中/位置兼容
  8. win7 mysql php apache myadmin_windows下Apache+mysql+php+phpMyAdmin的安装及配置 | 学步园
  9. python 微信支付接口 详解_Python支付接口汇总大全(包含微信、支付宝等,长期更新、欢迎补充)...
  10. linux中可以安装不同版本的gcc么,在linux下安装多个版本的GCC