转自 http://www.cnblogs.com/YiranXie/p/3439934.html

手把手教你编写游戏模拟器 - Chip8篇(1)

手把手教你编写游戏模拟器 - Chip8篇

翻译整理分析：by Yiran Xie

*如要转载请附上本文链接

最近在学习游戏模拟器的编写，发现国内现成的教程少之又少，代码倒是能找到不少，不过缺乏系统的讲解看起来颇为费时费力（谁让咱是菜鸟一个呢)。于是打算一边学习，一边把搜集的资料和开发的心得整理后，陆续发布一系列关于模拟器编写的教程，本文主要讲解Chip8模拟器的编写，第二步是会发布关于编写NES（也叫FC/红白机/小霸王）模拟器编写的教程。

本文作为开篇，可能算是最容易的模拟器了，英文原文来自这里。我在翻译的同时添加了个人的理解作为补充，最后会分析下源代码。

引子

Chip 8可能是所有模拟器中最容易上手的了，其中最主要的原因就是它架构比较简单。不过麻雀虽小五脏俱全，通过这样一个例子可以很好地了解模拟器的架构，为之后更复杂的模拟器编写做个铺垫。

什么是模拟器

模拟器是对于某个系统A的架构与功能的模拟，使得为系统A编写的软件可以运行在架构完全不一样的系统B上。比如原本NES游戏机（小霸王）上的游戏，现在可以通过模拟运行在PC、手持设备上等等。

什么是CHIP-8?

Chip8其实并不是个真正的系统，它更像是一个虚拟机(virtual machine)，用Chip8语言编写的游戏可以很容易地在任何装有Chip8解释器的系统中运行。它是70年代由Joseph Weisbecker所开发。

为什么选择CHIP-8?

Chip8模拟器可能是你能发现的最容易编写的模拟器了。它仅有35个opcode(cpu指令),其中大多数都是基本的功能，在更先进的CPU架构中依然能找到。因此这样一个项目是非常具有学习价值的，可以帮你获悉CPU是如何运作的以及机器代码是如何被执行的。同时，因为它opcode数量小，所以更易管理，整个学习的曲线也更短。

在开始之前…

· 选择一门你拿手的编程语言 (常见的有C/C++ 或 Java).
以下代码主要用的是 C/C++

· 这个项目不易作为学习编程的项目

· 你可能会用到第三方的库来实现音频、视频的输出以及用户的输入，比如 GLUT / SDL / DirectX

· OK GO!

了解CPU

当开始编写模拟器之前，你需要尽可能多地查找你要模拟平台上的CPU的信息。比如，它使用的内存以及寄存器的数量、大小，它用的是什么架构，要是能找到技术文档就更好了。

对于我们这里要做的Chip 8, 我建议可以参考Wiki上的Chip 8 description。

这里先来总体介绍下Chip8的系统。

· Chip 8 有35个opcodes（cpu指令），其中每个都是双字节长(2 bytes)。因此为了储存它，我们需要一种数据类型能让我们存储双字节，这里选用unsigned short：

unsigned short opcode;

· Chip 8共有4K内存，我们可以这么表示：

unsigned char memory[4096];

· CPU 寄存器：Chip 8 有16个单字节(1 byte)寄存器，名字为V0,V1...到VF. 前15个寄存器为通用寄存器，最后一个寄存器(VF)是个进位标志(carry flag).这16个寄存器表示为：

unsigned char V[16];

· 索引寄存器I（Index register，暂译为“索引寄存器”）与程序计数器PC（program counter），值域为0x000 到 0xFFF：

unsigned short I;
unsigned short pc;

· 内存映像图(memory map) - 对应着上面的memory[4096]:

0x000-0x1FF - Chip 8解释器(包含用于显示的字体)
0x050-0x0A0 - 用于生成 4x5 像素的字体集合 (从’0’到’F’)
0x200-0xFFF - 游戏ROM 与工作RAM

· 图像系统：Chip 8包含一条指令用于把Sprite画到屏幕上. 这个绘画的过程用的是XOR(异或)的操作，如果一个像素经过绘画操作后被设为0(不显示)，则VF寄存器被相应地更新。

· Chip 8的显示是二值化的，总共有2048个像素 (64 x 32)，每个像素有两种状态1或0（常见0表示黑，1表示白）：

unsigned char gfx[64 * 32];

· Chip 8没有中断以及硬件寄存器（hardware register，暂译为“硬件寄存器”），不过有两个timer（计时器），当它们被设定为一个正值时候，他们应当以opcode的执行频率倒计时直至0为止。（即每执行一条opcode后，如果当前两个timer为正，应当对其进行--操作。opcode的理想情况是被运行在60hz，这是需要实现者去想办法保证的）

unsigned char delay_timer;
unsigned char sound_timer;

· 在原系统中，当sound_timer寄存器倒计时到0时，系统会发出蜂鸣声。（这里作者写的模拟器是没有声音系统的。不过只是缺少蜂鸣声也无所谓吧）

有一点很重要，Chip 8的指令集包含了跳转（相当于jmp/goto，不用返回）或者调用子函数（相当于call，需要返回）。虽然CPU参数中并未提及栈(stack),但是你需要自己去实现一个。栈在这里被用于在调用子函数之前保存当前的pc(程序计数器)的位置，所以在任何时候你打算调用其他子函数，你需要在执行之前把当前的程序计数器push进栈，也就是所谓的“保存现场”。这个系统用的栈有16层，同时你需要一个栈顶指针SP(stack pointer)去指向当前的栈顶。

unsigned short stack[16];
unsigned short sp;

最后, Chip 8的输入是一个16个按键的键盘(0x0-0xF), 你可以用一个数组来存储当前按键的状态：

unsigned char key[16];

游戏主程序

为了提供一个更直观的感觉，这里把游戏的的主程序做一下概述。这里不会提及如何用GLUT（OpenGL）或者SDL去实现图像或者输入系统，而仅仅是展示整个模拟器的运作过程。

#include           //OpenGL以及输入系统的库文件
#include "chip8.h" //关于cpu核心运作的实现，一会儿会讲到

chip8 myChip8;//这里模拟器的实体mychip8被定义为全局变量int main(int argc, char **argv)
{setupGraphics();//初始化图像(窗口大小, 显示模式等等)setupInput();//初始化输入系统//初始化Chip8 系统以及把游戏rom加载到内存myChip8.initialize();//清理内存、寄存器、屏幕myChip8.loadGame("pong");//加载rom，“pong”是个乒乓球游戏//模拟的主循环for(;;){myChip8.emulateCycle();// 模拟一个指令周期/*由于系统不是每个周期都需要执行绘画操作，因此设立一个是否需要画图的标志位。当需要修改时把它置为1，不需要时则为0只有两种cpu指令(Opcode)需要设置这个标志位为1：0x00E0 – 清理屏幕0xDXYN – 把图案画到屏幕上*/if(myChip8.drawFlag)drawGraphics();myChip8.setKeys();// 保存按键信息（按下与释放）
  }return 0;
}

模拟器的主循环

下面我们凑近来看看。

void chip8::initialize()
{//初始化内存与寄存器（注意这个操作只需执行一次）
}void chip8::emulateCycle()//这个操作每个模拟周期都会执行一次
{//获取opcode//解码opcode//执行opcode//更新计时器
}

获取opcode
在这一步中, 系统会从PC(程序计数器)所指的值中取出opcode。前面已经提到，每个opcode是双字节的，不过模拟器的内存是设置成单字节的数组（unsigned char memory[4096]），因此我们需要一次读取连续两个字节的内容，然后把它拼接在一起去形成一个完整的opcode。

为了展示它是怎么运作的，我们这里选用opcode 0xA2F0.

// 假设如下情况
memory[pc]     == 0xA2
memory[pc + 1] == 0xF0

为了把两个字节合并在一起，我们用如下操作:

opcode = memory[pc] << 8 | memory[pc + 1];

（如果你对位操作不是很熟悉的话，可以搜一下相关的教程看看）

解码opcode
我们现在已经存储了当前的opcode，接着我们要去解码它，看看它究竟有什么作用。这里依然以0xA2F0为例。

经过查表我们可以得知:

· ANNN: Sets I to the address NNN

即把NNN这个内存地址赋给索引寄存器I（NNN 指opcode的后3位，这儿即是0x2F0。或者可以理解为A为操作指令，NNN对应着操作数)。

执行opcode
现在我们已经明确了我们要对opcode执行什么操作，因此我们可以在模拟器中模拟这个操作。比如还是 0xA2F0这条指令，我们现在把0x2F0赋给索引寄存器I：0xA2F0是16位的，我们要从中取出低12位的0x2F0，这里通过与掩码进行'&'操作实现:

I = opcode & 0x0FFF;
pc += 2;

因为每条指令都是双字节长，所以我们需要把程序计数器的步进长度设为2，即一次前进2个字节。除非这条opcode是跳转，则需要更改PC，前面也讲过了，在调用子函数之前，则还需要把PC压入栈。在一些指令下，下一条opcode可能需要被跳过(有些opcode的作用为“当满足xxx情况时，跳过下条指令”)，显然此时程序计数器一次前进4个字节.

计时器
除了执行opcode以外，Chip 8 还有两个计时器delay timer和sound timer需要去实现。就像前面提及的，在每一个主循环内两个计时器应当分别--，直至0。

速率

原系统是以60hz的速度运行，即每秒执行60条op code，对于我们来说，就是每秒执行60个main loop。而由于现代CPU的高效，如果我们不去显式控制执行周期的话，在全速运行的时候显然会远远超过60hz，这样的结果就是游戏节奏过快，没有可玩性了。因此可以想象到我们需要实现一个自己的计时器，在每个循环内把剩余的时间消耗掉，使得执行速率尽可能地稳定在60hz。

更进一步

现在你应该已经知道了模拟的基本过程以及整个系统是怎么运作的，那么现在就把各部分合并开始编写这个模拟器吧！

初始化系统
在执行第一个模拟周期之前，你需要做一些准备工作：初始化内存以及寄存器。虽然Chip8没有BIOS或系统固件，它却有一个基本的字体集（数字和字母的显示字体集合）存在内存中。字体集的大小为0x50，应当被存入到内存中0x00-0x50的地方。

另一个需要注意的是游戏ROM（相当于代码段）应当被加载到0x200的地方，那么pc最初也应该指向这里。

void chip8::initialize()
{pc     = 0x200;  //程序计数器指向 0x200opcode = 0;      //初始化“当前opcode”   I      = 0;      //初始化索引寄存器sp     = 0;      //初始化栈顶指针//清理显存//清理栈//清理从V0到VF的寄存器//清理内存// 读取字体集for(int i = 0; i < 80; ++i)memory[i] = chip8_fontset[i];     //初始化计时器
}

把程序(游戏ROM)读入内存
在初始化之后，把程序读入内存(用fopen以二进制方式打开)并且把内容依次读取到0x200（512）开始的内存中：

for(int i = 0; i < bufferSize; ++i)memory[i + 512] = buffer[i];

开始模拟
现在我们的系统已经准备好去执行它的第一条指令。就像之前提到的，我们需要按照获取/解码/执行的步骤执行opcode。在这个例子中，我们首先读取opcode的高4位，然后看看这个opcode的作用：

void chip8::emulateCycle()
{//获取opcodeopcode = memory[pc] << 8 | memory[pc + 1];//解码opcode（这里先读取高4位用于判断）switch(opcode & 0xF000){    //...其他opcodes case 0xA000: //ANNN:把NNN赋给索引寄存器I//执行opcodeI = opcode & 0x0FFF;pc += 2;break;//...其他opcodes default:printf ("Unknown opcode: 0x%X\n", opcode);}  //更新timers（opcode与timer频率相同）if(delay_timer > 0)-- delay_timer;if(sound_timer > 0){if(sound_timer == 1)printf("BEEP!\n");//好吧，有点雷-.--- sound_timer;}
}

不过在一些情况下，我们不能仅凭借前4位去判断这条opcode的作用。在这种情况下，我们需要进一步去判断其低4位。

//解码opcode
switch(opcode & 0xF000)//这是判断高4位
{    case 0x0000://当高4位都是0时，需要进一步判断其低4位switch(opcode & 0x000F)//进一步判断低4位
    {case 0x0000: // 0x00E0:清理屏幕        //执行“清理屏幕”break;case 0x000E: // 0x00EE:从子函数返回          //执行“从子函数返回”break;default:printf ("Unknown opcode [0x0000]: 0x%X\n", opcode);          }break;//更多的opcodes //
}

Opcode中一些需要注意的特例

例1: Opcode 0x2NNN （call NNN）
这条opcode调用位于NNN地址的子函数，在跳转之前我们把当前PC中的地址进行保存，以便子函数结束后能够返回。在储存完毕之后，栈顶指针应当指向下一个空位（注意，这个栈是向上生长的，所以是++）。接着，把PC设为新的地址（通过与0x0FFF进行与操作取得“NNN”对应的地址）。

case 0x2000:stack[sp] = pc;++ sp;pc = opcode & 0x0FFF;
break;

例2: Opcode 0x8XY4
这条指令把寄存器VY累加到VX上，比如0x8534，即X=5，Y=3，则意味着运算V5 + V3.如果加法过程中出现了溢出，则要把寄存器VF（前面提到的16个寄存器中的最后一个，进位寄存器）相应置为1，如果没有溢出，则置为0。因为寄存器是单字节的，仅能存储0~255，当VX与VY之和大于255时，它就不能被完整地存于寄存器中（超出255的部分会从0重新开始累加），所以我们用VF这个寄存器来告知系统VX，VY之和实际上>255。别忘了执行的最后要把PC + 2.

case 0x0004:     if(V[(opcode & 0x00F0) >> 4] > (0xFF - V[(opcode & 0x0F00) >> 8]))//即VY > 255 - VXV[0xF] = 1;//出现了溢出，则把VF置为1elseV[0xF] = 0;//没有溢出VF置为0V[(opcode & 0x0F00) >> 8] += V[(opcode & 0x00F0) >> 4];//VX += VYpc += 2;
break;

例3: Opcode 0xFX33
作用：把VX的十进制的表示存于I/I+1/I+2三个地址。其中I存百位，I+1存十位，I+2存个位。

case 0x0033:memory[I]     = V[(opcode & 0x0F00) >> 8] / 100;//取得十进制百位memory[I + 1] = (V[(opcode & 0x0F00) >> 8] / 10) % 10;//取得十进制十位memory[I + 2] = (V[(opcode & 0x0F00) >> 8] % 100) % 10;//取得十进制个位pc += 2;
break;

处理图像与输入

像素的绘制
负责处理图像输出的opcode是0xDXYN。

表示在(VX, VY)坐标处画一个像素宽度固定为8，像素高度为N的sprite(小图案)。这个图案在内存中的起始地址存于索引寄存器I中。每个字节的8位刚好表示8个像素，1个像素对应1位，类似bitmap，第一个字节中保存着图案第一行的8个像素，第二个字节中保存着图案第二行的8个像素，以此类推。

假设当前的opcode为0xD003，则说明想在(V[0], V[0])处画一个宽为8，高为3的图案。一个例子

memory[I]     = 0x3C;
memory[I + 1] = 0xC3;
memory[I + 2] = 0xFF;//这些值只是个例子

以上这3个字节是如何表达一个图案的？看看他们的二进制表示吧，这样更直观：

16进制    2进制       图案
0x3C   00111100     ****
0xC3   11000011   **    **
0xFF   11111111   ********

是不是很有趣呢？

另外，还有个概念叫“碰撞”。在通过异或来设置gfx[]之前，如果某像素p当前处于“点亮”的状态（即显示缓存gfx[p]为1)，同时这次绘画依然希望它为1，则称为发生了“碰撞”，此时把VF置为1，否则置为0.

最后要说的是gfx中的存储结构，gfx比较慷慨，不再用一位而是用一个字节来表示一个像素，其值为0或1。它的横向分辨率为64个像素.因此(x,y)在gfx中的地址应该为gfx[64 * y + x]。

opcode 0xDXYN的实现范例：

//绘画指令
case 0xD000:
{unsigned short x = V[(opcode & 0x0F00) >> 8];unsigned short y = V[(opcode & 0x00F0) >> 4];//取得x,y(横纵坐标)unsigned short height = opcode & 0x000F;//取得N（图案的高度）unsigned short pixel;V[0xF] = 0;//初始化VF为0for(int yline = 0; yline < height; yline++)//对于每一行
  {pixel = memory[I + yline];//取得内存I处的值，pixel中包含了一行的8个像素for(int xline = 0; xline < 8; xline++)//对于一行的8个像素
    {if(pixel & (0x80 >> xline))//依次检查新值中每一位是否为1
      {if(gfx[(x + xline + ((y + yline) * 64))])//如果显示缓存gfx[]里该像素也为1，则发生了碰撞V[0xF] = 1;//设置VF为1                          gfx[x + xline + ((y + yline) * 64)] ^= 1;//gfx中用1个byte来表示1个像素，其值为0或1。这个异或相当于取反
      }}}drawFlag = true;//绘画标志位置为1，通知外层循环我们有东西要画啦pc += 2;
}
break;

输入
Chip 8系统用了16个按键的键盘来接受输入。对于我们的模拟器来说，需要实现一个方法用于记录所有键的状态。在每次的执行周期中，都需要查看按键的状态，并且把它更新到key[].当按键被按下后，我们把key[]中对应位置为1，当按键被释放（抬起）后，把它置为0。opcode 0xEX9E和0xEXA1会去检查某个指定的按键是否被按下或释放，opcode 0xFX0A会等待一个按键被按下，一旦当它接收到，它会把被按下的按键的序号而不是按键的状态存入寄存器。

case 0xE000:switch(opcode & 0x00FF){// EX9E: 如果VX中保存的按键此时被按下，则跳过下条指令case 0x009E:if(key[V[(opcode & 0x0F00) >> 8]])pc += 4;elsepc += 2;break;

下图左边是原始键盘的按键分布。事实上怎么映射按键可以随你个人兴趣，不过建议你设置成下图右边的方式。

 Keypad                  Keyboard
+-+-+-+-+                +-+-+-+-+
|1|2|3|C|                |1|2|3|4|
+-+-+-+-+                +-+-+-+-+
|4|5|6|D|                |Q|W|E|R|
+-+-+-+-+       =>       +-+-+-+-+
|7|8|9|E|                |A|S|D|F|
+-+-+-+-+                +-+-+-+-+
|A|0|B|F|                |Z|X|C|V|
+-+-+-+-+                +-+-+-+-+

CHIP-8字体集

这是Chip 8的字体集。每个字符用一个像素矩阵来表示，4像素宽（即每个字节的高4位），5像素高。

unsigned char chip8_fontset[80] =
{ 0xF0, 0x90, 0x90, 0x90, 0xF0, // 00x20, 0x60, 0x20, 0x20, 0x70, // 10xF0, 0x10, 0xF0, 0x80, 0xF0, // 20xF0, 0x10, 0xF0, 0x10, 0xF0, // 30x90, 0x90, 0xF0, 0x10, 0x10, // 40xF0, 0x80, 0xF0, 0x10, 0xF0, // 50xF0, 0x80, 0xF0, 0x90, 0xF0, // 60xF0, 0x10, 0x20, 0x40, 0x40, // 70xF0, 0x90, 0xF0, 0x90, 0xF0, // 80xF0, 0x90, 0xF0, 0x10, 0xF0, // 90xF0, 0x90, 0xF0, 0x90, 0x90, // A0xE0, 0x90, 0xE0, 0x90, 0xE0, // B0xF0, 0x80, 0x80, 0x80, 0xF0, // C0xE0, 0x90, 0x90, 0x90, 0xE0, // D0xF0, 0x80, 0xF0, 0x80, 0xF0, // E0xF0, 0x80, 0xF0, 0x80, 0x80  // F
};

上面看起来有点杂乱无章，不过来看看其二进制表示：

10进制 16进制   2进制       数字0   10进制 16进制     2进制      数字7
240   0xF0   1111 0000    ****     240   0xF0   1111 0000    ****
144   0x90   1001 0000    *  *      16   0x10   0001 0000       *
144   0x90   1001 0000    *  *      32   0x20   0010 0000      *
144   0x90   1001 0000    *  *      64   0x40   0100 0000     *
240   0xF0   1111 0000    ****      64   0x40   0100 0000     *

结语

希望这个教程能为你自己DIY模拟器提供足够多的信息。至少你应该有了一个模拟器如何运作以及CPU如何执行指令的基本的概念。

作者在最后提供了三个版本的源代码，一个新版本，一个旧版本，一个Android的版本。这里主要讨论下其新版的代码，其余版本可以在作者主页末尾处找到。

手把手教你编写游戏模拟器 - Chip8篇(1)相关推荐

skywalking原理_Skywalking系列博客6手把手教你编写 Skywalking 插件
点击上方 IT牧场 ,选择置顶或者星标技术干货每日送达! 前置知识在正式进入编写环节之前,建议先花一点时间了解下javaagent(这是JDK 5引入的一个玩意儿,最好了解下其工作原理):另外,S ...
【强化学习】手把手教你实现游戏通关AI(2)——Q-Learning
系列文章目录在本系列文章中笔者将手把手带领大家实现基于强化学习的通关类小游戏,笔者将考虑多种方案,让角色顺利通关.本文将讲述如何使用Q-Learning算法实现AI通关. 完整代码已上传至githu ...
手把手教你编写一个上位机
关注+星标公众号,不错过精彩内容转自 | 嵌入式大杂烩嵌入式开发,基本都会用到有一些上位机工具,比如串口助手就是最常用的工具之一. 那么,今天分享有一篇由ZhengN整理的用Qt写的简单上位机教程 ...
一文搞定！手把手教你文字识别（识别篇：LSTM+CTC, CRNN, chineseocr方法）
个人博客导航页(点击右侧链接即可打开个人博客):大牛带你入门技术栈文字识别是AI的一个重要应用场景,文字识别过程一般由图像输入.预处理.文本检测.文本识别.结果输出等环节组成. 其中,文本检测. ...
【强化学习】手把手教你实现游戏通关AI(1)——游戏界面实现
系列文章目录在本系列文章中笔者将手把手带领大家实现基于强化学习的通关类小游戏,笔者将考虑多种方案,让角色顺利通关. 完整代码已上传至github:https://github.com/TommyGo ...
写字机上位机c语言,易懂 | 手把手教你编写你的第一个上位机
一.前言大家好,我是ZhengN,本次来教大家编写一个基于QT的简单的上位机. 学习一个新的东西我们都从最基础地实例开始,比如学习C语言我们会从编写一个hello程序开始.学习嵌入式我们从点灯开始. ...
手把手教你架构3D引擎高级篇概述
前几年写过一本书<手把手教你架构3D游戏引擎>电子工业出版社,主要内容讲的是固定流水线编程,目的是让读者理解第一代引擎是如何实现的,从本篇博客开始,给读者介绍关于使用可编程流水线自己搭建3 ...
人人都能当“苍天哥” 手把手教你制作游戏视频
作者:小M来源:家用电脑玩魔兽世界的朋友大多都知道苍天哥这个人物,苍天哥制作了一系列魔兽世界高端职业玩家的游戏视频,其幽默.搞笑的解说风格,广受玩家追捧,一时间成为网络热门人物,目前已经当上了好几个 ...
手把手教你写游戏修改器（终极版）
关于怎样写植物大战僵尸游戏修改器的详细过程,在手把手教你写游戏修改器里面已经详细介绍了,这里就不再说了.前面那个修改器是基于控制台程序下面的,紧紧对于植物大战僵尸有用,采用上面那个教程已经将游戏修改器 ...

手把手教你编写游戏模拟器 - Chip8篇(1)

转自 http://www.cnblogs.com/YiranXie/p/3439934.html

手把手教你编写游戏模拟器 - Chip8篇(1)

手把手教你编写游戏模拟器 - Chip8篇(1)相关推荐

最新文章

热门文章