编译原理

教材用的是《编译原理》（第三版）陈火旺著，电子版戳这里密码：x4ut
课后习题答案戳这里密码：nkv9
教学PPT戳这里密码：0tfz
PPT习题答案戳这里密码：v9ct
（侵删）

课程设计1——词法分析器

设计题目：手工设计c语言的词法分析器（可以是c语言的子集）
设计内容：处理c语言源程序，过滤掉无用符号，判断源程序中单词的合法性，并分解出正确的单词，以二元组形式存放在文件中。
设计目的：了解高级语言单词的分类，了解状态图以及如何表示并识别单词规则，掌握状态图到识别程序的编程。

定义

词法分析器的功能输入源程序，按照构词规则分解成一系列单词符号。单词是语言中具有独立意义的最小单位，包括关键字、标识符、运算符、界符和常量等。
(1) 关键字是由程序语言定义的具有固定意义的标识符。例如，C语言
中的void，if，while都是保留字。这些字通常不用作一般标识符。
(2) 标识符用来表示各种名字，如变量名，数组名，过程名等等。
(3) 常数常数的类型一般有整型、实型、布尔型、文字型等。
(4) 运算符如+、-、*、/等等。
(5) 界符如逗号、分号、括号、等等。

输出设计

词法分析器所输出单词符号常常表示成如下的二元式：
(单词种别，单词符号的属性值)
单词种别通常有：
标识符一般统归为一种；
常数则宜按类型（整、实、布尔等）分种；
关键字可将其全体视为一种；
运算符可采用一符一种的方法；
界符一般用一符一种的方法。
对于每个单词符号，除了给出了种别编码之外，还应给出有关单词符号的属性信息：
单词符号的属性是指单词符号的特性或特征。

分解出正确的单词

过滤掉无用符号

当读入源程序文本，由于空格、换行符视为终态的标志，或者没有对应的状态，所以可以很自然的被过滤掉。

词法分析状态图设计

本算法是c语言的子集词法分析，状态图设计如下：

单词种别码及其表内位置

本词法分析器的单词种别有：关键字，标识符，数值（整形、实型），界符，运算符，字符，字符串。
某些种别的单词有初始化的表：

关键字	位置
int	0
main	1
void	2
if	3
else	4
char	5
float	6
double	7
for	8
while	9
break	10
switch	11
case	12
default	13
return	14

界符	位置
{	0
}	1
（	2
）	3
[	4
]	5
,	6
;	7

运算符	位置
+	0
-	1
*	2
/	3
<	4
>	5
=	6
<=	7
>=	8
++	9
–	10
+=	11
-=	12
*=	13
==	14
%	15

算法设计

全局变量

int state;//全局变量
bool flag = 0;//编译逻辑检验
string input_str;//输入的字符串
string str;//已确定状态的字符串

数据结构

struct TOKEN
{int i;  //对应分词的种类
int j; //对应分词在相应表中的位置
int Vt_id; //记录分词在文法中的终结符信息
TOKEN(int a = 0, int b = 0,int c = 0){i = a, j = b, Vt_id = c;}
};
vector<string>TOKEN_k;
//关键字表
vector<string>TOKEN_p;
//界符表
vector<string>TOKEN_o;
//运算符表
vector<string>TOKEN_i;
//标识符表
vector<string>TOKEN_c;
//常数常量表
vector<string>TOKEN_strc;
//字符串常量表
vector<string>TOKEN_charc;
//字符常量表
vector<pair<string,int> >ans;
//将结果以数据对的形式保存

算法伪代码

       初始化变量；While 从文件中按行读入数据：If 读入字符串 != “#”：i=0：While i< input_str.size()：next_state(input_str[i])；If is_KI()：查询TOKEN_k表；If 在TOKEN_k表中：生成关键字Token字Else：查询TOKEN_i表；If 在TOKEN_i表中：生成标识符Token字Else：将当前分词加入TOKEN_i表中，生成Token字If is_P()：查询TOKEN_p表；If 在TOKEN_p表中：生成界符Token字Else：编译程序出错，breakIf is_C()：查询TOKEN_c表；If 在TOKEN_c表中：生成常数常量Token字Else：将当前分词加入TOKEN_c表中，生成Token字If is_STRC()：查询TOKEN_strc表；If 在TOKEN_strc表中：生成字符串常量Token字Else：将当前分词加入TOKEN_strc表中，生成Token字If is_CHARC()：查询TOKEN_charc表；If 在TOKEN_charc表中：生成字符常量Token字Else：将当前分词加入TOKEN_charc表中，生成Token字i++；If 编译出错：报错，breakWhile end；While end；

算法流程图

参考资料

课程设计一的报告借鉴了在github上找到的某位同学的课程设计报告，具体戳这里密码：oxx4

课程设计2——赋值语句的解释程序

实验目的：了解掌握算符优先分析的基本方法、内容；学会科学思考并解决问题，提高程序设计能力。
实验内容与要求：用算符优先分析方法设计一个分析解释程序，对输入的赋值语句、输出语句、清除语句进行词法分析、语法分析、表达式求值并存储于指定变量中；
若存在错误，提示错误相关信息。
文法表示：
S→v=E|E?|clear
E→E+T|E-T|T
T→T*F|T/F|F
F→ (E)|v|c
语法分析：
单词种别码设计：

单词	种别码
=	1
？	2
+	3
-	4
*	5
/	6
（	7
）	8
v	9
c	10
clear	11
#	12
N	13

算符优先分析法

算符优先分析法是一种简单实用的自下而上分析方法，定义如下：
定义1:若一个文法 G 的任何产生式右部,都不含两个相继出现的非终结符, 则称G为算符文法。
定义2：设G是一个算符文法，任何相继出现的中介符对之间存在如下三种归约优先顺序：

优先关系可以用矩阵表示，称为优先关系表。
定义3: 若文法 G 的任何相继终结符对至多只满足以上关系之一,称该文法为算符优先文法。

FIRSTVT及LASTVT

定义：

对实验给出的文法G进行分析：

FIRSTVT
FIRSTVT(S)={v,?,+,-,*,/,(,c,i}
FIRSTVT(E)={+,-,*,/,(,v,c}
FIRSTVT(T)={*,/,(,v,c}
FIRSTVT(F)={(,v,c}

LASTVT
LASTVT(S)={=,+,*,),v,c,/,-,?i}
LASTVT(E)={+,*,),v,c,/,-}
LASTVT(T)={*,),v,c,/}
LASTVT(F)={),v,c}

对每个非终结符求出这两个集合后,可按如下规则求出各终结符对之间的优先关系:

优先关系表的构建

构造的算符优先关系如下：

算符优先分析的实现

（1）根据实验一，现在的情况是已经分析出了句子的单词，并且变成了单词块，存放在smbol栈中，单词的形式是（种别码，常数值）。
（2）并且分析出了标识符存放在了IDentifierTable idTbl[30]中。标识符的形式是（标识符名字，标识符的值），用-1表示暂未被赋值。
（3）分析出了算符优先分析的优先关系表存放在char
PriorityTable[20][20]中。
（4）归约栈：进行移入、归约操作。

程序设计

首先将符号表的第一个元素#,对应的（种别码，-1）压栈，即

SymbolTbl  temp_sym;temp_sym.syn=12;temp_sym.value=-1;//-1代表这个地方不需要Reource_Symbol.push(temp_sym);//将#压栈

对于堆栈定义两个指针，一个指针pStackTop始终指向栈顶，在栈被修改（push,pop）之后都要修改。另一个堆栈指针是pScanStack，负责对整个堆栈的扫描，不断地查找可归约串的结束位置。
对于符号表，定义Sym_scan_pointer指针，从一开始，对符号表进行扫描。
因为现在不仅是语法分析，还包含了语义分析，我们要定义好语义子程序，比如说“清除语句”，#clear#，我们遇到这个东西时，就要清楚工作台。
因此，我们在进行其他分析之前，先把解决这个问题。
if(sym_length>=3&&(symbol[1].syn==11))
{//清除语句，清除屏幕并且清空标号表中的值
Clear_Symbol_Tbl();
}
下面比较栈中元素和符号表中元素的大小关系：
首先栈扫描指针和栈顶指针同时指向栈顶开始分析：

{
查看栈扫描指针pScanStack所指的元素和符号表指针所指元素的关系。
若为小于：
则将符号表指针所指元素压栈，修改栈的两个指针都指向栈顶。符号表指针下移。
若为等于：
此时要分两种情况：
@1.若是栈扫描指针pScanStack所指的元素和符号表指针所指元素都是#，则查看栈中是否只有两个元素且栈顶元素是否为N，若为真，则说明归约成功，输出栈顶的值，然后结束分析。否则，则报错。
@2.若不是上面的情况，则按照小于关系处理。
若为大于：
进行归约;
}

归约算法设计

1、若该元素为标识符：语义分析：判断标识符是否已定义；弹出栈顶元素，将N（13，标识符的值）压入栈中，这里取了一次巧，即是让N来承载归约的结果，更加方便。重新修改栈顶指针，栈扫描指针，将栈扫描指针指向从栈顶数第一个终结符的位置，即下移。
pScanStack=Reource_Symbol.getTopPointer()-1;
重新定位行列指针（列不变），修改关系。 row_prior=Search_Priority_Setxy(SearchSyn(Reource_Symbol.traverseStack(pScanStack).syn));
Prior_Relation=PriorityTable[row_prior][column_prior];
2、若该元素为常量，则分析的过程和标识符极其相似，唯一不同的是，N(13,值）中的‘值’，一个是从标识符表中查到的，另一个是直接就有的。
3、若该元素为‘=’，这时根据文法的要求，出现等号就应该满足“v=N”这种情况。首先判断是否满足，若不满足则报错，若满足，则将这三个元素归约为一个元素N（13，旧N.value),并且要反填符号表，将该变量的值赋为旧N.value。这一步语义分析十分重要，直接关系着以后引用这个变量时是否能够找到它的值。
idTbl[Reource_Symbol.traverseStack(pScanStack- 1).second].second = Reource_Symbol.gettop().second;//此时栈顶必为E
然后就是修改栈的两个指针，重新定位行列（列不变），修改关系。
4、若该元素为+、-、、/，则这四个的处理方式一样。首先判断栈顶是否满足N op N,op={+|-||/},若满足则归约，否则认为是错误的，进行报错处理。规约之后，同样的将N op N归约为N，并且将
N.value=(N1.value op N1.value)”
然后就是修改栈的两个指针，重新定位行列（列不变），修改关系。
5、若该元素为‘）’，这个时候栈顶一定为（N），若不是，则句子出错，进行错误处理，又因为 ‘(’是大于任何终结符的，因此需要归约将（N）归约为N，做相应的语义分析子程序:
N.value=（N1.value）
然后就是修改栈的两个指针，重新定位行列（列不变），修改关系。
6、若该元素为‘？’根据文法，出现这个东西，就是要打印N?中N的值了，因此先查看栈顶是否满足N？若满足，则归约，并作相应的语义动作，打印。
然后就是修改栈的两个指针，重新定位行列（列不变），修改关系。

参考资料

这篇课程设计参考了这位博主的这篇博文戳这里，谢谢ta

课程设计报告及源代码

戳这里密码：8kzk

复习资料

期末考试复习资料，戳这里密码：okbi
（侵删）

【编译原理】学习笔记以及课程设计相关推荐

[编译原理学习笔记2-2] 程序语言的语法描述
[编译原理学习笔记2-2] 程序语言的语法描述文章目录 [编译原理学习笔记2-2] 程序语言的语法描述 [2.3.1] 上下文无关文法 [2.3.2] 语法分析树与二义性 [2.3.3] 形式语言鸟 ...
编译原理学习笔记20——符号表
编译原理学习笔记20--符号表 20.1 符号表的组织与操作 20.2 符号表的内容 20.3 利用符号表分析名字的作用域 20.1 符号表的组织与操作符号表符号表的作用与组织符号表的整理和查找 ...
编译原理学习笔记2——高级程序设计语言概述
编译原理学习笔记2--高级程序设计语言概述 2.1常用的高级程序设计语言 2.2程序设计语言的定义 2.2.1语法 2.2.1语法 2.2.3程序语言的基本功能和层次机构 2.2.4程序语言成分的逻辑 ...
编译原理学习笔记 5.1 翻译文法和语法制导翻译
前言参考课上PPT内容. 该学习笔记目前仅打算个人使用. 后续会进一步整理,包括添加笔记内容,标明参考资料. 更新中... 跳过目录目录导言一.翻译文法和语法制导翻译输入文法翻译文法活动 ...
编译原理学习笔记一(待续)
这几天忙着学英语,同时在学习编译原理,对这门课很感兴趣,已经制作了词法分析器,同时还在补充这个分析器的功能,也准备着手开始写语法分析器,看到最后能不能连在一起,我想如果能够将整套编译器的流程跑下来真的 ...
编译原理学习笔记 3.3 正则文法的状态图
前言参考东南大学廖力老师的编译原理教程和课上PPT内容. 该学习笔记目前仅打算个人使用. 后续会进一步整理,包括添加笔记内容,标明参考资料. 更新中... 跳过目录目录状态图的画法(根据文法画出 ...
编译原理学习笔记 6.2 符号表的组织与内容
前言参考课上PPT内容. 该学习笔记目前仅打算个人使用. 后续会进一步整理,包括添加笔记内容,标明参考资料. 更新中... 跳过目录目录一.符号表的结构与内容 "名字"域 & ...
程序设计语言编译原理_编译原理学习笔记（二）：高级程序设计语言
高级程序设计语言一.语言概述 1.1 语法 v.s. 语义程序本质上是一定字符集上的字符串语法:一组规则,用它可以形成和产生一个合式(well-formed)的程序定义了程序的形式结构定义语 ...
编译原理学习笔记（一）
题目已知一个不确定的有限自动机(NFA) (1)描述该NFA所识别语言的特点,列举两个可识别的串; (2)写出与该NFA等价的正规式; (3)将其确定化(即转换为与NFA等价的DFA); (4)使用 ...

【编译原理】学习笔记以及课程设计

编译原理

课程设计1——词法分析器

定义

输出设计

分解出正确的单词

过滤掉无用符号

词法分析状态图设计

单词种别码及其表内位置

算法设计

全局变量

数据结构

算法伪代码

算法流程图

参考资料

课程设计2——赋值语句的解释程序

算符优先分析法

FIRSTVT及LASTVT

优先关系表的构建

算符优先分析的实现

程序设计

归约算法设计

参考资料

课程设计报告及源代码

复习资料

【编译原理】学习笔记以及课程设计相关推荐

最新文章

热门文章