目录

词法分析器

语法分析器

语义分析器

代码生成器


java源代码(符合语言规范)-->javac-->.class(二进制文件)-->jvm-->机器语言(不同平台不同种类)

如何让java的语法规则适应java虚拟机的语法规则?这个任务由javac编译器来完成java语言规范转换成java虚拟机语言规范。

编译流程:

流程:

  • 词法分析器:将源码转换为Token流

    • 将源代码划分成一个个Token(找出java语言中的if,else,for等关键字)
  • 语法分析器:将Token流转化为语法树
    • 将上述的一个个Token组成一句句话(或者说成一句句代码块),检查这一句句话是不是符合Java语言规范(如if后面跟的是不是布尔判断表达式)
  • 语义分析器:将语法树转化为注解语法树
    • 将复杂的语法转化成简单的语法(eg.注解、foreach转化为for循环、去掉永不会用到的代码块)并做一些检查,添加一些代码(默认构造器)
  • 代码生成器:将注解语法树转化为字节码(即将一个数据结构转化成另一个数据结构)

ps:要获取javac编译器,可以通过OpenJDK来下载源码,可以自己编译javac的源码,也可以通过调用jdk的com.sun.tools.javac.main.Main类来手动编译指定的类。Javac编译动作的入口是com.sun.tools.javac.main.JavaCompiler类,代码逻辑集中在这个类的compile()和compile2()方法中,整个编译最关键的处理就由图中标注的8个方法来完成,

词法分析器

目的:将源码转换为Token流

流程:

一个字符一个字符的读取源代码,形成规范化的Token流。规范化的Token包含:

  • java关键词:package、import、public、class、int等
  • 自定义单词:包名、类名、变量名、方法名
  • 符号:=、;、+、-、*、/、%、{、}等

源码关键:

词法分析过程是在的JavacParser.parseCompilationUnit()中完成的

com.sun.tools.javac.parser.JavacParser  规定哪些词符合Java语言规范,具体读取和归类不同词法的操作由scanner完成
com.sun.tools.javac.parser.Scanner  负责逐个读取源代码的单个字符,然后解析符合Java语言规范的Token序列,调用一次nextToken()都构造一个Token
com.sun.tools.javac.parser.Tokens$TokenKind  里面包含了所有token的类型,譬如BOOLEAN,BREAK,BYTE,CASE。
com.sun.tools.javac.util.Names  用来存储和表示解析后的词法,每个字符集合都会是一个Name对象,所有的对象都存储在Name.Table这个内部类中。
com.sun.tools.javac.parser.KeyWords  负责将字符集合对应到token集合中,如,package zxy.demo.com; Token.PACKAGE = package, Token.IDENTIFIER = zxy.demo.com,(这部分又分为读取第一个token,为zxy,判断下一个token是否为“.”,是的话接着读取下一个Token.IDENTIFIER类型的token,反复直至下一个token不是”.”,也就是说下一个不是Token.IDENIFIER类型的token,Token.SEMI = ;即这个TIDENTIFIER类型的token的Name读完),KeyWords类负责此任务。

例子:

package compile;
public class Cifa {int a;int c = a + 1;
}

以上代码转化为的Token流:

语法分析器

目的:将进行词法分析后形成的Token流中的一个个Token组成一句句话,检查这一句句话是不是符合Java语言规范。

流程:

  • package
  • import
  • 类(包含class、interface、enum),一下提到的类泛指这三类,并不单单是指class

源码关键:

com.sun.tools.javac.tree.TreeMaker  所有语法节点都是由它生成的,根据Name对象构建一个语法节点
com.sun.tools.javac.tree.JCTree$JCIf   所有的节点都会继承jctree和实现**tree,譬如 JCIf extends JCTree.JCStatement implements IfTree
com.sun.tools.javac.tree.JCTree的三个属性

  • Tree tag:每个语法节点都会以整数的形式表示,下一个节点在上一个节点上加1;
  • pos:也是一个整数,它存储的是这个语法节点在源代码中的起始位置,一个文件的位置是0,而-1表示不存在
  • type:它代表的是这个节点是什么java类型,如int,float,还是string等

例子:

package compile;
public class Yufa {int a;private int c = a + 1;//getterpublic int getC() {return c;}//setterpublic void setC(int c) {this.c = c;}
}

最终语法树

ps:左边还少一个import的语法节点

说明:

  • 每一个包package下的所有类都会放在一个JCCompilationUnit节点下,在该节点下包含:package语法树(作为pid)、各个类的语法树
  • 每一个从JCClassDecl发出的分支都是一个完整的代码块,上述是四个分支,对应我们代码中的两行属性操作语句和两个方法块代码块,这样其实就完成了语法分析器的作用:将一个个Token单词组成了一句句话(或者说成一句句代码块)
  • 在上述的语法树部分,对于属性操作部分是完整的,但是对于两个方法块,省略了一些语法节点,例如:方法修饰符public、方法返回类型、方法参数。

语义分析器

目的:将语法树转化为注解语法树

流程:

  • 添加默认的无参构造器(在没有指定任何有参构造器的情况下),把引用其他类的方法或者变量,抑或是继承实现来的变量和方法等输入到类自身的符号表中
  • 处理注解
  • 标注:检查语义合法性、进行逻辑判断
    • 检查语法树中的变量类型是否匹配(eg.String s = 1 + 2;//这样"="两端的类型就不匹配)
    • 检查变量、方法或者类的访问是否合法(eg.一个类无法访问另一个类的private方法)
    • 变量在使用前是否已经声明、是否初始化
    • 常量折叠(eg.代码中:String s = "hello" + "world",语义分析后String s = "helloworld")
    • 推导泛型方法的参数类型
  • 数据流分析
    • 变量的确定性赋值(eg.有返回值的方法必须确定有返回值)
    • final变量只能赋一次值,在编译的时候再赋值的话会报错
    • 所有的检查型异常是否抛出或捕获
    • 所有的语句都要被执行到(return后边的语句就不会被执行到,除了finally块儿)
  • 进一步语义分析
    • 去掉永假代码(eg.if(false))
    • 变量自动转换(eg.int和Integer)自动装箱拆箱
    • 去掉语法糖(eg.foreach转化为for循环,assert转化为if,内部类解析成一个与外部类相关联的外部类)
  • 最后,将经过上述处理的语法树转化为最后的注解语法树

源码关键:

com.sun.tools.javac.comp.Enter  将java类中的符号输入到符号表中,主要是两个步骤:

  • 将所有类中出现的符号输入到类自身的符号表中,所有类符号、类的参数类型符号(泛型参数类型)、超类符号和继承的接口类型符号等都存储到一个未处理的列表中。
  • 将这个未处理的列表中所有的类都解析到各自的类符号列表中,这个操作是在MemberEnter.complete()中完成(默认构造器也是在这里完成的)。

com.sun.tools.javac.processing.JavacProcessingEnvironment  处理注解

com.sun.tools.javac.comp.Attr  检查语义的合理性并进行逻辑判断,类型是否匹配,是否初始化,泛型是否可推导,字符串常量合并

com.sun.tools.javac.comp.Check  协助attr,变量类型是否正确

com.sun.tools.javac.comp.Resolve  协助attr,变量方法类的访问是否合法,是否是静态变量

com.sun.tools.javac.comp.ConstFold  协助attr,常量折叠

com.sun.tools.javac.comp.Infer  协助attr,推导泛型

com.sun.tools.javac.comp.Flow  数据流分析和替换等价源代码的分析(即上面的进一步语义分析)

代码生成器

目的:将注解语法树转化成字节码,并将字节码写入*.class文件。

流程:

  • 将java的代码块转化为符合JVM语法的命令形式,这就是字节码
  • 按照JVM的文件组织格式将字节码输出到*.class文件中

源码关键:

com.sun.tools.javac.jvm.Gen  遍历语法树生成最终的java字节码
com.sun.tools.javac.jvm.Items  辅助gen,这个类表示任何可寻址的操作项,这些操作项都可以作为一个单位出现在操作栈上
com.sun.tools.javac.jvm.Code  辅助gen,存储生成的字节码,并提供一些能够影射操作码的方法

java编译器 Javac 编译原理相关推荐

  1. 第二章 Javac编译原理

    注:本文主要记录自<深入分析java web技术内幕>"第四章 javac编译原理" 1.javac作用 将*.java源代码文件转化为*.class文件 2.编译流程 ...

  2. 浅入浅出Javac编译原理——爪哇岛探险(1)

    浅入浅出Javac编译原理 Java语言是当今程序员中使用最广的语言,不光是从语言本身来说,还包括了与Java相关的一些概念.例如JDK,J2EE,JVM等等.还不断有新的语言出现,如groove,s ...

  3. 编译原理代码生成器java_浅入浅出Javac编译原理

    浅入浅出Javac编译原理 Java语言是当今程序员中使用最广的语言,不光是从语言本身来说,还包括了与Java相关的一些概念.例如JDK,J2EE,JVM等等.还不断有新的语言出现,如groove,s ...

  4. JavaWeb技术内幕四:Javac编译原理

    微信公众号[黄小斜]大厂程序员,互联网行业新知,终身学习践行者.关注后回复「Java」.「Python」.「C++」.「大数据」.「机器学习」.「算法」.「AI」.「Android」.「前端」.「iO ...

  5. javac编译原理简介

    文章目录 1:javac的七个阶段 1.1 第一阶段:parse 1.2 第二阶段:enter 1.3 第三阶段:process 1.4 第四阶段:attr 1.4 第五阶段:flow 1.5 第六阶 ...

  6. PL/0语言编译器扩展 编译原理课程实践(1)

    转眼大学生活就要结束,编译原理课程学的东西很多都忘记了.当时我们编译原理课程实践是PL/0语言编译器扩展,在原有PL/0语言文法进行扩展.我写这次博文一是为了回忆以前学的知识,加深记忆:二是和大家分享 ...

  7. 浅谈Javac编译原理

    一.javac是什么? 1.javac是一种编译器,能够将一种语言规范转化成另外一种语言规范 2.javac的任务就是将Java源代码转化成JVM能够识别的一种语言(Java字节码),这种字节码不是针 ...

  8. java文件编译_【java】javac编译多个有依赖关系的java文件为class文件

    历史文章: [javac命令不能使用,提示不是内部命令或外部命令,请查看历史文章] =================需求说明========================== 之前的文章中,仅说明 ...

  9. 算符优先文法编写java语法分析器,编译原理课程设计实验报告——基于算符优先分析方法的表达式语法分析器...

    内容简介: 一.设计目的 了解用算符优先法对表达进行语法分析的方法,掌握自顶向下的预测语法分析程序的手工构造方法. 二.设计内容 对简单表达式文法构造算符优先分析器. 三.设计要求 1.对下列简单表达 ...

最新文章

  1. Cesar竞赛平台项目中期总结
  2. 吴恩达深度学习笔记2.2 logistic回归
  3. 月亮之上--数学分析版
  4. TOJ 4393 Game
  5. python数据库在哪_python可以用哪些数据库
  6. SpringBoot的@Conditional和自动配置类生效
  7. 5004. boost 源码编译vs2019
  8. 3d打印英语文献_DMD 激光熔覆3D打印机型设计在仿真计算中的经验分享
  9. 写给 3 年内程序开发者的一封信
  10. XX项目技术架构模板
  11. 线性同余法产生均匀随机数C语言,利用线性同余法产生随机数进行同步计算
  12. java 文档查看技巧
  13. 硬盘不能进PE的问题与解决
  14. 视觉SLAM十四讲中P61作业7。
  15. 易语言清理IEcookies 缓存等 可用于IE清理cookies
  16. raster包—aggregate函数
  17. Spring初窥门径
  18. Java网络 1.3 开发工具介绍
  19. spring bean的实例化
  20. 让深度学习进入移动端,蘑菇街在移动端的深度学习优化实践

热门文章

  1. 计算机汉字编码贵州,计算机汉字输入编码方法
  2. 4G EPS 中的随机接入
  3. C语言枚举型复习笔记
  4. 电流环差分信号传送数字信号
  5. 集群的定义以及类别定义
  6. Xcode+OpenCV3.4.0 折腾(2)
  7. Notification 浏览器右下角弹出提示消息
  8. redis报protocol error的真正原凶
  9. GoogleReader的Likes操作数据如何获取?
  10. Potocol Buffer详解