摘要

本文在研究kaffe的基础上,吸收kaffe虚拟机的主要思想,用C语言作为

开发语言

,采用了及时编译器作为执行引擎,实现了一种

Windows

平台下的

Java

虚拟机。然后对实现过程中的一些关键技术如class文件验证、及时编译器、垃圾收集器、线程同步和线程调度等做了分析。

关键词

kaffe; C语言; 及时编译器;Java虚拟机

引言

Java虚拟机本质是就是一个程序,当它在命令行上启动的时候,就开始执行保存在某字节码文件中的指令。Java语言的可移植性正是建立在Java虚拟机的基础上。任何平台只要装有针对于该平台的Java虚拟机,字节码文件(.class)就可以在该平台上运行。这就是“一次编译,多次运行”。

kaffe虚拟机的简要分析

kaffe虚拟机采用了模块化的程序设计思想,它由多个独立的子系统组成。从功能模块上来分它主要分为:虚拟机总体

驱动

模块,类装载器模块,类执行模块,数据区管理模块,内存管理模块,本地支持模块等等。kaffe虚拟机简要的程序流程图如图1所示。

图1 kaffe虚拟机简要的程序流程图

Java虚拟机的实现

Java 源程序的执行过程为: Java源程序(.java)经过Java编译器编译生成字节码文件(.class),然后由类装载器将字节码文件装载到方法区中,然后进行连接验证,由Java虚拟机读取字节码,转换为特定平台的指令,并且在对应的CPU中执行。

本实现中采用的流程框架如下图所示:

图2 本实现的主要框架

1、类装载、连接及初始化

类文件包括:魔数(magic),次、主版本号,常量池,类或接口访问修饰符,常量池索引(this_class和super_class),接口表,域表,方法表,类或接口的属性信息。其中最复杂的内容是常量池,它类似于传统语言编译过程中用到的符号表。

从原始的class文件到可以被Java虚拟机执行的内部数据格式,需要经过装载、连接和初始化这3个阶段。

装载是将class文件通过类装载器装载到在逻辑上被称为方法区的内存单元中的过程。

连接又分为三个步骤:验证,准备和解析。验证是对字节码的验证,可根据具体情况来确定被装载的类是否符合Java虚拟机规范中规定的class文件格式,并确保它不会破坏Java虚拟机的完整性。包括(1)类装载过程中的验证; (2) 检查class文件内部的连贯性,一旦发现class文件格式存在一处错误,则抛出VerifyError异常或ClassFormatError异常。确保每个final类不含有子类,final方法不能被覆盖,以及常量池中所有的域引用和方法引用有有效的名字和类型描述符号;(3) 对字节码流使用一个数据流分析器进行验证。准备步骤的任务是创建域表,并设置域初值。解析步骤是将类中的常量池中的类、接口、字段和方法的符号引用替换成直接引用,以达到更快地访问数据的目的。

在初始化阶段,Java虚拟机设计者需要将类变量赋予正确的初始值。

class文件经过上述三个阶段的处理,虚拟机就获得了该类的所有信息并且表示成能够容易操作的内部数据格式,从而为方法的运行作好了充分的准备。

2、及时编译器

任何Java虚拟机实现的核心都是它的执行引擎。在由软件实现的虚拟机中,执行引擎主要有一次性解释字节码、及时编译器、自适应优化编译器三种方式。本实现采用了及时编译的方式,它的特点是第一次被执行的机器码会被编译成本地机器码。及时编译器将引入的字节码翻译成本地机器码,然后直接执行机器码指令而不是解释字节码。机器码指令保存在内存中,由于在运行过程中编译的结果不被保存,所以程序下一次运行时,字节码将再一次被翻译成机器码。

如果一装载完字节码文件中的Java方法后,就对其进行编译,则有点处理不恰当,因为还不清楚是否需要执行该方法。编译一个不需要执行的方法,将带来不必要的空间和时间上的损失。因此虚拟机设计者需要采用一种优化方案,即只有需要被执行的方法才能被JIT编译,这个问题可以参照kaffe虚拟机中的trampoline来解决。

JIT实现步骤:(1)对字节码进行验证并且划分基本块;(2)产生四元式;(3)根据四元式生成本地机器码;(4)操作数地址回填。

图3及时编译器的流程图

在字节码指令模拟操作的时候,按其语义动作生成指令属性四元式序列,指令属性四元式的结构为: (目的操作数,源操作数1,源操作数2,语义动作),四元式数据结构如下:

typedef struct Sequence{

void (*func)(struct Sequence*); //语义动作

union{

jvalue value;

struct _label_ *labconst; //标号类型操作数

Method *methconst; //方法地址操作数

struct slotData **smask;

struct slotData *slot; //槽操作数

}u[3];

uint8 type; //Sequence类型

uint8 refered; //该四元式的引用

struct Sequence *next; //下一个四元式

}Sequence;

其中目的操作数为Sequence.u[0],源操作数1为Sequence.u[1],源操作数2为Sequence.u[2]。 Sequence.func则代表语义动作,它主要用于生成该Sequence语义的本地机器码。

指令属性四元组建立后就进入代码生成阶段,属性四元组在形式上已经非常接近本地机器指令,只需要遍历该属性序列,执行相应的语义动作函数,即可生成机器指令。语义动作函数的功能包括操作数寻址、寄存器分配、建立指令连接以及本地机器码生成等。

在及时编译过程中要经常使用到操作数栈,虚拟机把操作数栈作为它的工作区。大多数指令都要从这里弹出数据,执行运算,然后把结果压回操作数栈。而操作数栈区,局部变量区和帧数据区被包含在方法帧中。方法帧的数据结构如下:

typedef struct Frame{

struct Frame *prev; // 上一帧

struct Frame *next; // 下一帧

value_t *sp; // 栈槽指针

uint8 *pc; // 程序计数器

method_t *method; //指向正在被执行的方法

class_t *class_ptr; // 指向包含该方法的类

value_t locals[1]; //方法的局部变量的起始

}Frame;

本实现中的及时编译器的优点表现在:(1)大大提高了Java应用程序运行的速度;(2)编译过程只在运行时进行,不会改动Java字节码,不会影响Java程序的可移植性;(3)对字节码的编译,使得许多优化手段的采用成为可能。缺点表现在:(1)如果对所有方法进行编译,则会占用大量的内存空间;(2)及时编译的结果在虚拟机终止运行时不被保存,这意味着下一次运行同样的程序仍需要重复编译。

3、垃圾收集

垃圾收集器主要的任务是检测出垃圾对象,然后回收垃圾对象使用的堆空间并还给程序。kaffe采用了增量垃圾收集的算法,而本实现中采用了三色标记并清除算法。

在标记之前先将堆中所有的分配单元置成白色,然后按深度优先算法遍历每一个单元。当垃圾收集器遍历一个分支的时候,如果一个分配单元及与之相关联的单元都被遍历到,则将其标记成黑色。如果一个单元被遍历到,但是与之相关联的单元尚未被遍历,则将该单元标记成灰色。这时,垃圾收集器将继续遍历与该灰色单元相关联的单元,直到这些相关联的单元全部被遍历到,才能将这个灰色单元标记成黑色。最后当所有被遍历到的单元都被标记成黑色的时候, 将堆中被标记成白色的分配单元回收。

图4三色标记并清除算法的中间过程图

最后是对堆碎块进行压缩处理。是通过快速地移动对象来减少堆碎块。即把当前活动的对象移动到堆的一端,在此过程中,堆的另外一端出现一块大的连续的内存单元。所有被移动的对象的引用也被更新,指向新的内存单元。

4、线程同步Java虚拟机中存在着以下两种线程:虚拟机系统线程和用户Java线程。虚拟机系统线程是指虚拟机运行过程中执行其特殊功能的线程,比如垃圾收集器线程等。用户Java线程是指用户编写的Java应用程序中明确表示要启动的线程,并且至少有一个Java线程,即main方法。

而Java语言的一大优势是支持多线程,这种支持主要表现在同步上。在java应用程序中使用synchronized关键字简单地使方法同步,而在Java虚拟机指令中则使用monitorenter和monitorexit指令显式地支持方法同步。Java虚拟机为每个对象都关联一个锁。当当前线程访问共享资源的时候,会执行monitorenter指令来弹出该对象引用,从而获取该对象引用相关联的锁。如果该对象已经被另一线程占用则当前线程就需要进入锁的等待队列,等待释放对象上的锁;已经获取共享资源的线程在释放资源的时候,执行monitorexit指令来弹出对象引用,并且释放与该资源相关联的锁,并让等待队列中的第一个线程获取该对象锁。

当然线程thread也可以根据需要对某对象obj多次上锁,上锁的次数放在计数器counter中。只有当counter为0的时候,即thread加在该对象上的锁被完全释放,其它线程才有机会使用 object。对象的数据结构为:

typedef struct Obj{

uint32 size; //堆中对象的大小

uint16 counter; //对象被上锁的数量

uint16 flag; //对象的状态标志

uint16 thread_id; //对该对象进行加锁的

//线程的ID

} Obj;

而在实际Java编程中, 程序员并不需要动手加锁,对象锁只是在Java虚拟机内部使用的。程序员只需要编写同步语句就可以标志一监视区域,当Java虚拟机运行程序的时候,每次进入一个监视区域,它每次都会给对象上锁。

5、线程调度

在本实现中,还需要考虑到在上述等待线程队列中如何选择下一个线程来执行,即线程调度问题。

哪个线程将获取notify命令,这一点在很大程度上取决于虚拟机的设计者,既可以通过使用FIFO队列来调度,也可以根据所有等待线程的优先级来调度,比如唤醒等待队列中优先级最高的线程获取刚刚释放的资源。而Bill Venners则从平台无关和执行效率这两个角度出发,提倡Java虚拟机的设计者应使用java.lang.Object类中的notifyAll()方法来代替notify()方法去唤醒等待队列中的线程。

处理好线程调度问题,就可以节省程序的执行时间,这对于提高Java虚拟机的执行性能是很有帮助的。

总结  本文在研究kaffe的基础上,实现了一虚拟机。并且对Java虚拟机中的关键技术及时编译器、垃圾收集器、线程同步和线程调度等做了分析。本文中所实现的及时编译器虽然在执行速度上比解释型的Java虚拟机快得多,但是不如自适应优化编译器,因为自适应优化编译器具有程序启动快,占用内存少的特点。如果要明显地提高虚拟机的性能,应该更多的从执行引擎着手。另外在Java应用程序的执行过程中许多时间是花费在多线程处理和垃圾收集上,如果在线程同步和线程调度上有所创新,也可以提高虚拟机的执行性能。  研究Java虚拟机的实现过程有重要的意义,程序员可以编写针对于不同平台下的裁减了的Java虚拟机,这样它就可以在实时嵌入式系统得到广泛地应用。相信Java虚拟机将在更多的领域得到不断的完善和发展。

kaffe java_Java虚拟机Kaffe的研究与实现相关推荐

  1. dup java_java虚拟机指令dup详解

    本文实例为大家介绍了java虚拟机指令dup,供大家参考,具体内容如下 举个例子: public class ExceptionTest{ void cantBeZero(int i) throws ...

  2. 常见的内存错误java_Java虚拟机常见内存溢出错误汇总,Java中常见的坑看了可以少走点弯路...

    那篇沃那粕矩要汇总了Java实拟机常睹挡刳存溢得降足误,警示哪当ツ倒家,躲免得降足,感爱好的朋友可能懂里下 1.劳行 哪当ツ倒事java斥地的小伙伴正在平常平但凡的斥地任胃┬,该当会肥睹各类百般的同扯 ...

  3. 虚拟机类加载机制的了解

       摘要 本文对java虚拟机的类加载机制进行了研究,该过程主要分为三个步骤:加载.连接.初始化,其中连接步骤可以分为:验证.准备.解析三个步骤.文中对于以上步骤进行了详细的介绍.此外,本文还涉及类 ...

  4. 深入浅出解读 Java 虚拟机的差别测试技术

    为什么80%的码农都做不了架构师?>>>    本文分享基于字节码种子生成有效.可执行的字节码文件变种,并用于 JVM 实现的差别测试.本文特别提出用于修改字节码语法的classfu ...

  5. 淺談 Java VM 發展

    標題:淺談 Java VM 發展 作者:Jim Huang (黃敬群) 版權宣告:允許在保留作者.出處,以及本宣告的前提下,以任何人類可讀之形式           自由散佈 最後更新:Apr 16, ...

  6. 浅谈 Java VM 发展

    浅谈 Java VM 发展 Jim Huang <jimchyun @ ccns.ncku.edu.tw> <jserv @ kaffe.org> 略为整理笔者对 Java V ...

  7. IBM WebSphere Application Server 诊断和调优

    近段时间,我们项目中用到的WebSphere应用服务器(WAS),但在客户的production环境下极不稳定,经常宕机.给客户造成非常不好的影响,同时,也给项目组很大压力.为此,我们花了近一个月时间 ...

  8. 北漂周记--第8记--项目测试

    日期:2012-4-16到2012-4-22   ××发现了很多问题.不断地改正. 上周三,小组8人去 锦绣年华 吃了一顿,消费1000元. 琦哥,胃不舒服.××也是,喝了一点就吐了.××,满脸通红, ...

  9. 程序员职业发展路径图:从菜鸟工程师到高级架构师

    http://www.sohu.com/a/249729952_355140 踽踽独行上下求索总是痛苦,如果有良师益友陪伴点拨必能事半功倍.从新手码农到高级架构师,要经过几步?要多努力,才能成为为人倚 ...

最新文章

  1. Linux安装程序Anaconda分析
  2. memcached使用详解
  3. protues仿真常见问题解决方案
  4. 会声会影编辑html,网页视频制作使用会声会影剪辑
  5. android 下载apk 安装程序,Android实现APK下载安装
  6. 双十一电商对决,拍拍微店这次会怎么玩?
  7. 用 Python 实现微信推送消息
  8. 一款java游戏收齐绿宝石哈,神奇宝贝绿宝石游戏
  9. Linux虚拟机获取最高权限
  10. JVAV - 对接支付宝- 下载对账单接口
  11. 世界最高山峰是珠穆朗玛峰(8844.43米=8844430毫米),假如我有一张足够大的纸,它的厚度是0.1毫米。请问,我折叠多少次,可以折成珠穆朗玛峰的高度?
  12. 【记忆中的CASIO】
  13. 计算几何 | 一条迟到的基本定理
  14. MYSQL RR级别是否能解决幻读问题
  15. PEP 634 – Structural Pattern Matching: Specification
  16. 获取百度网盘下载真实地址
  17. 水星UD6S网卡Linux驱动,水星UD6S无线网卡驱动
  18. !外贸邮件处理经验谈
  19. 力控组态故障信息发送到微信
  20. 找出不在近期主力资金的股票以便卖出

热门文章

  1. 中国移动国际英国数据中心正式启动
  2. 传三星Galaxy S10将推出Lite版本 搭载骁龙855处理器
  3. 已走过8年时间!百度这一重要产品正式宣布停止服务
  4. 韩国女主播被中国土豪打赏13万 差点吓晕!网友:真是没见过世面
  5. 2019年新iPhone假机模曝光 越看越不顺眼
  6. 库克:5G iPhone目前还不是我们考虑的问题
  7. 尴尬了!迪士尼官方声明:从未与VIPKID有任何层面的业务合作关系
  8. 情人节消费报告出炉!这三个城市最爱送花...
  9. 美团王兴:互联网下半场基本功不过关 活下去都很难
  10. java大数据组件Flume