Java类文件(.class文件)是一个为已编译Java程序仔细定义的格式。Java源代码被编译成能够被任何JVM加载和执行的类文件。在被JVM加载之前,类文件可能是由网络传输而来。

类文件是独立于底层平台的,所以适用于更多的地方。它们由简洁的JVM字节码组成,这样就能轻装上阵。类文件常常被压缩,以极快的速度通过网络,到达世界各地的JVM。

类文件里有什么?

Java类文件包含JVM需要知道的关于一个Java类或接口的一切。按照它们的出现次序,主要的部分有:魔法数(magic),版本号(version),常量池(constant pool),访问标示符区(access flags),当前类区(this class),超类区(super class),父接口区(interfaces),字段区(fields),方法列表区(methods),属性区(attributes)

保存在类文件中的信息经常在长度上有变化,所以信息的实际长度在被加载之前不能被预测。例如,在方法区里的方法数目,类与类之间是不相同的,这取决于源代码中定义的方法个数。类文件中,这些信息的实际大小或长度,被安排在信息内容之前。这样,当类文件被JVM加载时,可变信息的长度首先被读取。一旦JVM知道信息的大小,它就能正确的读取实际的信息内容。

类文件中,不同的相邻信息之间通常没有空白或填充字符;一切都以字节(byte)边界对齐。这使得类文件很小,适合网络传输。

为了让JVM在加载类文件时,知道需要什么信息以及从哪里可以取得所需信息,类文件的各个组成部分的次序是严格定义的。例如,每个JVM都知道类文件的前8个字节由魔法数和版本号组成,常量池从第9个字节开始,访问标示符区紧跟在常量池后面。但是,因为常量池的长度是可变的,在读取完常量池之前,JVM是不知道访问标示符区具体从什么地方开始。一旦读取完常量池,JVM就知道接下来的2个字节就是访问标示符区。

1、魔法数(Magic)和版本号(Version)

每个类文件的开始4个字节都是0xCAFEBABE。这个神奇的数字让Java类文件更容易识别,因为类文件以外的文件几乎不可能也以这四个相同的字节开头。之所以称之为魔法数,是因为它可以被文件格式设计者们从帽子里拉出来(??)。对它仅有的要求是,不能被现实已有的文件格式占用。根据最初Java团队主要成员之一的Patrick Naughton所说,远在“Java”被当作Java语言的名称之前,这个神奇的数字就已经被选好了。我们当时在寻找一个有趣,独特并且很容易记住的数字。0xCAFEBABE作为漂亮的Peet’s Coffee的咖啡师的代称,能预示未来Java语言的名字,这完全是一个巧合。

类文件接下来的4个字节包含了大版本号(major version)和小版本号(minor version)。这些数字标识了特定类文件使用的类文件格式,让JVM可以验证类文件是否可以被载入。每个JVM都有一个它能载入的最大版本号,拒绝加载大于最大版本号的类文件。

2、常量池(Constant Pool)

类文件在常量池中保存与类或接口关联的常量。常量池中能看到的部分常量是字符串字面值(literal strings),final变量的值(final variable values),类名,接口名,变量名和变量类型,方法名和方法签名(method names and signatures)。方法签名由方法返回值类型(return type)和一组参数类型(argument types)组成。

常量池被组织成一个元素长度可变的数组。每个常量占据数组中的一个元素。在整个类文件中,常量通过指示它们在数组中位置的整型索引来引用。第一个常量的索引值是1,第二个是2,以此类推。常量池数组的元素个数写在常量池的前面,所以在加载类文件时,JVM知道它需要加载多少常量。

常量池中每个元素以指明自己类型的单字节标签(tag)开始。一旦JVM看到这个标签,就能知道接下来会遇到什么类型的常量。例如,如果看到一个表示字符串的标签,JVM会认为接下来2个字节就是字符串的长度,然后就是“长度”个字节组成的字符串。

在本文剩下的部分,我有时会用constant_pool[n]表示常量池数组的第n个元素。从常量池组织的像个数组来说,这是有道理的;但是请记住,这些元素具有不同的大小和类型,并且第一个元素的索引是1。

3、访问标识符区(Access Flags)

常量池之后的2个字节就是访问标示符,它表明该文件定义的是类还是接口;该类或接口是公开的(public)还是抽象的(abstract);如果是类,该类是不是final的。

4、当前类区(This class)

接下来2个字节是当前类区,它只是一个常量池数组的索引。被当前类引用的常量constant_pool[this_class],包含两部分:单字节标签(tag)和双字节名称索引(name index)。标签等于CONSTANT_Class,一个表示本元素中包含类或接口信息的值。constant_pool[name_index]是一个包含类或接口名的字符串常量。

当前类部分稍稍揭示了常量池是怎么被使用的。当前类区本身只是一个常量池的索引。当JVM查找constant_pool[this_class]时,它找到一个用标签表明自己是一个CONSTANT_Class得元素。JVM知道CONSTANT_Class元素在标签(tag)之后,总是有一个叫名称索引(name index)的常量池双字节索引。然后它查找constant_pool[name_index],得到包含类或接口名的字符串。

5、超类区(Super class)

当前类区之后是超类区,也是2个字节的常量池索引。constant_pool[super_class]是CONSTANT_Class元素,它指向当前类所直接继承的超类名。

6、接口区(Interfaces)

接口区开头的2个字节,表示文件所定义的类(或接口)实现的接口数目。紧接着是一个数组,它包含了类所实现的每一个接口在常量池中的索引。

每个接口都是常量池中的CONSTANT_Class元素,它指向接口名。

7、字段区(Fields)

字段部分,以表示该类或接口包含的字段数的2个字节开始。字段是一个实例变量,或者是类或接口的类变量。接下来是一个以可变长结构为元素的数组,一个结构一个字段。每个结构都包含一个字段的相关信息,如字段名,字段类型,如果是final变量,还包括字段值。部分信息在结构当中,另一部分包含在常量池中由结构中的索引指向的位置。

这部分仅有的字段,都是直接定义在该类文件中的类或接口声明的变量;继承自超类或接口的字段不在此列。

8、方法区(Methods)

方法部分,以表示类或接口中方法数目的2字节开始。这个数目,只包含当前类显式定义的方法,不包括继承自超类的方法。数目之后是方法本身。

表示每个方法的结构包含方法相关的几条信息,包括方法描述符(method descriptor,包括返回值类型和参数列表),方法本地变量需要的栈字(stack words)数,方法操作数栈(operand stack)需要的最大栈字数,方法捕获的异常表,方法逻辑的字节码序列和行号表。

9、属性区(Attributes)

排在最后的是属性区,它提供定义在类文件中的特定类或接口的一般信息。属性区以2字节的属性数目开始,然后是属性本身。比如一个表示源码属性的属性:它表示当前类被编译而来的源文件名。JVM会悄悄地忽略任何它们识别不了的属性。

【深入理解JVM】Java类文件的基本结构相关推荐

  1. java类的两个基本成分_Java类文件的基本结构

    欢迎来到""第二期.我们讨论了抽象计算机JVM.如果你对JVM还很陌生,你可以去看看.本期,我们稍稍窥探一下Java类文件的基本结构. 为旅行而生 Java类文件(.class文件 ...

  2. java javap_javap的用途不断发展:您的Java类文件中隐藏了什么?

    java javap 什么是Javap,如何使用它以及何时要反汇编类文件? 作为Java开发工具包(JDK)的一部分,我们可以使用许多工具,这些工具有助于更好地理解Java代码. 这些工具之一是jav ...

  3. javap的用途不断发展:您的Java类文件中隐藏了什么?

    什么是Javap,如何使用它以及何时要反汇编类文件? 作为Java开发工具包(JDK)的一部分,我们可以使用许多工具,这些工具有助于更好地理解Java代码. 这些工具之一是javap命令,它为我们提供 ...

  4. 使用ASM 4处理Java类文件–第一部分:世界,您好!

    什么是ASM :ASM是一个用于处理Java字节码的开源Java库. 因此,它具有与Apache BCEL相同的目的. 由于本文假定读者具有Java类文件格式的某些知识,因此建议在此处进行阅读. 那么 ...

  5. 如何“反编译” Java类文件? [关闭]

    我可以使用什么程序来反编译类文件? 我实际上会得到Java代码,还是仅仅是JVM汇编代码? 关于该站点上的Java性能问题,我经常看到已经"反编译" Java类文件以查看编译器如何 ...

  6. java 使用不同目录下的类_如何运行在不同目录下的java类文件? - Break易站

    Java 基础语法 在本文中,我们将学习如何使用其他项目的实用程序,类和成员.在继续之前,让我们了解一些关键字. 类路径 类路径是jvm开始执行程序的位置.与传统的动态加载行为类似,当执行Java程序 ...

  7. java asm tree_使用ASM 4处理Java类文件–第二部分:Tree API

    java asm tree 什么是ASM树API: ASM树API是ASM的一部分,可让您创建/修改内存中的类. 该类被视为信息树. 像整个类一样,它是ClassNode的实例,其中包含FieldNo ...

  8. 使用ASM 4处理Java类文件–第二部分:Tree API

    什么是ASM树API: ASM树API是ASM的一部分,可让您创建/修改内存中的类. 该类被视为信息树. 像整个类一样,它是ClassNode的实例,其中包含FieldNode对象列表,MethodN ...

  9. java 类文件_Java类文件概述

    所谓 Java 类文件,就是通常用 javac 编译器产生的 .class 文件.这些文件具有严格定义的格式. Java 源文件经过 javac 编译器编译之后,将会生成对应的二进制文件(如下图所示) ...

最新文章

  1. ubuntu sublime字体设置
  2. matlab freqz函数使用
  3. 任务调度与上下文切换时间测试
  4. 使用python做最简单的爬虫
  5. 修改页面后获得flag_互动征集丨是时候为2021立flag了
  6. 整数奇偶排序(信息学奥赛一本通-T1181)
  7. 数字图像处理--空间滤波器
  8. 让天下没有难做的研发:解读阿里CI/CD、DevOps、分层自动化技术
  9. JavaScript Window Navigator
  10. V-rep学习笔记:机器人逆运动学数值解法(The Jacobian Transpose Method)
  11. 微信小程序系列(3)如何用微信小程序写一个论坛?贴心代码详解(一)发帖
  12. 数值分析 有效数字计算
  13. 忘记网站服务器密码怎么办,忘记远程服务器的密码怎么办
  14. 程序员不要和陌生人说话——漫谈一些有趣的架构原则
  15. IDEA 代码分屏编辑对比: split vertically
  16. iOS AirDrop
  17. Wildcard Matching 1
  18. H3C CE3000系列交换机插入千兆光模块后发现光模块可发光但端口指示灯不亮
  19. mysql dbi dbd_安装DBI和DBD包
  20. 使用开源软件替换现有的盗版软件

热门文章

  1. 典型的Linux系统启动需要完成的服务
  2. 为什么要设置Java环境变量(详解)
  3. [导入]PHP通用分页类
  4. android JSONObject的使用
  5. JavaScript中十个一步拷贝数组的方法
  6. Python中单个下划线“_”变量的目的是什么?
  7. 通过Redis、Memcache的 incr 原子操作防刷机制的使用差别
  8. java.lang.NoClassDefFoundError: org/springframework/boot/context/embedded/FilterRegistrationBean
  9. xenserver 脚本学习之/opt/xensource/bin/xapi-wait-init-complete
  10. jQuery轮 播的封装