引入

String,是 Java 中除了基本数据类型以外,最为重要的一个类型了。很多人会认为他比较简单。但是和 String 有关的面试题有很多,下面我随便找两道面试题,看看你能不能都答对:

Q1:String s = new String("hollis");定义了几个对象。
Q2:如何理解 String.intern()方法?
上面这两个是面试题和 String 相关的比较常考的,很多人一般都知道答案。

A1:若常量池中已经存在 “hollis”,则直接引用,也就是此时只会创建一个对象,如果常量池中不存在 “hollis”,则先创建后引用,也就是有两个。
A2:当一个 String 实例调用intern()方法时,JVM 会查找常量池中是否有相同 Unicode 的字符串常量,如果有,则返回其的引用,如果没有,则在常量池中增加一个 Unicode 等于 str 的字符串并返回它的引用;
两个答案看上去没有任何问题,但是,仔细想想好像哪里不对呀。

按照上面的两个面试题的回答,就是说 new String 会检查常量池,如果有的话就直接引用,如果不存在就要在常量池创建一个,那么还要 intern 干啥?难道以下代码是没有意义的吗?

 String s = new String("Hollis").intern();

如果,每当我们使用 new 创建字符串的时候,都会到字符串池检查,然后返回。那么以下代码也应该输出结果都是 true?

 String s1 = "Hollis";String s2 = new String("Hollis");String s3 = new String("Hollis").intern();System.out.println(s1 == s2);System.out.println(s1 == s3);

但是,以上代码输出结果为(base jdk1.8.0_73):

 falsetrue

不知道聪明的读者看完这段代码之后,是不是有点被搞蒙了,到底是怎么回事儿?

别急,且听我慢慢道来。


字面量和运行时常量池

JVM 为了提高性能和减少内存开销,在实例化字符串常量的时候进行了一些优化。为了减少在 JVM 中创建的字符串的数量,字符串类维护了一个字符串常量池。

在 JVM 运行时区域的方法区中,有一块区域是运行时常量池,主要用来存储编译期生成的各种字面量和符号引用。

了解 Class 文件结构或者做过 Java 代码的反编译的朋友可能都知道,在 java 代码被 javac 编译之后,文件结构中是包含一部分 Constant pool 的。比如以下代码:

public static void main(String[] args) {String s = "Hollis";
}

经过编译后,常量池内容如下:

Constant pool:
#1 = Methodref          #4.#20         // java/lang/Object."<init>":()V
#2 = String             #21            // Hollis
#3 = Class              #22            // StringDemo
#4 = Class              #23            // java/lang/Object
...
#16 = Utf8               s
..
#21 = Utf8               Hollis
#22 = Utf8               StringDemo
#23 = Utf8               java/lang/Object

上面的 Class 文件中的常量池中,比较重要的几个内容:

#16 = Utf8               s
#21 = Utf8               Hollis
#22 = Utf8               StringDemo

上面几个常量中,s 就是前面提到的符号引用,而 Hollis 就是前面提到的字面量。而 Class 文件中的常量池部分的内容,会在运行期被运行时常量池加载进去。关于字面量,详情参考 Java SE Specifications。


补充:

字面量是指由字母,数字等构成的字符串或者数值,它只能作为右值出现,所谓右值是指等号右边的值,如:int a=123这里的a为左值,123为右值。

常量变量都属于变量,只不过常量是赋过值后不能再改变的变量,而普通的变量可以再进行赋值操作。

例:

int a;//a变量
const int b=10;//b为常量,10为字面量
string str="hello world";//str为变量,hello world为字面量

new String创建了几个对象

下面,我们可以来分析下 String s = new String("Hollis"); 创建对象情况了。

这段代码中,我们可以知道的是,在编译期,符号引用 s 和字面量 Hollis 会被加入到 Class 文件的常量池中,然后在类加载阶段,这两个常量会进入常量池。

但是,这个“进入”过程,并不会直接把所有类中定义的常量全部都加载进来,而是会做个比较,如果需要加到字符串常量池中的字符串已经存在,那么就不需要再把字符串字面量加载进来了。

所以,当我们说<若常量池中已经存在 “hollis”,则直接引用,也就是此时只会创建一个对象>说的就是这个字符串字面量在字符串池中被创建的过程。

说完了编译期的事儿了,该到运行期了,在运行期,new String(“Hollis”);执行到的时候,是要在 Java 堆中创建一个字符串对象的,而这个对象所对应的字符串字面量是保存在字符串常量池中的。但是,String s = new String(“Hollis”);,对象的符号引用 s 是保存在Java虚拟机栈上的,他保存的是堆中刚刚创建出来的的字符串对象的引用。

所以,你也就知道以下代码输出结果为 false 的原因了。

String s1 = new String("Hollis");
String s2 = new String("Hollis");
System.out.println(s1 == s2);

因为,== 比较的是 s1 和 s2 在堆中创建的对象的地址,当然不同了。但是如果使用 equals,那么比较的就是字面量的内容了,那就会得到 true。

在不同版本的JDK中,Java堆和字符串常量池之间的关系也是不同的,这里为了方便表述,就画成两个独立的物理区域了。具体情况请参考Java虚拟机规范。

上图中 s1 和 s2 是两个完全不同的对象,在堆中有自己的内存空间,当然不相等了。

所以,String s = new String("Hollis");创建几个对象的答案你也就清楚了。

常量池中的“对象”是在编译期就确定好了的,在类被加载的时候创建的,如果类加载时,该字符串常量在常量池中已经有了,那这一步就省略了。堆中的对象是在运行期才确定的,在代码执行到 new 的时候创建的。


运行时常量池的动态扩展

编译期生成的各种字面量和符号引用是运行时常量池中比较重要的一部分来源,但是并不是全部。那么还有一种情况,可以在运行期像运行时常量池中增加常量。那就是 String 的intern方法。

当一个String实例调用intern()方法时,JVM 会查找常量池中是否有相同 Unicode 的字符串常量,如果有,则返回其的引用,如果没有,则在常量池中增加一个 Unicode 等于 str 的字符串并返回它的引用;

intern()有两个作用,第一个是将字符串字面量放入常量池(如果池没有的话),第二个是返回这个常量的引用。

我们再来看下开头的那个让人产生疑惑的例子:

String s1 = "Hollis";
String s2 = new String("Hollis");
String s3 = new String("Hollis").intern();System.out.println(s1 == s2);
System.out.println(s1 == s3);

你可以简单的理解为String s1 = "Hollis";String s3 = new String("Hollis").intern();做的事情是一样的(但实际有些区别,这里暂不展开)。都是定义一个字符串对象,然后将其字符串字面量保存在常量池中,并把这个字面量的引用返回给定义好的对象引用。如下图:

对于String s3 = new String("Hollis").intern();,在不调intern情况,s3 指向的是 JVM 在堆中创建的那个对象的引用的(如图中的s2)。但是当执行了 intern 方法时,s3 将指向字符串常量池中的那个字符串常量。

由于 s1 和 s3 都是字符串常量池中的字面量的引用,所以 s1==s3。但是,s2 的引用是堆中的对象,所以 s2!=s1。


intern 的正确用法

不知道,你有没有发现,在String s3 = new String("Hollis").intern();中,其实 intern 是多余的?

因为就算不用 intern,Hollis 作为一个字面量也会被加载到 Class 文件的常量池,进而加入到运行时常量池中,为啥还要多此一举呢?到底什么场景下才会用到 intern 呢?
在解释这个之前,我们先来看下以下代码:

String s1 = "Hollis";
String s2 = "Chuang";
String s3 = s1 + s2;
String s4 = "Hollis" + "Chuang";

在经过反编译后,得到代码如下:

String s1 = "Hollis";
String s2 = "Chuang";
String s3 = (new StringBuilder()).append(s1).append(s2).toString();
String s4 = "HollisChuang";

可以发现,同样是字符串拼接,s3 和s4 在经过编译器编译后的实现方式并不一样。s3 被转化成 StringBuilder 及 append,而 s4 被直接拼接成新的字符串。

如果你感兴趣,你还能发现,String s4 = s1 + s2; 经过编译之后,常量池中是有两个字符串常量的分别是 Hollis、Chuang(其实 Hollis 和 Chuang 是String s1 = “Hollis”;和String s2 = “Chuang”;定义出来的),拼接结果HollisChuang 并不在常量池中。

如果代码只有String s4 = “Hollis” + “Chuang”;,那么常量池中将只有 HollisChuang 而没有 Hollis 和 Chuang。

究其原因,是因为常量池要保存的是已确定的字面量值。也就是说,对于字符串的拼接,纯字面量和字面量的拼接,会把拼接结果作为常量保存到字符串。

如果在字符串拼接中,有一个参数是非字面量,而是一个变量的话,整个拼接操作会被编译成StringBuilder.append,这种情况编译器是无法知道其确定值的。只有在运行期才能确定。

那么,有了这个特性了,intern 就有用武之地了。那就是很多时候,我们在程序中用到的字符串是只有在运行期才能确定的,在编译期是无法确定的,那么也就没办法在编译期被加入到常量池中。

这时候,对于那种可能经常使用的字符串,使用 intern 进行定义,每次 JVM 运行到这段代码的时候,就会直接把常量池中该字面值的引用返回,这样就可以减少大量字符串对象的创建了。
如一美团点评团队的《深入解析String#intern》文中举的一个例子:

static final int MAX = 1000 * 10000;
static final String[] arr = new String[MAX];public static void main(String[] args) throws Exception {Integer[] DB_DATA = new Integer[10];Random random = new Random(10 * 10000);for (int i = 0; i < DB_DATA.length; i++) {DB_DATA[i] = random.nextInt();}for (int i = 0; i < MAX; i++) {arr[i] = new String(String.valueOf(DB_DATA[i % DB_DATA.length])).intern();}
}

在以上代码中,我们明确的知道,会有很多重复的相同的字符串产生,但是这些字符串的值都是只有在运行期才能确定的。所以,只能我们通过intern显示的将其加入常量池,这样可以减少很多字符串的重复创建。


总结

我们再回到文章开头那个疑惑:按照上面的两个面试题的回答,就是说new String也会检查常量池,如果有的话就直接引用,如果不存在就要在常量池创建一个,那么还要intern干啥?难道以下代码是没有意义的吗?

String s = new String("Hollis").intern();

new String 所谓的“如果有的话就直接引用”,指的是Java堆中创建的String对象中包含的字符串字面量直接引用字符串池中的字面量对象。也就是说,还是要在堆里面创建对象的。

intern中说的“如果有的话就直接返回其引用”,指的是会把字面量对象的引用直接返回给定义的对象。这个过程是不会在 Java 堆中再创建一个 String 对象的。

的确,以上代码的写法其实是使用 intern 是没什么意义的。因为字面量 Hollis 会作为编译期常量被加载到运行时常量池。

之所以能有以上的疑惑,其实是对字符串常量池、字面量等概念没有真正理解导致的。有些问题其实就是这样,单个问题,自己都知道答案,但是多个问题综合到一起就蒙了。归根结底是知识的理解还停留在点上,没有串成面。

转载自:http://www.hollischuang.com/

[转]String 之 new String()和 intern()方法深入分析相关推荐

  1. String中intern方法的作用

    前言 读完这篇文章你可以了解,String对象在虚拟机内存中的存放,intern的作用,这么多String对象的创建到底有什么区别,String 创建的对象有几个!! 进入正题 先科普几个知识点 1. ...

  2. String.intern()方法JDK6与JDK7/JDK8不同

    在JDK6中,String.intern()方法先去运行时常量池中查看有无该字符串,如果有,则直接返回该字符串在方法区的内存地址.如果没有则会先将该字符串对象复制一份保存在常量池中,并返回该字符串对象 ...

  3. java intern_java String的intern方法

    我们知道再jvm的运行时内存可以分为堆.方法区.程序计数器.虚拟机栈和本地方法栈.而在方法区中有一个字符串常量池,用来保存字符串这个不可变量.如果我们使用String str=new String(& ...

  4. 关于Java中String类的intern()方法

    首先intern()方法的定义:当调用这个方法的时候,如果字符串常量池中有这个对象,就把常量池中的这个对象返回,没有就把当前对象加入到常量池并且返回当前对象的引用: jdk1.6之前:将对象存入常量池 ...

  5. String类中的intern()方法详解

    来源地址:https://blog.csdn.net/soonfly/article/details/70147205 在翻<深入理解Java虚拟机>的书时,又看到了2-7的 String ...

  6. java 创建string对象机制 字符串缓冲池 字符串拼接机制 字符串中intern()方法...

    字符串常量池:字符串常量池在方法区中 为了优化空间,为了减少在JVM中创建的字符串的数量,字符串类维护了一个字符串池,每当代码创建字符串常量时,JVM会首先检查字符串常量池.如果字符串已经存在池中,就 ...

  7. JAVA中String类的intern()方法的作用

    2019独角兽企业重金招聘Python工程师标准>>> 一般我们变成很少使用到 intern这个方法,今天我就来解释一下这个方法是干什么的,做什么用的 首先请大家看一个例子: [ja ...

  8. 字符斜杠是合法常量吗_【面试秘籍】你对String的intern方法了解吗

    我们先来看个例子: public class StringTest { public static void main(String[] args) { String a = "A" ...

  9. JDK1.8中String类的intern()方法学习

    jdk1.8字符串常量池是位于堆中: 在jdk1.8中使用如下指令时会同时在堆中和常量池(前提是常量池中还没有该对象)中创建字符串对象,但是s是指向堆中. String s = new String( ...

最新文章

  1. asp.net 窗体关闭事件_VBA代码将强制执行:你的窗体上必须显示最大、最小化按钮...
  2. 南昌理工学院计算机系考研,南昌理工学院的学生可不可以考研和公务员
  3. linux dd文件系统,原来dd命令也可以模拟块设备(文件系统)读写
  4. “疫”外爆发:没那么简单的视频会议
  5. 29/100. Counting Bits
  6. kubelet内存异常分析
  7. 快速入门:使用 Docker 运行 SQL Server 容器映像
  8. centos7 开机启动文件路径_centos7定时运行python脚本
  9. 北京地铁规划大全(图),买房子可以参考一下
  10. 如何获取屏幕分辨率呢
  11. android 双拼输入法,高效输入解决方案——双拼输入法
  12. monkey压力测试命令
  13. NOIP 2018模拟赛 by zwz T3 磨懒虫主义
  14. 统计相关系数——Kendall Rank(肯德尔等级)相关系数
  15. 终生学习者,永远劳苦命!
  16. 计算机网络中的猫,宽带猫的作用和分类【图解】
  17. 网络安全——数据库基础知识
  18. 星淘惠:做跨境电商为什么要选择亚马逊?
  19. 几种硬盘IO性能测试工具
  20. java urlrewrite_Java版URL Rewrite

热门文章

  1. 开源mock server系统
  2. 【拜小白opencv】45-二维H-S直方图绘制----calcHist()函数、minMaxLoc()函数
  3. jekenis+maven(nodejs)+svn自动化部署(前后端)
  4. Visual Studio 2017 Intro
  5. Gradle transitive = true
  6. tomcat HTTP与HTTPS同时开启并且同时可以访问
  7. js-es6知识汇总(1) 原型与原型链
  8. Windows为什么越用越慢而Linux却不会?
  9. (01)ORB-SLAM2源码无死角解析-(57) 闭环线程→计算Sim3:理论推导(2)求解R,使用四元数
  10. Synopsys DC 笔记