1. 前言

最近看到几个有趣的关于Java核心类String的问题。

  1. String类是如何实现其不可变的特性的,设计成不可变的好处在哪里。
  2. 为什么不推荐使用+号的方式去形成新的字符串,推荐使用StringBuilder或者StringBuffer呢。

翻阅了网上的一些博客和stackoverflow,结合自己的理解做一个汇总。

2. String类是如何实现不可变的

String类的一大特点,就是使用Final类修饰符。

A class can be declared final if its definition is complete and no subclasses are desired or required.

Because a final class never has any subclasses, the methods of a final class are never overridden .

Java SE 7 官方手册中的定义如上,如果你认为这个类已经定义完全并且不需要任何子类的话,可以将这个类声明为Final,Final类中的方法将永远不会被重写。

在Java中,String是被设计成一个不可变(immutable)类,一旦创建完后,字符串本身是无法通过正常手段被修改的。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
private final char value[];      // 一旦初始化后,引用不能被修改
public String substring(int beginIndex, int endIndex) {
        if (beginIndex < 0) {
            throw new StringIndexOutOfBoundsException(beginIndex);
        }
        if (endIndex > value.length) {
            throw new StringIndexOutOfBoundsException(endIndex);
        }
        int subLen = endIndex - beginIndex;
        if (subLen < 0) {
            throw new StringIndexOutOfBoundsException(subLen);
        }
        return ((beginIndex == 0) && (endIndex == value.length)) ? this
                : new String(value, beginIndex, subLen);
    }

选了substring方法来做一个代表,其他常见的涉及String操作的方法都是类似,如果你操作后的内容会和目前String中的内容不一致的话,那么都是重新创建一个新的String类返还,不会让你去修改内部的内容。

将String类设计成Final类,能够避免其方法被子类重写,从而破坏了它本身方法的实现,进而破坏了不可变的特性。

2.1 String类设计成不可变的好处

我们都不是Java语言的设计者,不知道其为何一定要设计成不可变,试着做一些猜想。

  1. 可以实现多个变量引用JVM内存中的同一个字符串实例。见后文String Pool的介绍。
  2. 安全性,String类的用途实在太广了,如果可以随意修改的,是不是很恐怖。
  3. 性能,String大量运用在哈希的处理中,由于String的不可变性,可以只计算一次哈希值,然后缓存在内部,后续直接取就好了。如果String类是可变的话,在进行哈希处理的时候,需要进行大量的哈希值的重新计算。

这是结合个人理解和stackoverflow上看的汇总,我们来看看Java语言的爸爸James Gosling是怎么说的。

From a strategic point of view, they tend to more often be trouble free. And there are usually things you can do with immutables that you can’t do with mutable things, such as cache the result. If you pass a string to a file open method, or if you pass a string to a constructor for a label in a user interface, in some APIs (like in lots of the Windows APIs) you pass in an array of characters. The receiver of that object really has to copy it, because they don’t know anything about the storage lifetime of it. And they don’t know what’s happening to the object, whether it is being changed under their feet.

You end up getting almost forced to replicate the object because you don’t know whether or not you get to own it. And one of the nice things about immutable objects is that the answer is, “Yeah, of course you do.” Because the question of ownership, who has the right to change it, doesn’t exist.

One of the things that forced Strings to be immutable was security. You have a file open method. You pass a String to it. And then it’s doing all kind of authentication checks before it gets around to doing the OS call. If you manage to do something that effectively mutated the String, after the security check and before the OS call, then boom, you’re in. But Strings are immutable, so that kind of attack doesn’t work. That precise example is what really demanded that Strings be immutable.

这是James Gosling在2001年5月的一次访谈中,谈到了不可变类和String,大意就是 他会更倾向于使用不可变类,它能够缓存结果,当你在传参的时候,使用不可变类不需要去考虑谁可能会修改其内部的值,这个问题不存在的。如果使用可变类的话,可能需要每次记得重新拷贝出里面的值,性能会有一定的损失。

老爷子还说了,迫使String类设计成不可变的另一个原因是安全,当你在调用其他方法,比如调用一些系统级操作之前,可能会有一系列校验,如果是可变类的话,可能在你校验过后,其内部的值被改变了,可能引起严重的系统崩溃问题,这是迫使String类设计成不可变类的重要原因。

2.2 String Pool

上文说了,设计成不可变后,可以多个变量引用JVM上同一块地址,可以节省内存空间,相同的字符串不用重复占用Heap区域空间。

1
2
String test1 = "abc";
String test2 = "abc";

通常我们平时在使用字符串是,都是通过这种方式使用,那么JVM中的大致存储就是如下图所示。

两个变量同时引用了String Pool中的abc,如果String类是可变的话,也就不能存在String Pool这样的设计了。 在平时我们还会通过new关键字来生成String,那么新创建的String是否也会和上文中的示例一样共享同一个字符串地址呢。

1
2
3
String test1 = "abc";
String test2 = "abc";
String test3 = new String("abc");

答案是不会,使用new关键字会在堆区在创建出一个字符串,所以使用new来创建字符串还是很浪费内存的,内存结构如下图所示。

2.3 不推荐使用+来拼装字符串的原因。

首先我们来看这一段代码,应该是之前写代码比较常见的。

1
2
3
String test1 = "abc";
String test2 = "abc";
String test3 = test1 + test2;

test3通过test1和test2拼接而成,我们看一下这个过程中的字节码。

从以上图我们可以看到,目前的JDK7的做法是,会通过新建StringBuilder的方式来完成这个+号的操作。这是目前的一个底层字节码的实现,那么是不是没有使用StringBuilder或者StringBuffer的必要了呢。还是有的,看下一个例子。

1
2
3
4
5
6
String test2 = "abc";
String test3 = "abc";
for (int i = 0; i < 5; i++) {
    test3 += test2;
}

在上述代码中,我们还是使用+号进行拼接,但这次我们加了一个循环,看一下字节码有什么变化。 

每次循环都会创建一个StringBuilder,在末尾再调用toString返还回去,效率很低。继续看下一个例子,我们直接使用StringBuilder,来做拼接。

1
2
3
4
5
6
String test2 = "abc";
// 使用StringBuilder进行拼接
StringBuilder test4 = new StringBuilder("abc");
for (int i = 0; i < 5; i++) {
    test4.append(test2);
}

每次循环体中只会调用之前创建的StringBuilder的append方法进行拼接,效率大大提高。

至于StringBuilder 的内部实现,诸位有兴趣可以自己再去看一下,本质上也是一个char数组上的操作,和StringBuffer的区别在于,StringBuffer是有做同步处理的,而StringBuilder没有。

3. 总结

本文主要探讨了String类设计为Final修饰和不可变类的原因,以及为何在日常工作中不推荐使用+号进行字符串拼接。

from: kailuncen

http://www.importnew.com/26595.html

编辑从字节码和 JVM 的角度解析 Java 核心类 String 的不可变特性相关推荐

  1. 【Java系列】从JVM角度解析Java核心类String的不可变特性

    凯伦说,公众号ID: KailunTalk,努力写出最优质的技术文章,欢迎关注探讨. 1. 前言 最近看到几个有趣的关于Java核心类String的问题. String类是如何实现其不可变的特性的,设 ...

  2. 从JVM的角度看JAVA代码--代码优化

    从JVM的角度看JAVA代码–代码优化 从JVM的角度看JAVA代码代码优化 片段一重复计算 片段二重复比较 在JVM加载优化为class文件,运行class文件时,会有JIT(Just-In-Tim ...

  3. 从JVM的角度看JAVA代码1

    从JVM的角度看JAVA代码1 从JVM指令的角度来分析++,--问题可以分析的非常透彻,这里给出两个案例.通过这两个案例就能知道JAVA中前++和后++的原理了,同时也可以推论出--的情况. pub ...

  4. jre包括jvm和java核心类库_包含JVM标准实现及Java核心类库

    包含JVM标准实现及Java核心类库 点击次数:1533  更新日期:2013-03-24 "青花瓷Java版"为北京师范大学教育学部蔡苏作词原创,覆盖教育技术学院专业选修课< ...

  5. Carson带你学JVM:图文解析Java虚拟机内存结构

    前言 了解Java中的对象.变量等存放的内存区域十分重要 本文将全面讲解Java虚拟机中的内存模型 & 分区,希望你们会喜欢 Carson带你学JVM系列文章,具体如下: Carson带你学J ...

  6. 【Java 虚拟机原理】Class 字节码二进制文件分析 三 ( 访问和修饰标志 | 类索引 | 父类索引 | 接口计数器 | 接口表 | 字段计数器 | 字段表 )

    文章目录 前言 一.访问和修饰标志 二.类索引 三.父类索引 四.接口计数器 五.接口表 六.字段计数器 七.字段表 前言 上一篇博客 [Java 虚拟机原理]Class 字节码二进制文件分析 二 ( ...

  7. java字节码反编译_javap 反编译 java 字节码文件

    概述: javap是 Java class文件分解器,可以反编译,也可以查看java编译器生成的字节码,从而对代码内部的执行逻辑进行分析. 语法: 把java文件编译为class文件:javac  T ...

  8. idea如何反编译字节码指令_美团点评:Java字节码增强技术,线上问题诊断利器...

    作者简介:泽恩,美团到店住宿业务研发团队工程师.文章转载于公众号:美团技术团队 1. 字节码 1.1 什么是字节码? Java之所以可以"一次编译,到处运行",一是因为JVM针对各 ...

  9. Java的 Class字节码文件结构和内容全面解析【两万字】

    了解Class文件的结构组成,对于我们后续的JVM以及Java原理深入学习是很有帮助的,因为Class文件帮我们默默的做了很多事,比如.为什么对象方法中可以直接使用this变量?!本文将带领大家,一步 ...

最新文章

  1. Java7中的switch支持String的实现细节
  2. MYSQL升级5.7.10后GROUP BY语句出错解决方法
  3. java线程池应用的好处_java高级应用:线程池全面解析
  4. Linux截取文件名的后几位,Linux字符串截取和处理命令 cut、printf、awk、sed、sort、wc...
  5. txt如何单独单独选择一列_散列| 单独链接以解决冲突
  6. 使用cron表达式 设置定时任务
  7. 计算机等级考试初级网络工程师,2019年全国计算机等级考试网络工程师四级,需..._网络编辑_帮考网...
  8. java 模块开发_java模块化开发
  9. Java中3DES加密解密示例
  10. SpringColoud学习笔记007---杂七杂八001--@Resource与@Autowired注解的区别
  11. C++中未初始化的bool值的问题
  12. Haar-like特征来龙去脉
  13. android获取sd卡mount,Android如何获取所有存储卡挂载路径
  14. Linux上的视频播放及MPV播放器与SVP4插帧
  15. 刚办的电信卡显示无服务器,刚刚买的电信卡怎么不能用说什么只限紧急呼叫
  16. iredmail邮件服务器安装流程
  17. 你有哪些“相见恨晚”的UE4学习资料?
  18. PyTorch 模型训练实用教程(六):监控模型——可视化
  19. 海思开发板实用技巧集
  20. 编辑器进化 VSCode + Vim

热门文章

  1. 【文本挖掘】反欺诈模糊匹配
  2. 做好信贷业务必须了解这八大问题!
  3. 砸钱抢人抢项目,腾讯字节血拼游戏
  4. Docker 命令终极教程:8步走
  5. 研究38位知名CEO的邮件后,我们有这9个发现
  6. Algorithms_基础数据结构(03)_线性表之链表_双向链表
  7. cutterman 导出html,电脑中如何使用cutterman插件
  8. 学习笔记Hadoop(十四)—— MapReduce开发入门(2)—— MapReduce API介绍、MapReduce实例
  9. linux里hba状态_在Linux/Unix平台查看HBA卡的WWN号 和状态
  10. python 用一个数组实现三个栈