String的基本特性

string:字符串,使用一对""引起来表示。

String s1 = “”; //字面量的定义方式
String s2 = new String(“Hello”);·

string声明为final的,不可被继承

string实现了serializable接口:表示字符串是支持序列化的。

实现了Comparable接口:表示string可以比较大小

string在jdk8及以前内部定义了final char[ ] value用于存储字符串数据。jdk9时改为byte [ ]

String在jdk9中存储结构变更


结论:
String 再也不用char[]来存储啦,改成了byte[]加上编码标记,节约了一些空间。
那StringBuffer和 StringBuilder是否仍无动于衷呢?

String 的不可变性

string:代表不可变的字符序列。简称:不可变性。

当对字符串重新赋值时,需要重写指定内存区域赋值,不能使用原有的value进行赋值。

当对现有的字符串进行连接操作时,也需要重新指定内存区域赋值,不能使用原有的value进行赋值。

当调用string的replace ()方法修改指定字符或字符串时,也需要重新指定内存区域赋值,不能使用原有的value进行赋值。

通过字面量的方式(区别于new)给一个字符串赋值,此时的字符串值声明在字符串常量池中。

笔试案列

package com.fs.str;/*** 笔试题*/
public class StringDemo {String str = new String("good");char[] ch = {'t', 'e', 's', 't'};public static void main(String[] args) {StringDemo ex = new StringDemo();
//        ex.change(ex.str, ex.ch);String s = ex.changeString(ex.str, ex.ch);System.out.println(ex.str);//goodSystem.out.println(ex.ch);//bestSystem.out.println(s);//test ok}public void change(String str, char ch[]) {str = "test ok";ch[0] = 'b';}public String changeString(String str, char ch[]) {str = "test ok";ch[0] = 'b';return str;}
}

字符串常量池中是不会存储相同内容的字符串的。

String的string Pool是一个固定大小的Hashtable,默认值大小长度是1009。如果放进string Pool的string非常多,就会造成Hash冲突严重,从而导致链表会很长,而链表长了后直接会造成的影响就是当调string.intern时性能会大幅下降。

使用-xx :StringTablesize可设置stringTable的长度

在jdk6中stringTable是固定的,就是1009的长度,所以如果常量池中的字符串过多就会导致效率下降很快。StringTablesize设置没有要求

在jdk7中,stringTable的长度默认值是60013

在jdk8中,stringTable的长度默认值是60013,1009是可设置的最小值。

代码案列 jdk8查看stringTable的长度默认值

package com.fs.str;public class StringDemo02 {public static void main(String[] args) {System.out.println("jps  jinfo -flag StringTableSize pid");try {Thread.sleep(100000);} catch (InterruptedException e) {e.printStackTrace();}}
}

由案列的jdk8默认值为60013,可设置参数-xx :StringTablesize 10000执行修改大小,jdk8最小值为1009

-xx :StringTablesize 100执行修改大小,jdk8最小值为1009

String的内存分配

在Java语言中有8种基本数据类型和一种比较特殊的类型string。这些类型为了使它们在运行过程中速度更快、更节省内存,都提供了一种常量池的概念。

常量池就类似一个Java系统级别提供的缓存。8种基本数据类型的常量池都是系统协调的,String类型的常量池比较特殊。它的主要使用方法有两种。

直接使用双引号声明出来的string对象会直接存储在常量池中。
比如:string info = “xiaofu.com”;

如果不是用双引号声明的string对象,可以使用string提供的intern ()方法。这个后面重点谈

Java 6及以前,字符串常量池存放在永久代。

Java 7 中 oracle 的工程师对字符串池的逻辑做了很大的改变,即将字符串常量池的位置调整到Java堆内。

所有的字符串都保存在堆(Heap)中,和其他普通对象一样,这样可以让你在进行调优应用时仅需要调整堆大小就可以了。

字符串常量池概念原本使用得比较多,但是这个改动使得我们有足够的理由让我们重新考虑在Java 7 中使用string.intern ( )。

Java8元空间,字符串常量在堆

jdk6

jdk7

jdk8

String的基本操作

操作1

Java语言规范里要求完全相同的字符串字面量,应该包含同样的Unicode字符序列(包含同一份码点序列的常量),并且必须是指向同一个string类实例。

操作2 虚拟机官方案列


字符串拼接操作

1.常量与常量的拼接结果在常量池,原理是编译期优化
2.常量池中不会存在相同内容的常量。
3.只要其中有一个是变量,结果就在堆中。变量拼接的原理是stringBuilder
4.如果拼接的结果调用intern()方法,则主动将常量池中还没有的字符串对象放入池中,并返回此对象地址。

案列1

常量与常量的拼接结果在常量池,原理是编译期优化
常量池中不会存在相同内容的常量。


案列2

只要其中有一个是变量,结果就在堆中。变量拼接的原理是stringBuilder

如果拼接的结果调用intern()方法,则主动将常量池中还没有的字符串对象放入池中,并返回此对象地址。

如果拼接符号的前后出现了变量,则相当于在堆空间中new String(),具体的内容为拼接的结果。

案列3

如下的s1 + s2的执行细节:
StringBuilder s = new StringBuilder( );
s.append(“a”)
s.append(“b”)
s.tostring( ) —> 约等于 new String(“ab”)

补充:在jdk5.0之后使用的是StringBuilder,在jdk5.0之前使用的是StringBuffer

案列4

字符串拼接操作不一定使用的是stringBuilder
如果拼接符号左右两边都是字符串常量或常量引用,则仍然使用编译期优化,即非stringBuilder的方式。

被final修饰的变量就是常量了

案列5 体验字符串拼接速度

体会执行效率:通过stringBuilder的append()的方式添加字符串的效率要远高于使用string的字符串拼接方式

详情:

stringBuilder的append()的方式:自始至终中只创建过一个StringBuilder的对象
使用string的字符串拼接方式:创建过多个stringBuilder和String的对象
使用strinq的字符串拼接方式:内存中由于创建了较多的StringBuilder和Strinq的对象,内存占用更大;GC也会需要时间

改进空间:
在实际开发中,如果基本确定要前前后后添加的字符串长度不高于某个限定值highLevel的情况下,建议使用如下构造器实例化:stringBuilder s = new stringBuiLder(highLevel) ;//new char[ highLevel]

intern()的使用


如果不是用双引号声明的string对象,可以使用string提供的intern方法:intern方法会从字符串常量池中查询当前字符串是否存在,若不存在就会将当前字符串放入常量池中。

比如:string myInfo = new string (“I love xiaofu” ).intern() ;

也就是说,如果在任意字符串上调用string.intern方法,那么其返回结果所指向的那个类实例,必须和直接以常量形式出现的字符串实例完全相同。因此,下列表达式的值必定是true:

( “a” + “b” + “c” ) .intern ( ) == “abc”

通俗点讲,Interned string就是确保字符串在内存里只有一份拷贝,这样可以节约内存空间,加快字符串操作任务的执行速度。注意,这个值会被存放在字符串内部池( String Intern Pool) 。

如何保证变量s指向的是字符串常量池中的数据呢?有两种方式:

方式一:String s = “fs”;//字面量定义的方式

方式二:String s = new string( “fs” ).intern( );
String s = new StringBuilder( “fs”).toString( ).intern();
无论前面怎么拼接或者怎样,只要后面调用.intern()方法就是直接只想字符串常量池

关于intern面试题

题一

题目: new String ( “ab”)会创建几个对象?

答案:两个对象
一个对象是: new关键字在堆空间创建的
另一个对象是:字符串常量池中的对象。字节码指令: ldc

题二

拓展: new String ( “a”’) +new String ( “b”)呢?

答案:五个对象
对象1: new StringBuilder( )
对象2:new String( “a” )
对象3:常量池中的"a"
对象4:new String( “b”)
对象5:常量池中的"b"

实际深究还不止5个对象
深入剖析:StringBuilder的toString( ) :

对象6 : new String( “ab”)
注意:toString()调用,在字符串常量池中,没有生成"ab" 因为StringBuilder的toString方法是没有ldc的

题三 关于 jdk6 与 jdk7/8 的String

代码解释

package com.fs.str;public class StringDemo03 {public static void main(String[] args) {String s = new String("1");s.intern();//调用此方法之前,字符串常量池中已经存在了"1"String s2 = "1";System.out.println(s == s2);//jdk6: false   | jdk7/8: false  这里为false的原因是 s 为堆空间的地址,s2为常量池中的地址String s3 = new String("1") + new String("1");//s3 的地址记录变量的地址为:new String("11"),理由题目二已经解释//执行上面的代码后 字符串常量池中是否有"11"吗? 答案是:不存在,理由题目二已经解释s3.intern();//在字符串常量池中生成"11"/*15行的s3.intern();代码怎么理解?jdk6:创建了一个新的对象"11",也就有新的地址jdk7/8:因为常量池放在堆当中了,调用intern()方法的时候,常量池中并没有创建一个新"11",而是常量池指向的是堆中的newString("11")的地址归根结底的原因就是因为jdk6的常量池在永久代中,而jdk7/8常量池在堆空间中*/String s4 = "11";//使用的上一行 intern代码执行后在常量池生成的"11"的地址值System.out.println(s3 == s4);//jdk6: false  | jdk7/8: true//那么为什么jdk7/8是true呢? s3为堆地址 s4是常量池地址}}

图解题三 jdk6

图解题三 jdk7/8

题目三的拓展

package com.fs.str;public class StringDemo04 {public static void main(String[] args) {String s3 = new String("1") + new String("1");//s3 在堆内存中String s4 = "11";//s4 在常量池中String s5 = s3.intern();//去常量池发现有"11" 所以就不会干什么事,不会讲s3的"11"地址指向常量池中,所以s4的地址不变 s3的地址不变 所以是false//使用s5来接收的话,意思就去常量池发现有"11"那么就将s4的堆内存中的"11"的地址指向s5,那么就是trueSystem.out.println(s3 == s4);//jdk7/8: falseSystem.out.println(s5 == s4);//jdk7/8: true}}

题目四 图解

题目五


答案:
注释第一行 true
解释:因为s1的"11"没有在常量池中,那么s1.inter就会将s1堆内存中的"11"指向常量池,那么s2就是s1的地址值

注释第二行 false
解释:因为new String(“11”)的"11"是在常量池中,s1.intern就发现常量池中有,就不做处理,s1的地址又是堆内存中的,而s2的地址又是常量池的,所以就false

总结string的intern ( )的使用:

.jdk1.6中,将这个字符串对象尝试放入串池。

如果串池中有,则并不会放入。返回已有的串池中的对象的地址
如果没有,会把此对象复制一份,放入串池,并返回串池中的对象地址

.Jdk1.7起,将这个字符串对象尝试放入串池。

如果串池中有,则并不会放入。返回已有的串池中的对象的地址
如果没有,则会把对象的引用地址复制一份,放入串池,并返回串池中的引用地址

intern)的效率测试︰空间角度

结论:对于程序中大量存在存在的字符串,尤其其中存在很多重复字符串时,使用intern()可以节省内存空间。

大的网站平台,需要内存中存储大量的字符串。比如社交网站,很多人都存储:北京市、海淀区等信息。这时候如果字符串都调用intern ()方法,就会明显降低内存的大小。

StringTable的垃圾回收


G1中的String去重操作

官方描述

不是去重字符串常量池,因为字符串常量池本身就不存在重复字符串,而是去重堆空间中的char[]


背景:对许多Java应用(有大的也有小的)做的测试得出以下结果:

堆存活数据集合里面string对象占了25%
堆存活数据集合里面重复的string对象有13.5%
string对象的平均长度是45

许多大规模的Java应用的瓶颈在于内存,测试表明,在这些类型的应用里面,Java堆中存活的数据集合差不多25%是string对象。更进一步,这里面差不多一半string对象是重复的,重复的意思是说:
stringl.equals (string2) =true。堆上存在重复的string对象必然是一种内存的浪费。这个项目将在G1垃圾收集器中实现自动持续对重复的string对象进行去重,这样就能避免浪费内存。

G1中的String去重操作实现步骤

当垃圾收集器工作的时候,会访问堆上存活的对象。对每一个访问的对象都会检查是否是候选的要去重的string对象。

如果是,把这个对象的一个引用插入到队列中等待后续的处理。一个去重的线程在后台运行,处理这个队列。处理队列的一个元素意味着从队列删除这个元素,然后尝试去重它引用的string对象。

使用一个hashtable来记录所有的被string对象使用的不重复的char数组。当去重的时候,会查这个hashtable,来看堆上是否已经存在一个一模一样的char数组。

如果存在,string对象会被调整引用那个数组,释放对原来的数组的引用,最终会被垃圾收集器回收掉。

如果查找失败,char数组会被插入到hashtable,这样以后的时候就可以共享这个数组了。

命令行选项

UsestringDeduplication (bool):开启string去重,默认是不开启的,需要手动开启。

PrintstringDeduplicationStatistics (bool):打印详细的去重统计信息

StringDeduplicationAgeThreshold (uintx):达到这个年龄的string对象被认为是去重的候选对象

JVM学习笔记之-StringTable String的基本特性,内存分配,基本操作,拼接操作,intern()的使用,垃圾回收 ,G1中的String去重操作相关推荐

  1. jvm学习笔记(3)——java对象的内存分配和对象的回收(GC)

    引言: 之前的文章已经提过,java对象实例是存放在堆上的,至于是在伊甸区.存活区还是老年区,这些都是从对象回收(GC)角度来进行的逻辑划分.所以我们先说对象的回收(GC),然后再依据GC的策略来说明 ...

  2. JVM学习笔记之StringTable

    目录 背景 String基本特性 不可变性 值传递 String的内存分配 String的基本操作 字符串拼接操作 intern()的使用 StringTable的垃圾回收 G1中的String去重操 ...

  3. jvm学习笔记(2)——java对象的内存布局

    一.内存布局: 一个java对象在内存中可分为3个区域:对象头(Header).实例数据(Instance Data).对齐填充(Padding). 对象头(两部分): 对象自身运行时的数据.如哈希码 ...

  4. JVM学习笔记(自用)

    JVM学习笔记(自用) 文章目录 JVM学习笔记(自用) 1.简介 2.程序计数器 3. 虚拟机栈 4. 方法区 5. 直接内存 6. 垃圾回收 Young Collection Young Coll ...

  5. JVM学习笔记汇总:结合尚硅谷宋红康老师视频教程及PPT

    JVM学习笔记汇总:结合尚硅谷宋红康老师视频教程及PPT 第一章:JVM虚拟机的介绍 1.1虚拟机的分类 虚拟机通常分为两类:系统虚拟机和程序虚机.其中,系统虚拟机是指完全对物理计算机的仿真,而程序虚 ...

  6. JVM学习笔记-03-类加载器及双亲委派机制

    JVM学习笔记-03-类加载器及双亲委派机制 文章目录 JVM学习笔记-03-类加载器及双亲委派机制 1. 类加载器 视频链接-最新JVM教程IDEA版[Java面试速补篇]-03-类加载器及双亲委派 ...

  7. JVM学习笔记(Ⅰ):Class类文件结构解析(带你读懂Java字节码,这一篇就够了)

    JVM学习笔记(Ⅰ):Class类文件结构解析,带你读懂Java字节码 前言:本文属于博主个人的学习笔记,博主也是小白.如果有不对的地方希望各位帮忙指出.本文主要还是我的学习总结,因为网上的一些知识分 ...

  8. JVM学习笔记之GUI监控工具

    目录 背景 jConsole 本地连接:连接本地计算机一个正在运行的JVM进程 远程连接:连接JMX代理 高级连接:使用特殊的URL连接JMX代理 VisualVM 插件安装 连接方式 本地连接:连接 ...

  9. JVM学习笔记(四)------内存调优

    首先需要注意的是在对JVM内存调优的时候不能只看操作系统级别Java进程所占用的内存,这个数值不能准确的反应堆内存的真实占用情况,因为GC过后这个值是不会变化的,因此内存调优的时候要更多地使用JDK提 ...

最新文章

  1. 单片机编程好学吗?单片机初学者怎样看懂代码?
  2. python web shell
  3. 动态新增元素的js无效的解决方法
  4. hashtable——散列表
  5. window10 mysql5.7 解压版 安装
  6. 项目落地才是硬道理!TensorFlow 2 牛了
  7. Git最全操作流程,抓紧收藏吧朋友,真实用
  8. linux 驱动 printk 输出变量格式
  9. android非法字符的判定、表情符号的判定
  10. 思科 命令 TFTP
  11. 彻底拿下QSPI双闪存W25Q256| STM32H750| QSPI 双FLASH |cubeIDE |下载算法(二)
  12. 相机的成像原理: 针孔相机, 胶卷相机 和 数码相机
  13. 怎么看vray渲染进度_3dmax渲染怎么看渲染时间
  14. 算法之BFS算法框架
  15. Android编程获取图片和视频缩略图的方法(图片压缩)
  16. echarts实现立体柱状图
  17. html5 黑色圆圈,html5使用canvas画空心圆与实心圆_html5教程技巧
  18. 为 windows cmd 设置代理
  19. 成为研究生后你都明白了什么?
  20. 第三方android 模拟器哪个好用吗,安卓模拟器哪个好 哪个电脑安卓模拟器好用...

热门文章

  1. python发人人状态
  2. 一段始终保持在最底部的div css代码
  3. React 之 高阶组件的理解
  4. yum 的 group的信息
  5. SharePoint开发 - Excel数据导入到SharePoint自定义列表(数据视图方式)
  6. STL之Iterator(迭代器)
  7. 跟小静读《jQuery权威指南》——目录
  8. android有错.怎么办
  9. Ext4核心组件Grid的变化及学习(3):可编辑的grid
  10. (转)百度文库浏览器分析及实现(续)