在Java中,String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示,如

byte[] b_gbk = "中".getBytes("GBK");
byte[] b_utf8 = "中".getBytes("UTF-8");
byte[] b_iso88591 = "中".getBytes("ISO8859-1");

将分别返回“中”这个汉字在GBK、UTF-8和ISO8859-1编码下的byte数组表示,此时b_gbk的长度为2,b_utf8的长度为3,b_iso88591的长度为1。

而与getBytes相对的,可以通过new String(byte[], decode)的方式来还原这个“中”字时,这个new String(byte[], decode)实际是使用decode指定的编码来将byte[]解析成字符串。

String s_gbk = new String(b_gbk,"GBK");
String s_utf8 = new String(b_utf8,"UTF-8");
String s_iso88591 = new String(b_iso88591,"ISO8859-1");

通过打印s_gbk、s_utf8和s_iso88591,会发现,s_gbk和s_utf8都是“中”,而只有s_iso88591是一个不认识的字符,为什么使用ISO8859-1编码再组合之后,无法还原“中”字呢,其实原因很简单,因为ISO8859-1编码的编码表中,根本就没有包含汉字字符,当然也就无法通过"中".getBytes("ISO8859-1");来得到正确的“中”字在ISO8859-1中的编码值了,所以再通过new String()来还原就无从谈起了。

因此,通过String.getBytes(String decode)方法来得到byte[]时,一定要确定decode的编码表中确实存在String表示的码值,这样得到的byte[]数组才能正确被还原。

有时候,为了让中文字符适应某些特殊要求(如http header头要求其内容必须为iso8859-1编码),可能会通过将中文字符按照字节方式来编码的情况,如

String s_iso88591 = new String("中".getBytes("UTF-8"),"ISO8859-1"),这样得到的s_iso8859-1字符串实际是三个在ISO8859-1中的字符,在将这些字符传递到目的地后,目的地程序再通过相反的方式String s_utf8 = new String(s_iso88591.getBytes("ISO8859-1"),"UTF-8")来得到正确的中文汉字“中”。这样就既保证了遵守协议规定、也支持中文。

String.getBytes()和new String()相关推荐

  1. String.getBytes(Unicode)的疑问 以及 SHIFT-JIS编码范围

    String.getBytes(charsetName),这个方法很多人都用过,可是有没有试过temp.getBytes("Unicode");这样的用法,它的返回值很奇怪,第1和 ...

  2. String.length() 与 String.getBytes().length

    String.length() 返回字符串的字符个数,一个中文算一个字符: String.getBytes().length 返回字符串的字节长度,一个中文两个字节: String的getBytes( ...

  3. String.getBytes()

    在Java中,String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组.表示在不同OS下,返回的东西不一样! String.getBytes(String decode)方法会 ...

  4. 关于String.getBytes()

    注:String.getBytes()依赖于系统编码,因为系统的默认编码是不可预知的,所以当项目转移到另一个系统时可能会出现错误,所以最好指定编码格式,如: // String.getBytes(&q ...

  5. 关于Java里面的String.getBytes()方法

    关于Java里面的String.getBytes()方法 Java里面的String类型的编码方式是Unicode,根据你项目字符串的编码方式无关,这是写死的.但是如果你jvm平台使用的是GBK编码方 ...

  6. java中string类_Java中String类浅谈

    1)String对象的初始化 由于String对象特别常用,所以在对String对象进行初始化时,Java提供了一种简化的特殊语法,格式如下:      String s = "abc&qu ...

  7. object string java_Object类和String类

    Object类 Object类是Java语言中的根类,即所有类的父类. equals方法 返回值类型为:boolean类型 用于比较两个对象是否相同,它其实就是使用两个对象的内存地址在比较. 例子: ...

  8. Java String API 常用的String方法详解

    标题 String类的特性 Java中String类的构造方法 String类的 intern() 注意还跟jdk有关 如何保证变量S指向的是字符串常量池中的数据呢? 关于String中 new St ...

  9. java string 字节_java中string究竟占多少字节

    以前学java基础的时候考虑过string占多少字节,百度后有人说一个汉字占两个字节,所以一个string的字节数是可变的,遇到一个汉字+2,遇到一个字母+1.笔者对此结论严重怀疑,一个string在 ...

最新文章

  1. 删除vsftp虚拟用户脚本
  2. css3宽度变大动画_学所 前端 | HTML5+CSS3
  3. AQS(CountdownLatch、CyclicBarrier、Semaphore)、FutureTask、BlockingQueue、ForkJoin
  4. Entity Framework 6 Alpha 3为Code First提供对存储过程支持,并提供连接恢复功能
  5. react 事件处理_在React中处理事件
  6. The absolute uri: http://java.sun.com/jsp/jstl/core cannot be resolved in either web.xml or the jar
  7. 输出指定范围内的完数
  8. 95-180-050-源码-Watermark-允许固定数量延迟的分配器(BoundedOutOfOrdernessTimestampExtractor)
  9. [转]Bootstrap table后端分页(ssm版)
  10. loj10147. 「一本通 5.1 例 1」石子合并
  11. python宽度优先搜索算法并输出路径
  12. C# DataTable 用法简介
  13. android 65536 简书,app编译打包时的65536问题
  14. 日语专业双学位选计算机,湖北师范大学计算机科学与技术(日语双学位)专业2015年在湖北理科高考录取最低分数线...
  15. Soft-Skills-software-developers-manual
  16. [主席树]HDOJ4417 Super Mario
  17. 【信号检测】基于matlab双稳随机共振微弱信号检测【含Matlab源码 1701期】
  18. SolidWorks基础操作笔记
  19. 硕士学位论文之wps页眉页脚
  20. 3D劲舞游戏 Dance Mixer 简体中文汉化版+常见问题(更新1.1补丁 汉化)

热门文章

  1. ThreadPoolExecuotor源码参考
  2. jquery实现倒计时
  3. 关于字符串排序的别的规则
  4. C#中窗体的close,dispose,以及application.exit()的区别
  5. 发现一个很不错的正则表达式生成器
  6. C#中转义字符[转]
  7. 自动生成 指定范围日期 生成字符串格式时间日期 --计算连续时间 SQL
  8. C++使用Windows API CreateMutex函数多线程编程
  9. DataBase Convert Class
  10. sqlserver 2008 多表更新