在Java中,String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。表示在不同OS下,返回的东西不一样!

String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示,如

byte[] b_gbk = "中".getBytes("GBK");
byte[] b_utf8 = "中".getBytes("UTF-8");
byte[] b_iso88591 = "中".getBytes("ISO8859-1"); 

将分别返回“中”这个汉字在GBK、UTF-8和ISO8859-1编码下的byte数组表示,此时b_gbk的长度为2,b_utf8的长度为3,b_iso88591的长度为1。

而与getBytes相对的,可以通过new String(byte[], decode)的方式来还原这个“中”字时,这个new String(byte[], decode)实际是使用decode指定的编码来将byte[]解析成字符串。

String s_gbk = new String(b_gbk,"GBK");
String s_utf8 = new String(b_utf8,"UTF-8");
String s_iso88591 = new String(b_iso88591,"ISO8859-1"); 

通过打印s_gbk、s_utf8和s_iso88591,会发现,s_gbk和s_utf8都是“中”,而只有s_iso88591是一个不认识的字符,为什么使用ISO8859-1编码再组合之后,无法还原“中”字呢,其实原因很简单,因为ISO8859-1编码的编码表中,根本就没有包含汉字字符,当然也就无法通过"中".getBytes("ISO8859-1");来得到正确的“中”字在ISO8859-1中的编码值了,所以再通过new String()来还原就无从谈起了。

因此,通过String.getBytes(String decode)方法来得到byte[]时,一定要确定decode的编码表中确实存在String表示的码值,这样得到的byte[]数组才能正确被还原。

有时候,为了让中文字符适应某些特殊要求(如http header头要求其内容必须为iso8859-1编码),可能会通过将中文字符按照字节方式来编码的情况,如

String s_iso88591 = new String("中".getBytes("UTF-8"),"ISO8859-1");

这样得到的s_iso8859-1字符串实际是三个在 ISO8859-1中的字符,在将这些字符传递到目的地后,

目的地程序再通过相反的方式String s_utf8 = new String(s_iso88591.getBytes("ISO8859-1"),"UTF-8")来得到正确的中文汉字“中”。这样就既保证了遵守协议规定、也支持中文。

String.getBytes()相关推荐

  1. String.getBytes()和new String()

    在Java中,String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示,如 byte[] b_gbk = "中&q ...

  2. String.getBytes(Unicode)的疑问 以及 SHIFT-JIS编码范围

    String.getBytes(charsetName),这个方法很多人都用过,可是有没有试过temp.getBytes("Unicode");这样的用法,它的返回值很奇怪,第1和 ...

  3. String.length() 与 String.getBytes().length

    String.length() 返回字符串的字符个数,一个中文算一个字符: String.getBytes().length 返回字符串的字节长度,一个中文两个字节: String的getBytes( ...

  4. 关于String.getBytes()

    注:String.getBytes()依赖于系统编码,因为系统的默认编码是不可预知的,所以当项目转移到另一个系统时可能会出现错误,所以最好指定编码格式,如: // String.getBytes(&q ...

  5. 关于Java里面的String.getBytes()方法

    关于Java里面的String.getBytes()方法 Java里面的String类型的编码方式是Unicode,根据你项目字符串的编码方式无关,这是写死的.但是如果你jvm平台使用的是GBK编码方 ...

  6. Bytes.toBytes()和String.getBytes()的区别

    toBytes()方法是将参数使用UTF-8的编码格式转换成byte[], getBytes()是用读取file.encoding的编码格式,然后用读取的格式进行转换, 所以,getBytes转换的b ...

  7. string java getbytes_从 String.getBytes 理解 Java 编码和解码

    原码,补码,反码 因为原码,补码,反码比较简单,我这里粘贴一个例子进行展示. Unicode 和 UTF-8 的关系 Uincode 是一个字符集.它规定了我们使用到的字或符号的码点(code poi ...

  8. InputStream、OutputStream、String的相互转换(转)

    //1.字符串转inputStream String string; //...... InputStream is = new ByteArrayInputStream(string.getByte ...

  9. java String长度与varchar长度匹配理解(字符和字节长度理解)

    java String长度与varchar长度匹配理解(字符和字节长度理解) string中的length()长度,返回的是char的数量,每个char可以存储世界上任何类型的文字和字符,一个char ...

最新文章

  1. 【OpenCV 4开发详解】图像连通域分析
  2. 简单定制自己的Centos系统(第三版)
  3. Oracle打Patch报错Prerequisite check CheckActiveFilesAndExecutables failed.
  4. Mac+docker+flask
  5. muduo之mutex和condition
  6. sql,EXISTS用法
  7. artDialog对话框在PHP下的简单应用-artDialog弹出层篇
  8. java学习(149):字符输入流
  9. 易于使用的人工智能_通过AI使网络更易于访问
  10. solidworks今日制造插件_用SolidWorks设计齿轮,如何事半功倍,且听我说说
  11. html table的边框线怎么变圆角_实现CSS3中的border-radius(边框圆角)示例代码
  12. 初学FineReport(二)
  13. [论文阅读] Self-supervised Correction Learning for Semi-supervised Biomedical Image Segmentation
  14. egg风格 什么意思_egg框架学习笔记
  15. 360漏洞修复卡在正在安装的解决方法
  16. python_分水岭算法
  17. 入门级运动蓝牙耳机之好评之王!
  18. 微信婚恋相亲交友小程序
  19. 2022华为机试真题 C++ 实现【分苹果】
  20. 【观察】掘金医疗大数据,如何四两拨千斤?

热门文章

  1. 理财产品信息管理系统项目代码分享
  2. LocalDate的用法与String互转
  3. 佳明手表APP开发系列01——简单汉化英文版
  4. Mac系统下加速百度云下载(附软件)
  5. 1.tessent命令学习笔记
  6. Java实现日志数据的采集显示
  7. Python Selenium3.141+Win7(64位)+IEDriverServer(32位版本)+调用IE11卡死的解决
  8. 文本串加密和解密程序。一个文本串可用事先给定的字母映射表进行加密
  9. 台湾繁体字和大陆汉语转换
  10. 高仿新闻教程--新闻Item的布局复习(3)