String.getBytes()
在Java中,String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。表示在不同OS下,返回的东西不一样!
String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示,如
byte[] b_gbk = "中".getBytes("GBK");
byte[] b_utf8 = "中".getBytes("UTF-8");
byte[] b_iso88591 = "中".getBytes("ISO8859-1");
将分别返回“中”这个汉字在GBK、UTF-8和ISO8859-1编码下的byte数组表示,此时b_gbk的长度为2,b_utf8的长度为3,b_iso88591的长度为1。
而与getBytes相对的,可以通过new String(byte[], decode)的方式来还原这个“中”字时,这个new String(byte[], decode)实际是使用decode指定的编码来将byte[]解析成字符串。
String s_gbk = new String(b_gbk,"GBK");
String s_utf8 = new String(b_utf8,"UTF-8");
String s_iso88591 = new String(b_iso88591,"ISO8859-1");
通过打印s_gbk、s_utf8和s_iso88591,会发现,s_gbk和s_utf8都是“中”,而只有s_iso88591是一个不认识的字符,为什么使用ISO8859-1编码再组合之后,无法还原“中”字呢,其实原因很简单,因为ISO8859-1编码的编码表中,根本就没有包含汉字字符,当然也就无法通过"中".getBytes("ISO8859-1");来得到正确的“中”字在ISO8859-1中的编码值了,所以再通过new String()来还原就无从谈起了。
因此,通过String.getBytes(String decode)方法来得到byte[]时,一定要确定decode的编码表中确实存在String表示的码值,这样得到的byte[]数组才能正确被还原。
有时候,为了让中文字符适应某些特殊要求(如http header头要求其内容必须为iso8859-1编码),可能会通过将中文字符按照字节方式来编码的情况,如
String s_iso88591 = new String("中".getBytes("UTF-8"),"ISO8859-1");
这样得到的s_iso8859-1字符串实际是三个在 ISO8859-1中的字符,在将这些字符传递到目的地后,
目的地程序再通过相反的方式String s_utf8 = new String(s_iso88591.getBytes("ISO8859-1"),"UTF-8")来得到正确的中文汉字“中”。这样就既保证了遵守协议规定、也支持中文。
String.getBytes()相关推荐
- String.getBytes()和new String()
在Java中,String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示,如 byte[] b_gbk = "中&q ...
- String.getBytes(Unicode)的疑问 以及 SHIFT-JIS编码范围
String.getBytes(charsetName),这个方法很多人都用过,可是有没有试过temp.getBytes("Unicode");这样的用法,它的返回值很奇怪,第1和 ...
- String.length() 与 String.getBytes().length
String.length() 返回字符串的字符个数,一个中文算一个字符: String.getBytes().length 返回字符串的字节长度,一个中文两个字节: String的getBytes( ...
- 关于String.getBytes()
注:String.getBytes()依赖于系统编码,因为系统的默认编码是不可预知的,所以当项目转移到另一个系统时可能会出现错误,所以最好指定编码格式,如: // String.getBytes(&q ...
- 关于Java里面的String.getBytes()方法
关于Java里面的String.getBytes()方法 Java里面的String类型的编码方式是Unicode,根据你项目字符串的编码方式无关,这是写死的.但是如果你jvm平台使用的是GBK编码方 ...
- Bytes.toBytes()和String.getBytes()的区别
toBytes()方法是将参数使用UTF-8的编码格式转换成byte[], getBytes()是用读取file.encoding的编码格式,然后用读取的格式进行转换, 所以,getBytes转换的b ...
- string java getbytes_从 String.getBytes 理解 Java 编码和解码
原码,补码,反码 因为原码,补码,反码比较简单,我这里粘贴一个例子进行展示. Unicode 和 UTF-8 的关系 Uincode 是一个字符集.它规定了我们使用到的字或符号的码点(code poi ...
- InputStream、OutputStream、String的相互转换(转)
//1.字符串转inputStream String string; //...... InputStream is = new ByteArrayInputStream(string.getByte ...
- java String长度与varchar长度匹配理解(字符和字节长度理解)
java String长度与varchar长度匹配理解(字符和字节长度理解) string中的length()长度,返回的是char的数量,每个char可以存储世界上任何类型的文字和字符,一个char ...
最新文章
- 【OpenCV 4开发详解】图像连通域分析
- 简单定制自己的Centos系统(第三版)
- Oracle打Patch报错Prerequisite check CheckActiveFilesAndExecutables failed.
- Mac+docker+flask
- muduo之mutex和condition
- sql,EXISTS用法
- artDialog对话框在PHP下的简单应用-artDialog弹出层篇
- java学习(149):字符输入流
- 易于使用的人工智能_通过AI使网络更易于访问
- solidworks今日制造插件_用SolidWorks设计齿轮,如何事半功倍,且听我说说
- html table的边框线怎么变圆角_实现CSS3中的border-radius(边框圆角)示例代码
- 初学FineReport(二)
- [论文阅读] Self-supervised Correction Learning for Semi-supervised Biomedical Image Segmentation
- egg风格 什么意思_egg框架学习笔记
- 360漏洞修复卡在正在安装的解决方法
- python_分水岭算法
- 入门级运动蓝牙耳机之好评之王!
- 微信婚恋相亲交友小程序
- 2022华为机试真题 C++ 实现【分苹果】
- 【观察】掘金医疗大数据,如何四两拨千斤?