java在字符串中统一用Unicode表示。(推荐:java视频教程)

对于任意一个字符串:String string = “测试字符串”;

如果源文件是GBK编码,操作系统默认环境编码也为GBK,那么编译的时候,JVM将按照GBK编码将字节数组解析为字符,然后将字符转换为Unicode格式的字节数组,作为内部存储(字节数组→字符→Unicode字节数组)

当打印这个字符串时,JVM根据操作系统本地的语言环境,将Unicode转换为GBK,然后操作系统将GBK格式的内容显示出来。

当源码文件是UTF-8, 我们需要通知编译器源码的格式,javac -encoding utf-8 … , 编译时,JVM按照utf-8 解析成字符,然后转换为unicode格式的字节数组, 那么不论源码文件是什么格式,同样的字符串,最后得到的unicode字节数组是完全一致的,显示的时候,也是转成GBK来显示(跟OS环境有关)

乱码是如何产生的?

本质上都是由于字符串原本的编码格式与读取时解析用的编码格式不一致导致的。

乱码指的是程序显示出来的字符文本无法用任何语言去解读。一般情况下会包含大量的?。乱码问题是所有计算机用户或多或少会遇到的问题。

造成乱码的原因就是因为使用了错误的字符编码去解码字节流,因此当我们在思考任何跟文本显示有关的问题时,请时刻保持清醒:当前使用的字符编码是什么。只有这样,我们才能正确分析和处理乱码问题。

例如最常见的网页乱码问题。如果你是网站技术人员,遇到这样的问题,需要检查以下原因:

1、服务器返回的响应头Content-Type没有指明字符编码

2、网页内是否使用META HTTP-EQUIV标签指定了字符编码

3、网页文件本身存储时使用的字符编码和网页声明的字符编码是否一致

java代码中的乱码问题如何解决呢?

例如:String s = “测试字符串”;System.out.println( new String(s.getBytes(),"UTF-8"));

//错误,因为getBytes()默认使用GBK编码, 而解析时使用UTF-8编码,肯定出错。

其中getBytes()是将Unicode转换为操作系统默认格式的字节数组,即“测试字符串”的GBK格式,new String (bytes, Charset) 中的charset 是指定读取byte的方式,这里指定为UTF-8,即把bytes的内容当做UTF-8来读取。

如下两种方式得到的结果都是正确的,因为它们的源内容编码和解析用的编码是一致的。System.out.println( new String(s.getBytes(),"GBK"));

System.out.println( new String(s.getBytes("UTF-8"),"UTF-8"));

那么,如何利用getBytes 和 new String() 来进行编码转换呢?

网上流传着一种错误的方法:GBK--> UTF-8: new String( s.getBytes("GBK") , "UTF-8);

这种方式是完全错误的,因为getBytes 的编码与 UTF-8 不一致,肯定是乱码。

但是为什么在tomcat 下,使用 new String(s.getBytes(“iso-8859-1”) ,”GBK”) 却可以用呢?

答案是:

tomcat 默认使用iso-8859-1编码, 也就是说,如果原本字符串是GBK的,tomcat传输过程中,将GBK转成iso-8859-1了,默认情况下,使用iso-8859-1读取中文肯定是有问题的。

那么我们需要将iso-8859-1 再转成GBK, 而iso-8859-1 是单字节编码的,即他认为一个字节是一个字符, 那么这种转换不会对原来的字节数组做任何改变,因为字节数组本来就是由单个字节组成的。

如果之前用GBK编码,那么转成iso-8859-1后编码内容完全没变, 则 s.getBytes(“iso-8859-1”) 实际上还是原来GBK的编码内容则 new String(s.getBytes(“iso-8859-1”) ,”GBK”) 就可以正确解码了。 所以说这是一种巧合。

如何正确的将GBK转UTF-8 ?(实际上是unicode转UTF-8)//利用getBytes将unicode字符串转成UTF-8格式的字节数组,然后用utf-8 对这个字节数组解码成新的字符串

new String( s.getBytes("utf-8") , "utf-8");

UTF-8 转GBK原理也是一样

new String( s.getBytes("GBK") , "GBK");

其实核心工作都由getBytes(charset)做了。getBytes的JDK描述:Encoding this String into a sequence of bytes using the named charset,storing the result into a new byte array.OutputStreamWriter w1 = new OutputStreamWriter(new FileOutputStream("D:\\file1.txt"),"UTF-8");

InputStreamReader( stream, charset)

可以帮助我们轻松的按照指定编码读写文件。

附录:

HttpClient post请求中文乱码问题解决

最近接到现场同事反馈,在掉接口的过程中,厂家收到的请求报文中文是乱码的。我检查了版控的代码,找到如下解决办法:

原始代码(中文乱码):HttpPost httpPost = new HttpPost(url);

DefaultHttpClient httpClient = new DefaultHttpClient();

//请求头

httpPost.setHeader("Accept", MediaType.APPLICATION_JSON);

httpPost.setHeader("Content-Type", "application/json;charset=UTF-8");

//请求实体

StringEntity reqEntity = new StringEntity(reqStr);

httpPost.setEntity(reqEntity);

//获取响应

HttpResponse httpResp = httpClient.execute(httpPost);

HttpEntity respEntity = httpResp.getEntity();

解决办法:方法一:

//请求实体

HttpEntity reqEntity = new ByteArrayEntity(reqStr.getBytes("UTF-8"));

//StringEntity reqEntity = new StringEntity(reqStr);

httpPost.setEntity(reqEntity);

方法二:

//请求实体

StringEntity reqEntity = new StringEntity(reqStr,Charset.forName("UTF-8"));

httpPost.setEntity(reqEntity);

更多java知识请关注java基础教程栏目。

java中乱码产生的原因_java出现乱码的原因与解决方法详解相关推荐

  1. 计算机蓝屏代码0x000000ED,蓝屏代码0x000000ed的4大解决方法详解!蓝屏0x000000ed的原因和解决方法!...

    说到电脑问题,就不得不提蓝屏的问题.最近有位朋友的电脑开机的时候,并没有进入正常的启动程序,反而进入了蓝色界面,显示代码0x000000ed,不知道为什么会这样,也不知道如何去解决.下面就来看看蓝屏0 ...

  2. 第五人格服务器维修中怎么进,第五人格进不去怎么办 游戏进不去解决方法详解[多图]...

    第五人格开启测试已经有一段时间,许多玩家都会遇到各种问题,其中游戏进不去是让玩家最头痛的,今天安族小编来给大家介绍一下游戏进不去解决方法详解. 第五人格进不去解决方法 大家在玩的时候,肯定都会遇到卡顿 ...

  3. PS中色相饱合度/可选颜色/色彩平衡/曲线的区别和运用方法详解

    http://www.jb51.net/photoshop/374517.html PS中色相饱合度/可选颜色/色彩平衡/曲线的区别和运用方法详解 整体思路: 1.使用颜色混合模式营造照片基调. 2. ...

  4. 站长在线Python精讲:Python中集合的交集、并集、差集和对称差集运算方法详解

    欢迎你来到站长在线的站长学堂学习Python知识,本文学习的是<Python中集合的交集.并集.差集和对称差集运算方法详解>.主要讲的是集合运算的相关的概念,及运算方法,包括:集合的交集. ...

  5. java word 超链接到文档内部_Java 添加超链接到 Word 文档方法详解

    在Word文档中,超链接是指在特定文本或者图片中插入的能跳转到其他位置或网页的链接,它也是我们在编辑制作Word文档时广泛使用到的功能之一.今天这篇文章就将为大家演示如何使用Free Spire.Do ...

  6. java构造和解析json_Java构造和解析Json数据的两种方法详解一

    在www.json.org上公布了很多JAVA下的json构造和解析工具,其中org.json和json-lib比较简单,两者使用上差不多但还是有些区别.下面首先介绍用json-lib构造和解析Jso ...

  7. java中class.forname连接mysql数据库_数据库链接与 Class.forName()用法详解

    主要功能 Class.forName(xxx.xx.xx)返回的是一个类 Class.forName(xxx.xx.xx)的作用是要求JVM查找并加载指定的类, 也就是说JVM会执行该类的静态代码段 ...

  8. java 判断请求为 ajax请求_Java后台判断ajax请求及处理过程详解

    一.问题描述: 当访问一个需要登录的页面时,会有过滤器或者拦截器进行过滤拦截,如果用户没有登录,则跳转到登录页面. 当用户已经登录进入系统后,然后长时间没操作,等到session过期后,再点击一个aj ...

  9. js php 中文乱码怎么解决_探讨PHP JSON中文乱码的解决方法详解

    我们知道在使用Ajax技术与PHP后台交互时,中文乱码是常有的事,JSON作为与XML类似的数据交换格式,在PHP用来进行交互时也会出现中 文乱码的情况,解决PHP JSON中文乱码的方法思路其实与P ...

  10. java工程引用其他工程,Android工程:引用另一个Android工程的方法详解

    现在已经有了一个Android工程A.我们想扩展A的功能,但是不想在A的基础上做开发,于是新建了另外一个Android工程B,想在B中引用A. 一个思路是把工程A做成纯Jar包,这样其他的工程就可以直 ...

最新文章

  1. 5.7版本mysql操做语法_mysql-5.7.25安装及常用语法
  2. 用 GStreamer 简化 Linux 多媒体开发
  3. java解析getresponsebodyasstring_java读取网站内容的两种方法是什么呢?
  4. jenkins rec 分析 cve-2018-1000861 分析
  5. [译]5步实现Silverlight中的Command
  6. Kafka集成Spring-AcknowledgeMessageListener接口实现
  7. pom.xml报错:Failure to find org.apache.maven.doxia:doxia-logging-api:jar:1.1 in http://repo.
  8. priority_queue(优先队列)的简单构造与用法
  9. Windows10 部署 Sonarqube 代码质量管理平台
  10. 女人最想从男人那里得到什么?
  11. 网上订单管理-新增、修改
  12. 从《觉醒年代》看如何用Python来绘制可视化仪表盘
  13. day4-Python学习笔记(七)函数与模块
  14. 多域名环境,页面获取url的一种方案
  15. C语言程序设计谭浩强版 五
  16. 初识 Speex 语音压缩
  17. 五子棋AI第二篇 AB剪枝和启发搜索(Java)
  18. LaTex转word
  19. 小招喵跑步[java]
  20. 华为nova10和荣耀70哪个值得买 哪个性能更好

热门文章

  1. JS中时间戳(毫秒数)转换为标准时间日期
  2. 《PyInstaller打包实战指南》第十一节 其他进阶命令
  3. 戴维营教育ios笔试题一
  4. 四级选词填空必会30词
  5. oracle 数据备份 命令,Oracle备份常用命令
  6. PMP项目管理理论介绍
  7. 项目之删除评论、修改评论及架构--Kafka简介(14)
  8. 李弘毅机器学习笔记:第三章—Error的来源
  9. linux服务器实训心得体会,linux实训心得体会 linux实训总结与体会
  10. 简单的一键部署LNMP架构shell脚本