Java中文乱码破碎重组_Java 关于中文乱码问题的解决方案与经验
五、我们要对java的编译器有所了解:
Javac ?encoding
我们常常没有用到encoding这个参数。其实encoding这个参数对于跨平台的操作是很重要的。如果没有指定encoding,则按照系统的默认encoding,gb平台上是gb2312,英文平台上是iso8859_1。Java的编译器实际上是调用sun.tools.Javac.main的类,对文件进行编译,这个类有compile函数中间有一个encoding的变量,-encoding的参数其实直接传给encoding变量。编译器就是根据这个变量来读取Java文件的,然后把用utf-8形式编译成class文件。例子代码:
String str = "你";
FileWriter writer = new FileWriter("text.txt");
http://www.gaodaima.com/40345.htmlJava 关于中文乱码问题的解决方案与经验
write.write(str);
writer.close();
如果用gb2312编译,你会找到e4 bd a0的字段 ;
如果用8859_1编译, 00c4 00e3的二进制:
0000,0000 ,1100,0100 ,0000,0000 ,1110,0011
因为每个字符都大于7位,因此用11位编码:
1100,0001,1000,0100,1100,0011,1010,0011
c1-- 84-- c3-- a3
你会找到c1 84 c3 a3
但是我们往往忽略掉这个参数,因此这样往往会有跨平台的问题:
样例代码在中文平台上编译,生成zhclass
样例代码在英文平台上编译,输出enclass
(1) zhclass在中文平台上执行ok,但是在英文平台上不行
(2) enclass在英文平台上执行ok,但是在中文平台上不行
原因是:
(1) 在中文平台上编译后,其实str在运行态的char[]是0x4f60, 在中文平台上运行,filewriter的缺省编码是gb2312,因此chartobyteconverter会自动用调用gb2312的converter,把str转化成byte输入到fileoutputstream中,于是0xc4,0xe3放进了文件。但是如果是在英文平台下,chartobyteconverter的缺省值是8859_1, filewriter会自动调用8859_1去转化str,但是他无法解释,因此他会输出"?"
(2) 在英文平台上编译后,其实str在运行态的char[]是0x00c4 0x00e3, 在中文平台上运行,中文无法识别,因此会出现??;在英文平台上,0x00c4-->0xc4,0x00e3->0xe3,因此0xc4,0xe3被放进了文件。
六、其它原因:
设置浏览器的显示编码,如果response的数据是utf8编码,显示将是乱码,但是乱码和上述原因还不一样。
七、发生编码的地方:
1. 从数据库到Java程序 byte??〉char
2. 从Java程序到数据库 char??〉byte
3. 从文件到Java程序 byte??〉char
4. 从Java程序到文件 char??〉byte
5. 从Java程序到页面显示 char??〉byte
6. 从页面form提交数据到Java程序byte??〉char
7. 从流到Java程序byte??〉char
8. 从Java程序到流char??〉byte
可以使用配置过滤器的方法解决中文乱码的:
RequestFilter
net.golden.uirs.util.RequestFilter
charset
gb2312
RequestFilter
*.jsp
public void doFilter(ServletRequest req, ServletResponse res,
FilterChain fChain) throws IOException, ServletException {
HttpServletRequest request = (HttpServletRequest) req;
HttpServletResponse response = (HttpServletResponse) res;
HttpSession session = request.getSession();
String userId = (String) session.getAttribute("userid");
req.setCharacterEncoding(this.filterConfig.getInitParameter("charset"));
// 设置字符集?
实际上是设置了byte ??〉char的encoding
try {
if (userId == null || userId.equals("")) {
if (!request.getRequestURL().toString().matches(
".*/uirs/logon/logon(Controller){0,1}//x2Ejsp$")) {
session.invalidate();
response.sendRedirect(request.getContextPath() +
"/uirs/logon/logon.Jsp");
}
}
else {
// 看看是否具有信息上报系统的权限
if (!net.golden.uirs.util.UirsChecker.check(userId, "信息上报系统",
net.golden.uirs.util.UirsChecker.ACTION_DO)) {
if (!request.getRequestURL().toString().matches(
".*/uirs/logon/logon(Controller){0,1}//x2EJsp$")) {
response.sendRedirect(request.getContextPath() +
"/uirs/logon/logonController.Jsp");
}
}
}
}
catch (Exception ex) {
response.sendRedirect(request.getContextPath() +
"/uirs/logon/logon.Jsp");
}
fChain.doFilter(req, res);
}
欢迎大家阅读《Java 关于中文乱码问题的解决方案与经验》,跪求各位点评,若觉得好的话请收藏本文,by 搞代码
微信 赏一包辣条吧~
支付宝 赏一听可乐吧~
Java中文乱码破碎重组_Java 关于中文乱码问题的解决方案与经验相关推荐
- Java中文乱码破碎重组_总结彻底解决Spring MVC+Mybatis中文乱码问题
Java对于新手最容易出现的问题就是中文乱码的问题.今天我就来总结一下彻底解决Spring mvc+Mybatis中文乱码的方案. 首先要看打一断点看一下Controller接收到参数值是否正常.如果 ...
- java取字符串首字母_java 获取中文字符的首字母
原理: GB2312编码中的中文是按照拼音排序的 注意: 一些生僻的字无法获得正确的首字母,原因是这些字都是后加入的. import java.io.UnsupportedEncodingExcept ...
- java存入数据库是问号_Java插入中文到数据库中文变成问号解决
转自:https://blog.csdn.net/hellosweet1/article/details/81673152 之所以会出现乱码,就是编码方式不一致导致的 我们应该首先确定 1. ecli ...
- Java破碎重组_Java代码重组
随着我的小程序的进展,我有4个按钮是相同规则的规则,我不知道如何减少代码,我几乎可以肯定它可以简化: private void initGame(Quizz quizz) { jLabelScore ...
- Java计算文章多少字_java计算中文字数的代码实例
这篇文章主要介绍了java统计汉字字数的方法,结合实例形式分析了java正则判定.字符串遍历及统计相关操作技巧,需要的朋友可以参考下 本文实例讲述了java统计汉字字数的方法.分享给大家供大家参考,具 ...
- java中文名称是什么_Java的中文意思是什么?
展开全部 Java名词解释e69da5e6ba903231313335323631343130323136353331333231383336 Abstract class 抽象类:抽象类是不允许实例 ...
- java array 元素的位置_Java常见面试题 非常实用「个人经验」
Java 容器都有哪些 Collection 的子类 List.Set List 的子类 ArrayList.LinkedList等 Set 的子类 HashSet.TreeSet等 Map 的子类 ...
- java printstream 中文乱码_JAVA的中文字符乱码问题
JAVA的中文字符乱码问题一直很让人头疼.特别是在WEB应用中.网上的分析文章和解决方案都很多,但总是针对某些特定情况的.很多次遇到乱码问题后, 经过极为辛苦的调试和搜索资料后终于解决,满以为自己已经 ...
- java web应用 生僻字_Java Web项目中解决中文乱码方法总结
一.了解常识: 1.UTF-8国际编码,GBK中文编码.GBK包含GB2312,即如果通过GB2312编码后可以通过GBK解码,反之可能不成立; 2.web tomcat:默认是ISO8859-1,不 ...
最新文章
- 同源策略Same-origin policy
- java lombok 视频_Java开发神器Lombok使用详解
- [游泳] Sun Yang 1500 Swimming Stroke Analysis London 2012
- .NET Core 小程序开发零基础系列(2)——小程序服务通知(模板消息)
- 你们考试,我们都有点紧张呢…
- android webView 与 JS交互方式
- 项目周期一般多久_深圳app开发公司的软件开发要多久?
- Groovy新手教程
- XML入门经典(第4版)pdf
- python进阶11并发之七多种并发方式的效率测试
- mediacodec编解码少帧问题
- 酷派D530刷机指引之民间ROM
- python可以下载百度文库的文档_Python 文档
- 计算机科学之父图灵的一生
- max30102c语言程序,STM32驱动MAX30102源码
- 基于QT和DCMTK的Dicom 图像浏览器---收尾二
- 计算机教师结构化方式面试,“中学信息技术学科”题目如何答?教师资格结构化面试...
- 数据库系统的基本概念
- 高龄白菜java学习第101天(java数据结构和算法(19))
- arduino烧录esp8266出错:error: espcomm_upload_mem failed