java文件读取德语乱码
今天在文件读取西欧国家的语言时,发现乱码,于是搜索了下,发现是编码格式的问题:
从维基百科中找到德语的乱码问题,上面这样说道:
乱码问题
由于德语的计算机编码为西欧语言,国际标准为ISO-8859-1,所以在使用GB系列或BIG5编码的中文系统(如常见的Windows系列)中用一些纯文本无法正确显示变音字符,必须将德文文字转换为Unicode编码才能在文字编辑工具中正常显示。特别是在使用默认GB2312的浏览器查看没有给出语言编码的德文网页时也会出现乱码。但在中文版的GNU/Linux中由于默认使用了UTF-8而避免了乱码。如果变音字符直接用GB系列或BIG5编码保存再次打开就会变成乱码。
德语譬如: Graubünden
于是代码段更改:
/*** format String Code* @param str* @return*/
private String FormatStringCode(String str){try {
str = new String(str.getBytes(), "ISO-8859-1");
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}return str;
}
解决了这个问题,为了防止下次遇到其他特殊字符的编码问题,于是稍做整理了下:
ISO 8859系列字符集
ISO 8859系列字符集是欧洲计算机制造商协会(ECMA)在上世纪80年代中期设计,并被国际标准化(ISO)组织采纳为国际标准。ISO 8859系列字符集目前有15个字符集,包括:
- ISO 8859-1 大部分的西欧语系,例如英文、法文、西班牙文和德文等(Latin-1)
- ISO 8859-2 大部分的中欧和东欧语系,例如捷克文、波兰文和匈牙利文等(Latin-2)
- ISO 8859-3 欧洲东南部和其它各种文字(Latin-3)
- ISO 8859-4 斯堪的那维亚和波罗的海语系(Latin-4)
- ISO 8859-5 拉丁文与斯拉夫文(俄文、保加利亚文等)
- ISO 8859-6 拉丁文与阿拉伯文
- ISO 8859-7 拉丁文与希腊文
- ISO 8859-8 拉丁文与希伯来文
- ISO 8859-9 为土耳其文修正的Latin-1(Latin-5)
- ISO 8859-10 拉普人、北欧与爱斯基摩人的文字(Latin-6)
- ISO 8859-11 拉丁文与泰文
- ISO 8859-13 波罗的海周边语系,例如拉脱维亚文等(Latin-7)
- ISO 8859-14 凯尔特文,例如盖尔文、威尔士文等(Latin-8)
- ISO 8859-15 改进的Latin-1,增加遗漏的法文、芬兰文字符和欧元符号(Latin-9)
- ISO 8859-16 罗马尼亚文(Latin-10)
其中缺少的编号12据说是为了预留给天城体梵文字母(Deva-nagari)的。印地文和尼泊尔文都使用了这种在七世纪形成的字母表。由于印度定义了自己的编码ISCII(Indian Script Code for Information Interchange),所以这个编号就未被使用。ISO 8859系列字符集都是单字节字符集,即只使用0x00-0xFF对字符编码。
Thanks,
wengel
java文件读取德语乱码相关推荐
- java 文件读取中文乱码_java文件读取时发生中文乱码怎么解决
java文件读取时发生中文乱码怎么解决 发布时间:2020-06-23 09:33:47 来源:亿速云 阅读:59 作者:Leah java文件读取时发生中文乱码怎么解决?这篇文章运用了实例代码展示, ...
- Java文件读取 中文乱码
1 字节流以及编码转换说明 String str = "中"; byte[] b_gbk =str.getBytes("GBK"); byte[] b_utf8 ...
- 火爆全网MySQL路线笔记!java文件读取中文乱码
正文 模块(Module).组件(Component).包(Package),这些概念对于我们技术同学并不陌生,但并不是所有人都能理解其要义. 深入理解之后,我才发现,其背后的深意是分类思维.而这种分 ...
- java 读取文件第一行代码,java文件读取。(单字节读取和按行读取读取)
评论 # re: java文件读取.(单字节读取和按行读取读取) 2008-10-06 15:16 隔叶黄莺 再简单也比不过 groovy 的这一行代码 text = new File("f ...
- java文件读取异常_关于Java:从文本文件读取会引发异常
因此,我使用了DataInputStream,FileInputStream,BufferInputStream,FileReader,BufferedReader,Scanner,将其命名. 它们都 ...
- win10完美解决cmd运行java文件出现中文乱码问题
在看反射课程研究编译静态加载类动态加载类的时候需要用命令行运行记事本写的java文件,出现中文乱码,如图 解决办法: 在命令行运行chcp 936
- JAVA文件读取和写入(内附简单的代码实现)
最近在测试链表.哈希表等数据结构的性能时,涉及到了文件的读取和写入操作.毕竟十万级的数据纯靠手动输入显然是不可能的.然后由于文件读取和写入格式的复杂性,导致JAVA中有很多不同功能的类,它们各自对应着 ...
- java文件读取与保存
文件读取与保存 Long startTime=System.currentTimeMillis();String jsonStr = "";try {File jsonFile = ...
- java文件乱码_java文件读取出现乱码解决方法
java读取文件出现乱码解决方法:(推荐:java视频教程) 1.首先将要读取的文本文件的编码格式设置为UTF-8 2.使用InputStreamReader类取读取文件,因为它的构造方法中可以指定字 ...
最新文章
- 2022斯坦福AI指数报告出炉!中国霸榜AI顶会,但引用量最低
- Yii Model中添加默认搜索条件
- Data Warehouse Hardware - DW硬件需求计算
- [SpringBoot2]Thymeleaf
- hazelcast入门教程_Hazelcast入门指南第4部分
- VS2008中V表结束标记的分析
- 39 CO配置-控制-产品成本控制-成本对象控制-实际成本核算/物料分类帐-激活评估范围的物料分类账
- Linux中的date、cal、bc三个简单命令
- Mybatis的数据库连接池
- 软件工程——成品展示
- 用计算机唱歌 丑八怪乐谱,抖音计算机乐谱有哪些?计算机歌曲乐谱汇总
- 802.1QCC TSN配置模型
- 用C语言播放mp3格式的音乐
- Android 图片虚化
- windows开启nfs_win7专业版怎么开启nfs_win7专业版启用nfs步骤
- border-color属性设置单边边框和综合四边边框颜色
- linux虚拟网卡卸载,virbr0虚拟网卡如何卸载?virbr0虚拟网卡的卸载方法
- 汤姆猫炫跑鸿蒙,汤姆猫炫跑最新版下载|汤姆猫炫跑新版本下载 安卓版 v1.4.0.470- 游娱下载站...
- 关于sp和unity近似的PBR的一篇国外文章
- 你可能不知道你已经被运营商劫持了
热门文章
- Http中Content-Type的详解
- 常熟理工学院计算机科学与技术嵌入式培养,严卫 - 常熟理工学院 - 计算机科学与工程学院...
- html下拉菜单隐藏属性,css修改selec下拉菜单样式
- cxf client
- 浪迹江湖, 绝情谷!
- 实战教你如何在短时间打造一个男性流量站
- Excel催化剂开源第49波-Excel与PowerBIDeskTop互通互联之第三篇
- 黑*头条_第4章_文章搜索前后端成形记 实名认证审核
- 2020年最新Java后端学习路线,鼓励所有想要踏入Java行业的初学者!
- 山东省两大经济圈一体化发展