这两天抽时间又总结/整理了一下各种编码的实际编码方式,和在Java应用中的使用情况,在这里记录下来以便日后参考。
为了构成一个完整的对文字编码的认识和深入把握,以便处理在Java开发过程中遇到的各种问题,特别是乱码问题,我觉得组成一个系列来描述和分析更好一些,包括三篇文章:
第一篇:JAVA字符编码系列一:Unicode,GBK,GB2312,UTF-8概念基础
第二篇:JAVA字符编码系列二:Unicode,ISO-8859,GBK,UTF-8编码及相互转换
第三篇:JAVA字符编码系列三:Java应用中的编码问题
第一篇:JAVA字符编码系列一:Unicode,GBK,GB2312,UTF-8概念基础
本部分采用重用,转载一篇文章来完成这部分的目标。
来源:holen'blog   对字符编码与Unicode,ISO 10646,UCS,UTF8,UTF16,GBK,GB2312的理解
地址:http://blog.donews.com/holen/archive/2004/11/30/188182.aspx
Unicode:

unicode.org制定的编码机制, 要将全世界常用文字都函括进去.
在1.0中是16位编码, 由U+0000到U+FFFF. 每个2byte码对应一个字符; 在2.0开始抛弃了16位限制, 原来的16位作为基本位平面, 另外增加了16个位平面, 相当于20位编码, 编码范围0到0x10FFFF.

UCS:

ISO制定的ISO10646标准所定义的 Universal Character Set, 采用4byte编码.

Unicode与UCS的关系:

ISO与unicode.org是两个不同的组织, 因此最初制定了不同的标准; 但自从unicode2.0开始, unicode采用了与ISO 10646-1相同的字库和字码, ISO也承诺ISO10646将不会给超出0x10FFFF的UCS-4编码赋值, 使得两者保持一致.

UCS的编码方式:

【JAVA编码专题】JAVA字符编码系列一:Unicode,GBK,GB2312,UTF-8概念基础相关推荐

  1. 【转】刨根究底字符编码之九——字符编码方案的演变与字节序

    字符编码方案的演变与字节序 一.字符编码方案的演变 1. 根据前面的介绍,对于字符编码方案的演变,我们大致上可简单地划分为三个阶段: ① ASCII编码方案阶段 → ② ANSI编码方案阶段 → ③ ...

  2. php 删除mysql 返回_php 返回mysql字符编码与删除字符编码

    php 返回mysql字符编码与删除字符编码 function Ebak_GetSetChar($char){ global $empire; if(empty($char)) { return '' ...

  3. java字符编码问题_JAVA字符编码系列三:Java应用中的编码问题

    1. 概述 本文主要包括以下几个方面:编码基本知识,java,系统软件,url,工具软件等. 在下面的描述中,将以"中文"两个字为例,经查表可以知道其GB2312编码是" ...

  4. java ucs 2,【字符编码系列】JavaScript使用的编码-UCS-2

    写在前面的话 本文属于 字符编码系列文章之一,更多请前往 字符编码系列. 在JavaScrip中,进行一些GBK或者UTF-8编码的字符操作时,打印出来的经常是乱码,其原因就是因为JavaScript ...

  5. java学习笔记:常见字符编码和编码头BOM

    ANSI (American National Standards Institute,美国国家标准学会) ANSI编码标准是指所有从基本ASCII码基础上发展起来的编码标准, 比如扩展的ASCII码 ...

  6. java字符编码采用_JAVA字符编码三:Java应用中的编码问题

    1. 概述 本文主要包括以下几个方面:编码基本知识,java,系统软件,url,工具软件等. 在下面的描述中,将以"中文"两个字为例,经查表可以知道其GB2312编码是" ...

  7. java utf8转iso8859-1_Java字符编码处理(UTF-8/ISO-8859-1)之一 –读文本文件乱码问题 | 学步园...

    Java字符编码处理(UTF-8/ISO-8859-1) 之一  -- 读文本文件乱码问题 当我们用java.io.Properties的load()方法读属性文件,一般会将字符编码成ISO-8859 ...

  8. Java——I/O(字符编码、内存流、打印流、System、输入流、序列化)

    目录 1.常见的编码 2.乱码产生原因 3.内存流 3.1 分类 3.2应用 4.打印流 4.1 自定义打印流 4.2 系统提供的打印流 4.3 格式化输出 5.System对I/O的支持 6.两种输 ...

  9. Java工具类-转换字符编码

    package common; /***字符串处理公用类 */ public class DealString {/*** 转换字符编码 由"iso-8859-1"西文转换为简体中 ...

最新文章

  1. C语言打印100-200之间的素数
  2. python培训班学费-南京Python培训班学费贵吗怎么收费
  3. C语言中最常用标准库
  4. LAMP环境中如何重新部署一个Yii2.0 web项目
  5. 日期setMinutes()方法以及JavaScript中的示例
  6. 如何将文件二进制传输至aix服务器,有什么办法把文件从WINDOWS系统中传到AIX中?...
  7. 【转贴】gdb中的信号(signal)相关调试技巧
  8. sql2012 ssrs_您必须在SQL Server Reporting Services(SSRS)中记录的十件事
  9. 【半原创】将js和css文件装入localStorage加速程序执行
  10. codesys编程_明晚20:00,CODESYS教您制作可编程控制器
  11. mt2503 用Dct tool打开codegen.dws提示版本 不match
  12. 我们开发中常用的常用浏览器常用插件,比如FeHelper,React Developer Tools, Vue Devtools,沙拉查词,Infinity,OneTab,AdGuard等
  13. 从4G到5G,从物联网到云计算 通信的下一个引爆点在哪里?
  14. kill 和 kill -9 的区别
  15. 基于B/S的校园餐厅网上订餐系统
  16. Gson解析异常com.google.gson.JsonSyntaxException: java.lang.IllegalStateException: Expected BEGIN解决方案
  17. java孙膑与庞涓_鬼谷子数问题的JAVA实现
  18. 随机信号的功率谱密度
  19. 网络3共享网络2计算机打印机,两台电脑如何共享打印机
  20. ts无损剪辑合并_[Windows] 音视频剪辑大师各位注意身体

热门文章

  1. [leetcode] 337.打家劫舍3
  2. LinkedBlockingQueue的put,take方法
  3. java aio为什么不稳定_烯醇式结构为什么不稳定?
  4. 自动图片轮播php源码,js图片自动轮播代码分享(js图片轮播)
  5. Shell脚本函数(函数传参、递归、创建库)
  6. java写 IP十进制转变_java实现ip地址与十进制数相互转换
  7. 加分二叉树 java_P1040 加分二叉树
  8. linux笔记之 搭建本地yum源,网卡的基本操作
  9. linux mysql dns_Linux下搭建DNS服务器及踩坑
  10. 弱网测试用什么农_为什么用木蜡油做的家具,用甲醛测试仪测试会显示甲醛超标?...