什么是GB18030编码?
GB 18030,全称《信息技术 中文编码字符集》,是中华人民共和国国家标准所规定的变长多字节字符集。其对GB 2312-1980完全向后兼容,与GBK基本向后兼容,并支持Unicode(GB 13000)的所有码位。GB 18030共收录汉字70,244个。
中文名
信息技术 中文编码字符集
外文名
GB 18030
学科类别
计算机
发布日期
2000-3-17;2005-11-8
发布机构
国家质量技术监督局
范 围
共收录汉字70,244个
目录
- 1 GB 18030的特点
- 2 概念简介
- 3 标准要求
- 4 Unicode支持
- 5 字节结构
- 6 版本
- 7 版本区别
- 8 适用范围
- 9 达到要求
- 10 总体结构
- 11 字汇
- 12 汉字
- 13 版本变化
- 14 制定标准
- 15 标准历程
GB 18030的特点
采用变长多字节编码,每个字可以由1个、2个或4个字节组成。
编码空间庞大,最多可定义161万个字符。
完全支持Unicode,无需动用造字区即可支持中国国内少数民族文字、中日韩和繁体汉字以及emoji等字符。
GB 18030在微软视窗系统中的代码页为54936。
概念简介
编辑
国家标准GB18030-2000《信息交换用汉字编码字符集基本集的补充》是我国继GB2312-1980和GB13000-1993之后最重要的汉字编码标准,是我国计算机系统必须遵循的基础性标准之一。
GB18030-2000编码标准是由信息产业部和国家质量技术监督局在2000年 3月17日联合发布的,并且将作为一项国家标准在2001年的1月正式强制执行。
GB18030-2005《信息技术中文编码字符集》是我国制订的以汉字为主并包含多种我国少数民族文字(如藏、蒙古、傣、彝、朝鲜、维吾尔文等)的超大型中文编码字符集强制性标准,其中收入汉字70000余个。 [2]
标准要求
编辑
GB 18030 的当前版本为 GB 18030-2005。现行版本为国家质量监督检验总局和中国国家标准化管理委员会于2005年11月8日发布,2006年5月1日实施;是在GB18030-2000基础上增加了CJK统一汉字扩充B的汉字。 本规格的初版“GB 18030-2000《信息技术 信息交换用汉字编码字符集 基本集的扩充》”是由中华人民共和国信息产业部电子工业标准化研究所起草,由国家质量技术监督局于2000年3月17日发布。在GBK基础上增加了CJK统一汉字扩充A的汉字。
此标准内的单字节编码部分、双字节编码部分,和四字节编码部分收录的少数中日韩统一表意文字扩展A区汉字,为强制性标准。其他部分则属于规模性标准。在中华人民共和国境内所有软件产品,都需要支持这个同时包含单字节、双字节和四字节编码的规格。
Unicode支持
编辑
GB 18030在其标准中以码表形式定义了除去代理对外的全部Unicode码位的定义,因此算得上是一种Unicode的变换格式(UTF)。由于GB 18030基本上是绕开已分配的码点去指定需要对应的Unicode,其变换和UTF-8相比要复杂得多。在日常实现上,常常会直接使用一个偏移量表 [3] 。
GB 18030—2005与GB18030—2000、GBK相比,去除了很多原来映射在PUA中的编码。后来剩余的24个PUA码位也在Unicode 4.1中加上,如下所示。
GB 字节串 |
Unicode 码位 |
||
---|---|---|---|
GBK 1.0 |
GB 18030-2005 |
Unicode 4.1 |
|
A6D9 |
E78D () |
FE10 (︐) |
|
A6DA |
E78E () |
FE12 (︒) |
|
A6DB |
E78F () |
FE11 (︑) |
|
A6DC |
E790 () |
FE13 (︓) |
|
A6DD |
E791 () |
FE14 (︔) |
|
A6DE |
E792 () |
FE15 (︕) |
|
A6DF |
E793 () |
FE16 (︖) |
|
A6EC |
E794 () |
FE17 (︗) |
|
A6ED |
E795 () |
FE18 (︘) |
|
A6F3 |
E796 () |
FE19 (︙) |
|
A8BC |
E7C7 () |
1E3F (ḿ) |
1E3F (ḿ) |
A8BF |
E7C8 () |
01F9 (ǹ) |
01F9 (ǹ) |
A989 |
E7E7 () |
303E (〾) |
303E (〾) |
A98A |
E7E8 () |
2FF0 (⿰) |
2FF0 (⿰) |
A98B |
E7E9 () |
2FF1 (⿱) |
2FF1 (⿱) |
A98C |
E7EA () |
2FF2 (⿲) |
2FF2 (⿲) |
A98D |
E7EB () |
2FF3 (⿳) |
2FF3 (⿳) |
A98E |
E7EC () |
2FF4 (⿴) |
2FF4 (⿴) |
A98F |
E7ED () |
2FF5 (⿵) |
2FF5 (⿵) |
A990 |
E7EE () |
2FF6 (⿶) |
2FF6 (⿶) |
A991 |
E7EF () |
2FF7 (⿷) |
2FF7 (⿷) |
A992 |
E7F0 () |
2FF8 (⿸) |
2FF8 (⿸) |
A993 |
E7F1 () |
2FF9 (⿹) |
2FF9 (⿹) |
A994 |
E7F2 () |
2FFA (⿺) |
2FFA (⿺) |
A995 |
E7F3 () |
2FFB (⿻) |
2FFB (⿻) |
FE50 |
E815 () |
2E81 (⺁) |
2E81 (⺁) |
FE51 |
E816 () |
E816 () |
20087 ( 什么是GB18030编码?相关推荐
最新文章
热门文章 |