http://iask.sina.com.cn/b/7837434.html?from=related

GBK中的“K”是扩展的意思,而GB2312中的“2312”以及GB18030中的“18030”是国家标准的代号,BIG5是港澳台地区的编码。
下面详细介绍一下字库情况,你就可看出其区别:
(一)GB2312-80字库
从1975年开始,我国为了研究汉字的使用频度,进行了大规模的字频统计工作,内容包括工业、农业、军事、科技、政治、经济、文学、艺术、教育、体育、医药卫生、天文地理、自然、化学、文字改革、考古等多方面的出版物,在数以亿计的浩翰文献资料中,统计出实际使用的不同的汉字数为6335个,而其中有 3000多个汉字的累计使用频度达到了99.9%,而另外的3000多个累计频度不到0.1%,说明了常用汉字与次常用汉字的数量不足7000个,这就为国家制定汉字库标准提供了依据。1980年颁布了《信息交换用汉字编码字符集--基本集》的国标交换码,国家标准号为:GB2312-80,选入了 6763个汉字,分为两级,一级字库中有3755个,是常用汉字,二级字库中有3008个,是次常用汉字;还选入了682个字符,包含有数字、一般符号、拉丁字母、日本假名、希腊字母、俄文字母、拼音符号、注音字母等。
(二)大字符集字库(又叫GBK字库)
国际标准化组织为了将世界各民族的文字进行统一编码,制定了UCS标准。根据这一标准,中、日、韩三国共同制定了《CJK统一汉字编码字符集》,其国际标准号为:ISO/IEC10646,国家标准号为:GB13000-90,该汉字编码字符集就是通常人们所说的大字符集,它编入了20902个汉字,收集了大陆一二级字库中的简体字,台湾《通用汉字标准交换码》中的繁体字,58个香港特别用字和92个延边地区朝鲜族“吏读”字,甚至涵盖了日文与韩文中的通用汉字,满足了方方面面的需要。Windows95/98/NT/2000中都装入了大字符集汉字库,人们一般称它为GBK字库。有了GBK字库,还要有对应的汉字输入法,才能输入其中的全部汉字,如果某种汉字输入法仅编入了一二级字库,仍然只能输入6763个汉字。
(三)台湾 BIG5 字库
港澳台地区普遍使用台湾的《通用汉字标准交换码》,地区标准号为:CNS11643,选入了13 000多个繁体汉字,这就是人们讲的BIG5码,或叫大五码。 钱码的“海外繁体版”编入了BIG5字库,能输入13 000多个繁体汉字。
四)新标准汉字库 (GB18030-2000)
2000年3月,国家信息产业部和质量技术监督局在北京联合发布了两项新标准,一项叫做《信息技术和信息交换用汉字编码字符集、基本集的扩充》,国家标准号为:GB18030-2000,收录了27533个汉字,还收录了藏、蒙、维等主要少数民族的文字,以期一举解决邮政、户政、金融、地理信息系统等生僻汉字与主要少数民族语言的输入,该标准于2000年12月31日强制执行;另一项是《信息技术和数字键盘汉字输入通用要求》,国家标准号是: GB/T18031-2000,为数字键盘输入提供了统一的标准。 新标准汉字库已经公布,迫切需要与之相应的输入方法。
(五)方正超大字符集
方正超大字符集字体包括了上面提到的全部汉字以及在第二平面中(42,711)选出的36,862个在中国大陆,香港特别行政区(以及部分台湾地区)使用的汉字。因此包括西文等常用字符在内,宋体-方正超大字符集共包括65,531个字符。这是目前包含字数最全的字库。要安装该字库需在安装WinXP时采用自定义安装,选择安装宋体-方正超大字符集,但是一般的输入法是无法打出这么多的字的,但可以用“插入”—“符号”的方法选择插入。

[zz]GB2312/GBK/GB18030/BIG5 的历史相关推荐

  1. GB2312/GBK/GB18030/BIG5 的历史

    GBK中的"K"是扩展的意思,而GB2312中的"2312"以及GB18030中的"18030"是国家标准的代号,BIG5是港澳台地区的编码 ...

  2. 一文搞清楚中文编码们:GB2312, GBK, GB18030, Big5

    目录 1. GB2312 2. Big5 3. GBK 4. GB18030 5. CJK 前一篇我转载的这个博主的博文:ANSI是什么编码?中有这样一段小故事: 话说计算机是由美国佬搞出来的嘛,他们 ...

  3. 字符集、字符编码、国际化、本地化简要总结(UNICODE/UTF/ASCII/GB2312/GBK/GB18030)

    PS:要转载请注明出处,本人版权所有. PS: 这个只是基于<我自己>的理解, 如果和你的原则及想法相冲突,请谅解,勿喷. 环境说明   普通的linux 和 普通的windows.    ...

  4. GB2312, GBK, GB18030 这几种字符集主要的区别

    转载自:http://www.zhihu.com/question/19677619 1 GB2312-80 GB 2312 或 GB 2312-80 是中国国家标准简体中文字符集,全称<信息交 ...

  5. ASCII,unicode, utf8 ,big5 ,gb2312,gbk,gb18030等几种常用编码区别

    ASCII,unicode, utf8 ,big5 ,gb2312,gbk,gb18030等几种常用编码区别 最近老为编码问题而烦燥,下定决心一定要将其弄明白!本文主要总 结网上一些朋友提供的 asc ...

  6. 编码标准-GB2312 GBK GB18030

    关于 ASCII编码 可以查看我的另外一篇博客 编码标准-ASCII 关于 Unicode 可以参考我的另外一篇博客 Unicode 编码标准-GB2312 GBK GB18030 基本概念 区位码 ...

  7. 细说ASCII、GB2312/GBK/GB18030、Unicode、UTF-8/UTF-16/UTF-32编码

    参考: <编码标准-GB2312 GBK GB18030> <字符编码笔记:ASCII,Unicode 和 UTF-8> <字体编辑用中日韩汉字Unicode编码表> ...

  8. 大端小端,ascii,unicode,utf8,utf16,utf32,gb2312,gbk,gb18030等字符编码问题

    字符编码的问题让我困惑了好久的一段时间,其实简单的想,字符编码没有什么东西的,可是想真弄明白还是花去了我一点时间,前端时间写了一个简单的log程序,主要的工作就是支持系统运行时输出日志信息,同时允许定 ...

  9. 各种编码格式(GB2312,GBK,GB18030,unicode,utf-8)之间的关系

    汉字常用编码格式 为了在屏幕上显示字符.需要下面几个步骤: 制作所有字符对应的字模.比如大写字母A长什么样.这个模样就是最终显示在屏幕上图形,即我们看到的字符A. 为对所有的字符进行编码.比如大写字母 ...

最新文章

  1. 移动通信网络协议 — GTP 协议
  2. 第七章——DMVs和DMFs(1)
  3. 一个图片 在另一个图片定位_淋雨图片孤身一人 一个人在淋雨的图片_新闻资讯...
  4. ITK:手动遍历具有成形邻域的图像区域
  5. mysql 5.7参数目录_mysql5.7配置
  6. 51. N-Queens
  7. code blocks c语言,Code Blocks安装与使用图文教程(使用Code::Blocks编写C语言程序)...
  8. 蓝桥杯基础练习1-15(python)
  9. unity最基本操作
  10. Java多线程学习四十:如何写一个必然死锁的例子
  11. windows笔记-【内核对象线程同步】概述
  12. 盒模型bug的解决方法
  13. 解决 https 证书验证不通过的问题
  14. Java aop中参数传递
  15. 天正结构TAsd8.2 天正规划与景观设计软件7.5 及注册机
  16. java根据经纬度得出中心点的经纬度
  17. 90后首次购房心路历程
  18. js-函数式编程-柯里化和语义化
  19. Tomcat - 深度学习 - 类加器详解
  20. Vista SP1 vs. XP SP2 - Benchmarked

热门文章

  1. 单片机旋转led程序c语言,[ 单片机 ] 旋转LED制做过程
  2. eyoucm arclist 文档列表
  3. 免费html5 css3大学生网页设计期末作业 网页制作作业成品
  4. 【笔记】小米电视屏蔽广告好评,亲测方法及相关设备参数
  5. MavLink通信协议 C++应用详细教程
  6. 2022全球智博会 打开非凡之城的未来“穿越门”
  7. Python中赋值的含义
  8. 二叉堆简单实现与应用
  9. java字符串与数组比较_Java字符串与数组
  10. mybatis-plus的mapper.xml路径配置:Invalid bound statement (not found):...