GB18030是中国制定的汉字集编码规则的国际标准,想要更好的了解这套标准需要清除的知道其演化过程:
        1980年, GB2312-80(我国的第一套汉字集标准),共包含7445个字符,其中6763个常用汉字;
        1995年,GBK,由GB2312-80(和港、台两种标准)扩展而来,共包含21886个字符,其中常用汉字14240个。
       GB2312-80和GBK都只包含一个字节和双字节汉字,直到GB18030-2000产生,汉字标准字符集继续扩展,又增加了6351个字符,其中一部分为4字节字(four-byte encoding range)。
       目前最新的国家汉字标准是GB18030-2005,在上述基础上又增加了六种少数民族语言和一些四字节字。

在Unicode产生之前,各国的标准基本都是各自为主,自己制定自己的那一套,谁也不服谁,彼此之间不通用,也别想着转换,由于历史原因,汉字就相对复杂,有三套标准共存,GB2312-80是中国大陆的,Big5是中国台湾的,HKSCS是中国香港的。这三套标准并不通用,彼此的编码在底层没办法转换。那个年代只要写出一套能够在桌面显示简体和繁体的软件就可以卖大钱。
        其实这种混论并不局限于国内,在世界范围来说也非常的不利于文化交流。
        值得一提的是,进过每个国家都有自己的标准,但是所有的便准的制定都是在ASCII的基础上的,这也一定程度上为Unicode的诞生和标准化奠定了基础。
         乱不能久,统一才是大趋势,于是Unicode应运而生,在Unicode诞生后,建立与其上的GBK和GB18030称为汉字的国际标准,结束了汉字有三套标准的混乱局面。
        GB18030是GBK的超集,也就是包含的字符要比GBK多。不过像微软的windows和一些公司的Linux系统中的内嵌的中文编码都是GBK。其实GB18030比GBK中多出来的字符不是很常用,里面包含的主要是一些少数民族语言和一些韩语和维族语言

什么是GB18030,与GBK的关系?相关推荐

  1. GB2312、GB18030、GBK、UNICODE、BIG5之间兼容关系如何?

    常用字符集分类 ASCII及其扩展字符集 作用:表语英语及西欧语言. 位数:ASCII是用7位表示的,能表示128个字符:其扩展使用8位表示,表示256个字符. 范围:ASCII从00到7F,扩展从0 ...

  2. UTF-8、GB2312、GB18030、GBK和BIG5等字符集编码范围的具体说明

    一预备知识 1,字符:字符是抽象的最小文本单位. 它没有固定的形状(可能是一个字形),而且没有值. "A"是一个字符,""(德国.法国和许多其他欧洲国家通用货 ...

  3. GB18030与GBK、GB2312字节对照

    字节对照 第一字节: ASCII:00-7F GB2312:A1-FE(实际A1-A9/B0-F7) (A1-A9为符号,B0-F7为汉字) (单字节编码同ASCII) BIG-5:81-FE(实际A ...

  4. python中 utf-8 和GBK 的关系

    unicode其实是一种在操作过程中存在的字符状态,一般来讲,例如python中的str都是以"unicode"编码,在进行操作时会具化成为"utf-8"与&q ...

  5. ANSI编码是什么编码方式?ANSI编码和GBK什么关系

    用notepad可以将ANSI 转换成utf8 如果你的文本之前是UTF8可以转换成ANSI(GBK),如果你的文本之前是ANSI,可以转换成UTF8

  6. oracle是否支持gb18030,检测输入法是否支持GB18030标准

    国家标准GB18030-2000<信息交换用汉字编码字符集基本集的扩充>是我国继GB2312-1980和GB13000-1993之后最重要的汉字编码标准,是未来我国计算机系统必须遵循的基础 ...

  7. 各种编码格式(GB2312,GBK,GB18030,unicode,utf-8)之间的关系

    汉字常用编码格式 为了在屏幕上显示字符.需要下面几个步骤: 制作所有字符对应的字模.比如大写字母A长什么样.这个模样就是最终显示在屏幕上图形,即我们看到的字符A. 为对所有的字符进行编码.比如大写字母 ...

  8. ASCII、Unicode、GBK、UTF-8之间的关系

    一.ASCII编码 目录 一.ASCII编码 二.GBK编码 三.Unicode编码 四.UTF-8编码 五.Unicode和UTF-8之间的转换 六.Little endian 和 Big endi ...

  9. 彻底搞明白 GB2312、GBK 和 GB18030

    彻底搞明白 GB2312.GBK 和 GB18030 程序员十三 公众号:Linux开发那些事儿 , 分享 Linux 干货 1 人赞同了该文章 日常工作的过程中,关于字符编码的问题经常让人头疼不已, ...

最新文章

  1. linux执行命令段错误,Linux运行fortran程序 出现段错误(segmentation fault)
  2. Martin Fowler谈《重构HTML:改善Web应用的设计》
  3. 二分查找式的debug
  4. ERP项目管理,哪一环才是关键节点?
  5. oracle--pl/sql变量定义----
  6. 用JS制作一个信息管理平台完整版
  7. python语言精通_Python语言基础从入门到精通
  8. java编程思想学习(2):对象
  9. lvs负载均衡—DR模式
  10. 【Java】说明变量作用域的示例程序
  11. 重构 阅读心得(转)
  12. 优雅地关闭kubernetes中的nginx
  13. SpringAOP原理解析
  14. DELL G3 3590 重装win10后,显卡不识别,喇叭x号没声解决办法
  15. 哈希值(hashCode)
  16. 复合函数高阶求导公式_高中数学复合函数求导公式及法则
  17. python控制微信app_Appium+python在微信的hybridapp里的坑
  18. SQL Server 2019下载安装教程
  19. 家庭智能控制系统开发
  20. 软件破解简单示例演示

热门文章

  1. java微信公众号开发及源码分享
  2. 编写名为censor的函数,用来把字符串中出现的每一处字母“foo”替换成“xxx”。例如,字符串“food fool”会变为“xxxd xxxl”。再不失清晰性的前提下程序越短越好
  3. 数据库实验4---数据完整性
  4. android 自定义键盘震动,实现android按键震动按键声音的机制
  5. EasyUI DataGrid DetailView(数据表格详细展示带子表格)
  6. 学习笔记0518----nginx和php-fpm配置
  7. 大数据的应用场景都有哪些(医疗篇)
  8. Reactive 反应式编程
  9. 【牛客】链表的回文结构
  10. 内容非常全面,细节爆炸