1、收录不同:GB2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;

GBK共收入21886个汉字和图形符号。

2、表示不同:GB2312对任意一个图形字符都采用两个字节表示,并对所收汉字进行了“分区”处理,每区含有94个汉字/符号,分别对应第一字节和第二字节。

GBK采用双字节表示,总体编码范围为8140-FEFE之间,首字节在81-FE之间,尾字节在40-FE之间。

3、处理功能不同:对于人名、古汉语等方面出现的罕用字,GB2312不能处理,这导致了后来GBK 及GB18030 汉字字符集的出现。

GBK: 汉字国标扩展码,基本上采用了原来GB2312-80所有的汉字及码位,并涵盖了原Unicode中所有的汉字20902,总共收录了883个符号, 21003个汉字及提供了1894个造字码位。

Microsoft简体版中文Windows 95就是以GBK为内码,又由于GBK同时也涵盖了Unicode所有CJK汉字,所以也可以和Unicode做一一对应。

GB码,全称是GB2312-80《信息交换用汉字编码字符集 基本集》,1980年发布,是中文信息处理的国家标准,在大陆及海外使用简体中文的地区(如新加坡等)是强制使用的唯一中文编码。

P-Windows3.2和苹果OS就是以GB2312为基本汉字编码, Windows 95/98则以GBK为基本汉字编码、但兼容支持GB2312。

GB码共收录6763个简体汉字、682个符号,其中汉字部分:一级字3755,以拼音排序,二级字3008,以偏旁排序。该标准的制定和应用为规范、推动中文信息化进程起了很大作用。

GB2312和GBK的区别相关推荐

  1. GB2312、GBK与UTF-8的区别

    GB2312.GBK与UTF-8的区别 这是一个异常经典的问题,有无数的新手站长每天都在百度这个问题,而我,作为一个"伪老手"站长,在明白这个这个问题的基础上,有必要详细的解答一下 ...

  2. mysql utf8和gbk的区别_MySQL字符集 GBK、GB2312、UTF8区别

    MySQL中涉及的几个字符集 character-set-server/default-character-set:服务器字符集,默认情况下所采用的. character-set-database:数 ...

  3. [转]各种编码ANSI、GB2312、GBK、GB18030、UNICODE以及UTF-8傻傻分不清!

    计算机编程中的编码一直是让新手非常头疼的问题,特别是 GBK.GB2312.UTF-8 这三个比较常见的网页编码的区别,更是让许多新手晕头转向,怎么解释也解释不清楚,看一遍貌似懂了,但实际使用的时候又 ...

  4. 【转】刨根究底字符编码之五——简体汉字编码方案(GB2312、GBK等)以及全角、半角、CJK

    一.概述 1. 英文字母再加一些其他标点字符之类的也不会超过256个,用一个字节来表示一个字符就足够了(2^8 = 256).但其他一些文字不止这么多字符,比如中文中的汉字就多达10多万个,一个字节只 ...

  5. 如何判断一个文件的编码格式是gb2312还是gbk等

    GB2312-80编码的编码范围是高位0xa1-0xfe,低位是 0xa1-0xfe ,其中汉字范围为 0xb0a1 和 0xf7fe,如果只是简单地判断汉字,则只要查看高字节是否大于等于0xa1就可 ...

  6. [转载]UNICODE,GBK,UTF-8区别

    UNICODE,GBK,UTF-8区别 作者:李鸿儒 文章来源:李鸿儒的博客 简单来说,unicode,gbk和大五码就是编码的值,而utf-8,uft-16之类就是这个值的表现形式.而前面那三种编码 ...

  7. 【字符编码详解】ASCII、GB2312、GBK、UTF-8、UTF-16编码与Unicode字符集

    目录 前言 一.什么是编码,数据类型和编码有什么关系? 二.英文字符编码 ASCII编码 三.中文编码 1. GB2312标准 2. GBK编码 3. 其他中文编码 四.Unicode字符集 1. U ...

  8. 字符集:ASCII、GB2312、GBK、GB18030、Unicode

    文章目录 1 字符集.代码点.编码的概念 2 字符集发展的脉络 2.1 最早是ASCII 2.2 各个国家后续推出的编码表 2.3 ANSI到底是什么编码 3 ASCII 3.1 ASCII字符集简介 ...

  9. 【JAVA编码专题】UNICODE,GBK,UTF-8区别

    简单来说,unicode,gbk和大五码就是编码的值,而utf-8,uft-16之类就是这个值的表现形式.而前面那三种编码是一兼容的,同一个汉字,那三个码值是完全不一样的.如"汉"的uncode值与g ...

最新文章

  1. 挪动以太坊:比特币现金的新功能使其成为智能合约竞争者
  2. 华北理工大学轻工学院计算机在哪个校区,如何坐公交去路北区的华北理工大学轻工学院(北校区)-行政综合楼| Moovit...
  3. Java线程详解(12)-有返回值的线程
  4. wordpress里mySql服务器的配置
  5. 使用多行sql字符串时,要注意不要忽略了空格
  6. behavior php,YII2框架中behavior行为的理解与使用方法示例
  7. python定义变量字符串_Python学习笔记二(变量和字符串)
  8. [转载] python标准库系列教程(三)——operator库详细教程
  9. 导航栏透明度渐变; 下拉头视图拉伸效果;勾号动画; 一段文字中点击部分可响应不同事件...
  10. Linux 下完整安装ffmpeg(包括各种解码器)
  11. [Mac OS] Mac OS X for x86 下载
  12. 文本数据挖掘(Text Mining)
  13. 域名.com是什么意思?和cn域名有什么区别?
  14. 微信公众号基础04_分享和录音功能的实现
  15. POC原型开发:巡店
  16. 摄像头rtsp流转http-flv实现低延迟实时在线播放
  17. SpringBoot整合Apollo配置中心快速使用
  18. EXFO MAX-710B光时域反射仪OTDR主要功能
  19. http 状态码以及http请求、响应
  20. PAL到底是720还是768?

热门文章

  1. 初识软件测试——什么是软件测试?
  2. 腾讯微信公众平台开发教程(一)
  3. 时间序列分析Nginx日志
  4. 可观测性-Event-埋点数据模型
  5. Bitcode是什么,如何配置?
  6. 广东移动2014校招技术笔试题目
  7. vue + echarts实现数据可视化统计页面
  8. 外嫁女能否享受村民拆迁补偿待遇
  9. unity 黑暗之光 控制主角移动的朝向
  10. iOS-Termination Reason: Namespace SPRINGBOARD, Code 0x8badf00d