1980年,为了使每个汉字有一个全国统一的代码,我国颁布了汉字编码的国家标准:GB2312-80《信息交换用汉字编码字符集——基本集》,这个字符集是目前国内所有汉字系统的统一标准。它规定了用两个字节来表示一个汉字,每个字节都只能使用低7位,共有128*128种状态,又由于ASCII中的控制代码在汉字系统中也要使用,所以只剩下94*94=8836种状态用来表示国标码规定的6763个汉字和682个全角字符。每个字符都对应了唯一的区位码、国标码和机内码。

区位码

区位码是一个四位的十进制数,前两位叫做区码,后两位叫做位码。区位码共有94个区(行),每个区有94个位(列)。

1~9区 特殊字符区
10~15区 用户自定义区
16~55区 一级汉字
56~87区 二级汉字

一级汉字:3755个常用的汉字,按拼音排序;二级汉字:3008个汉字,按部首排序。

为了处理与存储的方便,每个汉字的区号和位号在计算机内部分别用一个字节表示。如,汉字“学”的区号为49,位号为07,区位码为4907D,对应的二进制表示为
00110001 00000111
区位码不能用于通信,因为它可能与通信使用的控制码(00H~1FH)发生冲突。

国标码

为了进行汉字通信,将区位码的区码和位码都加20H,避开了控制码,就得到了国标码。国标码用十六进制表示,如,汉字“学”的国标码为5127H。

机内码

由于汉字与英文字符通常混用,所以汉字信息如不加以特殊标识就会与ASCII码混淆,如汉字“学”的国标码为51 27H,在ASCII中代表“Q”和“‘”。此问题的解决方法之一是将汉字编码每字节的最高位置为1,即国标码两字节分别+80H,则汉字“学”的机内码为D1A7H。
机内码用十六进制表示。
GB2312简体中文编码表是机内码对照表。

GBK

GBK是汉字编码标准之一,全称《汉字内码扩展规范》。GBK向下完全兼容GB2312-80编码,另外还支持部分中文姓氏,中文繁体,日文假名,还包括希腊字母以及俄语字母等。
GBK的中文编码是双字节来表示的,英文编码使用ASCII码表示的,即用单字节表示。但GBK编码表中也有英文字符的双字节表示形式,所以英文字母可以有两种GBK表示方式。为区分中英文,将汉字最高位定为1,英文最高位定为0。当用GBK解码时,若高字节最高位为0,则用ASCII码表解码;若高字节最高位为1,则用GBK编码表解码。
GBK的编码范围为 高字节81-FE(126个),低字节40-FE(191个),总共有24066(126*191)种状态,共收入218886个汉字和图形符号,其中汉字(包括部首和构件)21003个,图形符号883个。
GBK编码表

区位码、国标码、机内码、GBK相关推荐

  1. 大学计算机的区位码国标码机内码,[计 算 机]汉字区位码\国标码\机内码之间的换算...

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 国标与机内码的转换 国标码并不等于区位码,它是由区位码稍作转换得到,其转换方法为:先将十进制区码和位码转换为十六进制的区码和位码,;这样就得了一个与国标码 ...

  2. 区位码 国际码 机内码 转换

    1.机内码与区位码 机内码高位字节=(区号)H+A0H 机内码低位字节=(位号)H+A0H 2.国标码与区位码 国标码高位字节=(区号)H+20H 国标码低位字节=(位号)H+20H 3.区位码用两个 ...

  3. 汉字区位码\国标码\机内码之间的换算

    区位码.国标码与机内码的转换方法: (1)区位码先转换成十六进制数表示 (2)(区位码的十六进制表示)+2020H=国标码:(两位两位相加) (3)国标码+8080H=机内码 (两位两位相加) 举例: ...

  4. 计算机汉字编码国标码,[计 算 机]汉字区位码\国标码\机内码之间的换算

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 国标与机内码的转换 国标码并不等于区位码,它是由区位码稍作转换得到,其转换方法为:先将十进制区码和位码转换为十六进制的区码和位码,;这样就得了一个与国标码 ...

  5. 用计算机国标码转机内码,区位码2850怎么转换成国标码和机内码

    2014-09-21 回答 1.机内码与区位码 机内码高位字节=(区号)H+A0H 机内码低位字节=(位号)H+A0H 2.国标码与区位码 国标码高位字节=(区号)H+20H 国标码低位字节=(位号) ...

  6. 信息编码--区位码,国标码,内码

    计算机内的信息编码 西文字符编码 西文就是英文,数字,英文标点等等,每个ASCII码以一个字节(Byte)储存,国际通用的7位码用7位二进制数表示一个字符的编码,其编码范围是00000000-0111 ...

  7. Educoder计算机数据表示实验(HUST)第1关:汉字国标码转区位码实验

    首先我们需要找到汉字国标码转区位码的软件. 这个资源可以从我上传的资源那里看到. 假如我们输入一下数字,那么我们可以得到转换的结果,即机内码. 然后我们再返回到原始电路: 我们需要对电路进行这样的连接 ...

  8. 自己动手画CPU《计算机组织与结构实验》之计算机数据表示 第1关:汉字国标码转区位码实验 超详细教学

    首先给加法器接上一个常量 再更改常量数据位宽为16位 因为 区位码=国标码+2020H 所以 区位码=国标码-2020H 加法器需要使用补码计算 即 区位码=[国标码]补+[-2020H]补 计算得到 ...

  9. 汉字国标码转区位码的实验( EduCoder实验一)

    汉字国标码转区位码的实验 一.基础内容 二.EduCoder(实验一:汉字国标码转区位码) ​ 一.基础内容 区位码是啥? ​ 定义:一个四位的十进制数,区和位构成唯一的二维数组 ​ 区号:2位,位号 ...

  10. java汉字转换国标码_GBK/GB2312编码问题分析以及java获取汉字国标码

    import java.io.UnsupportedEncodingException; import java.util.regex.Matcher; import java.util.regex. ...

最新文章

  1. [JS,CSS] - CSS圆角框组件
  2. 全局声明宏定义_Rust语言:元编程,强大的宏系统,菜鸟到高手进阶的必经之路...
  3. mysql如何在sql语句中用php变量
  4. C和指针之字符串编程练习6
  5. k8s核心技术-Helm(快速部署应用)---K8S_Google工作笔记0046
  6. win10 redis安装教程
  7. C# Serilog日志框架
  8. Team Viewer 远程链接一直显示-正在初始化显示参数
  9. 鸿蒙 悟空遥控,利用悟空遥控推送软件,成功实现高德地图等三方APP装
  10. 堪称Python入门新华字典的《Python背记手册》高清无码版,开源免费下载
  11. Git 常用术语 WIP PTAL CC LGTM 解释
  12. 两阶段最小二乘法与R
  13. mess组网 中继_还在用无线路由器中继?快来看乙辰科技全新更智能的无线Mesh组网...
  14. 怎样和求职者聊天_我如何学会欣赏求职者
  15. antd源码解读 之 构建工具antd-tools
  16. 修复鹏城开发者云硬盘扩容报错 fdisk: cannot write disk label: Invalid argument
  17. SpringSecurity实现登陆认证并返回token
  18. 【光通信】单模与多模区别
  19. 怎样制作CHM格式的电子书?
  20. 计算机f8键的功能,f8键有什么作用(图文)

热门文章

  1. 如何将html表格导出到excel,html 页面导出到excel表格数据类型-如何将html里面的table导出成excel...
  2. Windows环境下的命令行工具cmder的安装和使用
  3. C语言程序设计(谭浩强第五版)——习题
  4. [手游] 大宗师翅膀版-金庸恩仇录 [复制链接]一键服务端+手工外网端+GM后台+安卓苹果+配套教程
  5. CAN analyzor - CAN分析仪
  6. View androidx.appcompat.widget.AppCompatImageViewdoes not have a NavController set
  7. XXL-JOB研究二 调度中心
  8. xxl-job任务调度中心
  9. 关于 SSL 及 CA 证书,你可能需要知道这些
  10. 【云服务器 ECS 实战】一文掌握负载均衡服务原理及配置方法