信息编码--区位码,国标码,内码
计算机内的信息编码
西文字符编码
西文就是英文,数字,英文标点等等,每个ASCII码以一个字节(Byte)储存,国际通用的7位码用7位二进制数表示一个字符的编码,其编码范围是00000000-01111111,共27=128个字符。(最高位是0)也就是计算机内部使用一个字节存放一个7位ASCII码,b0--b6表示ASCII码值,最高位b7置0。
中文字符编码
后来,计算机传入中国并开始普及时,首要问题是解决中文编码问题,即刻出现了
区位码(国家标准定义)
GB2312是一种中文的编码方式,具体是由区位码来实现的。GB2312将7445个字符编入一个 94*94 的二维表, 行就是 "区"、列就是 "位", 其中的一个汉字由区、位唯一定位,其对应的区、位合并就为区位码。一级汉字3755个(16-55 区: 常用汉字, 按拼音排序),二级汉字编3008个(56-87 区: 非常用汉字, 这是按部首排序的),682个非汉字(00-09 区为符号、数字、英文字符...制表符等)10-15 区: 空白, 留待扩展;88-94 区: 空白, 留待扩展.
国标码:汉字信息交换码
汉字国标码=十六进制区号和位号分别加上20H,将 "区" 和 "位" 分别加上32(十六进制表示: 20H) 作为国标码。为什么要加上32呢,当时在制定GB2312之前,就决定覆盖掉ASCII中符号和英文字母部分,所以将其中的英文字母和符号重新编入GB2312中。而对于ASCII中前32个控制字符则继续沿用。所以保留前32字符,就需要将汉字编码向后偏移32,十六进制20H,这也就是区位码要加上20H得到国标码,这就是GB2312的编码规范。
内码:
计算机中存储的就是内码,但是这样并不能在计算机上使用,因为这样会和 ASCII 码混淆。所以又有规定把每个字节的最高位都从 0 换成 1,就是把每个字节(区和位)都再加上 128(十六进制的: 80H),从而得到 "机内码", 也就是前面所说的 "内码"。内码是微软为了解决冲突问题而采用的方式,本质上是修改了GB2312的编码标准,而这种方法最后产生的编码称为内码。
区位码 --->国标码
区和位分别 +32(20H)
国标码 --->内码
国标码区和位分别+128 (80H)
区位码 + A0A0H = 内码。
信息编码--区位码,国标码,内码相关推荐
- mysql外码内码定义_刨根究底字符编码之六——简体汉字编码中区位码、国标码、内码、外码、字形码的区别及关系...
简体汉字编码中区位码.国标码.内码.外码.字形码的区别及关系 GB2312.GBK.GB18030等GB类汉字编码方案的具体实现方式是怎样的?区位码是什么?国标码是什么?内码.外码.字形码又是什么意思 ...
- mysql外码内码定义_内码和外码分别是什么啊?
满意答案 haomingwen 2017.10.03 采纳率:57% 等级:10 已帮助:1369人 我们常说汉字的"内码"与"外码". 内码是汉字在计算 ...
- mysql外码内码定义_中文编码杂谈(转) - CodeAxe的个人页面 - OSCHINA - 中文开源技术交流社区...
编码问题的例子 在windows自带的notepad(记事本)程序中输入"联通"两个字,保存后再次打开,会发现"联通"不见了,代之以"��ͨ" ...
- java 外码 内码_什么是汉字的内码、外码、交换码、字形码?
展开全部 1.内码是指计算机汉字系统中使用的二进制字符编码,是沟通输入.输62616964757a686964616fe78988e69d8331333433616234出与系统平台之间的交换码,通过 ...
- a律13折线pcm编码例题_a律13折线编码段内码怎么确定
展开全部 回答如下: 首先,列表.然后根据你的抽样脉冲 值的正负,判断极性码,正值为1,负值为0,其次,e5a48de588b662616964757a686964616f31333365643662 ...
- 刨根究底字符编码之六——简体汉字编码中区位码、国标码、内码、外码、字形码的区别及关系
简体汉字编码中区位码.国标码.内码.外码.字形码的区别及关系 GB2312.GBK.GB18030等GB类汉字编码方案的具体实现方式是怎样的?区位码是什么?国标码是什么?内码.外码.字形码又是什么意思 ...
- 输入码、区位码、内码、国标码的出现原因
2020H.8080H 区位码.内码.国标码怎么转换非常简单,但是令人迷惑的是为什么要那么转换?这种转换不可能平白无故地那样转换! 首先,注意到一点,GB2312虽说是对中文编码,但是里面有对26个英 ...
- 汉字编码-区位码、国标码和内码发展和区别以及为什么要加2020H、8080H
当计算机传入中国并开始普及时,首要问题是解决中文编码问题,也就诞生出了GB2312.GBK等等编码方式.而其中的具体实现方式是什么?区位码是什么?国标码是什么?它们如何转换又为什么这么转换? 首先来看 ...
- 区位码\机器码\内码关系
学:区位码49 07 16进制是31 07 国标码=区位+20H=5127(空出前面非汉字) 内码=国标码+80H=D1A7(为了使第7位和第15位为1,从后往前数) 所以 内码=区位码+A0H=D1 ...
最新文章
- 虚拟电脑键盘app_说到弹吉他,这几个APP你一定用得上
- mysql_select按照指定的格式输出到文件
- 批量单变量求解 office wps 单变量求解比较
- ARM 之四 各集成开发环境(IDE)说明(Keil、RVDS、ADS、DS-5、MDK)
- NYOJ【士兵杀敌(二)】
- Qt Creator开发Qt快速应用程序
- 网上商城—管理员增加商品
- 在计算机网络中可用于信息传输的介质,在计算机网络中,双绞线、同轴电缆及光纤等用于传输信息的载体被称为______介质。...
- 14 WM配置-主数据-定义存储单位类型(Storage Unit Type)
- Oracle的10046事件
- 计算机nit证书怎么学,计算机等级考试证书和NIT可以抵免自考中哪些课程?
- 使用.Net Core MVC创建Web API
- 综述(十)北京在安全测试示范区上的政策与成果数据分析
- 2022智源大会议程公开 | 探索智能的原理,构建脑科学与AI的桥梁
- 北理大编程作业:确定母亲节
- 极客创新大赛|微创机器人号探索飞船即将启航
- 原来MAC地址还是要购买的
- 5,15-二(3,4,5-三(三丙氧苯基)卟啉(BTPPP),[5,15-二乙炔基-10,20-二(3,4,5-三(十六烷氧基)苯基)卟啉]锌(DBTCPP-Zn)齐岳生物供应
- 6把椅子换位思考法则
- IEEE14节点求解系统潮流matlab仿真( PQ分解法)