计算机内的信息编码

西文字符编码

西文就是英文,数字,英文标点等等,每个ASCII码以一个字节(Byte)储存,国际通用的7位码用7位二进制数表示一个字符的编码,其编码范围是00000000-01111111,共27=128个字符。(最高位是0)也就是计算机内部使用一个字节存放一个7位ASCII码,b0--b6表示ASCII码值,最高位b7置0。

中文字符编码

后来,计算机传入中国并开始普及时,首要问题是解决中文编码问题,即刻出现了

区位码(国家标准定义)

GB2312是一种中文的编码方式,具体是由区位码来实现的。GB2312将7445个字符编入一个 94*94 的二维表, 行就是 "区"、列就是 "位", 其中的一个汉字由区、位唯一定位,其对应的区、位合并就为区位码。一级汉字3755个(16-55 区: 常用汉字, 按拼音排序),二级汉字编3008个(56-87 区: 非常用汉字, 这是按部首排序的),682个非汉字(00-09 区为符号、数字、英文字符...制表符等)10-15 区: 空白, 留待扩展;88-94 区: 空白, 留待扩展.

国标码:汉字信息交换码

汉字国标码=十六进制区号和位号分别加上20H,将 "区" 和 "位" 分别加上32(十六进制表示: 20H) 作为国标码。为什么要加上32呢,当时在制定GB2312之前,就决定覆盖掉ASCII中符号和英文字母部分,所以将其中的英文字母和符号重新编入GB2312中。而对于ASCII中前32个控制字符则继续沿用。所以保留前32字符,就需要将汉字编码向后偏移32,十六进制20H,这也就是区位码要加上20H得到国标码,这就是GB2312的编码规范。

内码:

计算机中存储的就是内码,但是这样并不能在计算机上使用,因为这样会和 ASCII 码混淆。所以又有规定把每个字节的最高位都从 0 换成 1,就是把每个字节(区和位)都再加上 128(十六进制的: 80H),从而得到 "机内码", 也就是前面所说的 "内码"。内码是微软为了解决冲突问题而采用的方式,本质上是修改了GB2312的编码标准,而这种方法最后产生的编码称为内码。

区位码 --->国标码
区和位分别 +32(20H)

国标码 --->内码

国标码区和位分别+128 (80H)

区位码 + A0A0H = 内码。

信息编码--区位码,国标码,内码相关推荐

  1. mysql外码内码定义_刨根究底字符编码之六——简体汉字编码中区位码、国标码、内码、外码、字形码的区别及关系...

    简体汉字编码中区位码.国标码.内码.外码.字形码的区别及关系 GB2312.GBK.GB18030等GB类汉字编码方案的具体实现方式是怎样的?区位码是什么?国标码是什么?内码.外码.字形码又是什么意思 ...

  2. mysql外码内码定义_内码和外码分别是什么啊?

    满意答案 haomingwen 2017.10.03 采纳率:57%    等级:10 已帮助:1369人 我们常说汉字的"内码"与"外码". 内码是汉字在计算 ...

  3. mysql外码内码定义_中文编码杂谈(转) - CodeAxe的个人页面 - OSCHINA - 中文开源技术交流社区...

    编码问题的例子 在windows自带的notepad(记事本)程序中输入"联通"两个字,保存后再次打开,会发现"联通"不见了,代之以"��ͨ" ...

  4. java 外码 内码_什么是汉字的内码、外码、交换码、字形码?

    展开全部 1.内码是指计算机汉字系统中使用的二进制字符编码,是沟通输入.输62616964757a686964616fe78988e69d8331333433616234出与系统平台之间的交换码,通过 ...

  5. a律13折线pcm编码例题_a律13折线编码段内码怎么确定

    展开全部 回答如下: 首先,列表.然后根据你的抽样脉冲 值的正负,判断极性码,正值为1,负值为0,其次,e5a48de588b662616964757a686964616f31333365643662 ...

  6. 刨根究底字符编码之六——简体汉字编码中区位码、国标码、内码、外码、字形码的区别及关系

    简体汉字编码中区位码.国标码.内码.外码.字形码的区别及关系 GB2312.GBK.GB18030等GB类汉字编码方案的具体实现方式是怎样的?区位码是什么?国标码是什么?内码.外码.字形码又是什么意思 ...

  7. 输入码、区位码、内码、国标码的出现原因

    2020H.8080H 区位码.内码.国标码怎么转换非常简单,但是令人迷惑的是为什么要那么转换?这种转换不可能平白无故地那样转换! 首先,注意到一点,GB2312虽说是对中文编码,但是里面有对26个英 ...

  8. 汉字编码-区位码、国标码和内码发展和区别以及为什么要加2020H、8080H

    当计算机传入中国并开始普及时,首要问题是解决中文编码问题,也就诞生出了GB2312.GBK等等编码方式.而其中的具体实现方式是什么?区位码是什么?国标码是什么?它们如何转换又为什么这么转换? 首先来看 ...

  9. 区位码\机器码\内码关系

    学:区位码49 07 16进制是31 07 国标码=区位+20H=5127(空出前面非汉字) 内码=国标码+80H=D1A7(为了使第7位和第15位为1,从后往前数) 所以 内码=区位码+A0H=D1 ...

最新文章

  1. 虚拟电脑键盘app_说到弹吉他,这几个APP你一定用得上
  2. mysql_select按照指定的格式输出到文件
  3. 批量单变量求解 office wps 单变量求解比较
  4. ARM 之四 各集成开发环境(IDE)说明(Keil、RVDS、ADS、DS-5、MDK)
  5. NYOJ【士兵杀敌(二)】
  6. Qt Creator开发Qt快速应用程序
  7. 网上商城—管理员增加商品
  8. 在计算机网络中可用于信息传输的介质,在计算机网络中,双绞线、同轴电缆及光纤等用于传输信息的载体被称为______介质。...
  9. 14 WM配置-主数据-定义存储单位类型(Storage Unit Type)
  10. Oracle的10046事件
  11. 计算机nit证书怎么学,计算机等级考试证书和NIT可以抵免自考中哪些课程?
  12. 使用.Net Core MVC创建Web API
  13. 综述(十)北京在安全测试示范区上的政策与成果数据分析
  14. 2022智源大会议程公开 | 探索智能的原理,构建脑科学与AI的桥梁
  15. 北理大编程作业:确定母亲节
  16. 极客创新大赛|微创机器人号探索飞船即将启航
  17. 原来MAC地址还是要购买的
  18. 5,15-二(3,4,5-三(三丙氧苯基)卟啉(BTPPP),[5,15-二乙炔基-10,20-二(3,4,5-三(十六烷氧基)苯基)卟啉]锌(DBTCPP-Zn)齐岳生物供应
  19. 6把椅子换位思考法则
  20. IEEE14节点求解系统潮流matlab仿真( PQ分解法)

热门文章

  1. 求知若饥,虚心若愚 -- 乔布斯的三个故事
  2. 消费商时代来临,日常消费成为投资
  3. iPhone 3G(是iPhone系列中的第二代)
  4. iTouch3-32G升级4.2.1并越狱
  5. TypeScript 使用手册
  6. Linux发行版新秀:基于Ubuntu、系统核心 “不可变”
  7. CREATE TABLE 时的 SQL UNIQUE 约束
  8. Redis:(error) MOVED 原因和解决方案
  9. 集成产品开发(IPD)简介
  10. Python(第一章)版本介绍,环境准备及IDLE使用