收录

GB 2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时,GB 2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。
GB 2312的出现,基本满足了汉字的计算机处理需要,它所收录的汉字已经覆盖中国大陆99.75%的使用频率。
对于人名、古汉语等方面出现的罕用字,GB 2312不能处理,这导致了后来GBK及GB 18030汉字字符集的出现。

分区表示

GB 2312中对所收汉字进行了“分区”处理,每区含有94个汉字/符号。这种表示方式也称为区位码。
01-09区为特殊符号。
16-55区为一级汉字,按拼音排序。
56-87区为二级汉字,按部首/笔画排序。
10-15区及88-94区则未有编码。
举例来说,“啊”字是GB2312之中的第一个汉字,它的区位码就是1601。

字节结构

在使用GB2312的程序中,通常采用EUC储存方法,以便兼容于ASCII。浏览器编码表上的“GB2312”,通常都是指“EUC-CN”表示法。
每个汉字及符号以两个字节来表示。第一个字节称为“高位字节”(也称“区字节)”,第二个字节称为“低位字节”(也称“位字节”)。
“高位字节”使用了0xA1-0xF7(把01-87区的区号加上0xA0),“低位字节”使用了0xA1-0xFE(把01-94加上 0xA0)。 由于一级汉字从16区起始,汉字区的“高位字节”的范围是0xB0-0xF7,“低位字节”的范围是0xA1-0xFE,占用的码位是 72*94=6768。其中有5个空位是D7FA-D7FE。
例如“啊”字在大多数程序中,会以两个字节,0xB0(第一个字节) 0xA1(第二个字节)储存。区位码=区字节+位字节(与区位码对比:0xB0=0xA0+16,0xA1=0xA0+1)。

大写英文字母,D字符处于特殊字符区,区位码是0336(十进制),高低字节分别加上0xA0,就是GB2312编码A3C4。


address = ((0xA3-0xA1)*94 + (0xC4-0xA1))*32 + 0 = 0x1BE0

GT21L16S2W特殊字符计算地址相关推荐

  1. sql特殊字符转义,oracle中将字符 ‘ 转义

    oracle中使用sql语句或多或少地会遇到使用特殊字符,比如" ' ",这时,这个单引号就会与前面的单引号匹配,将文本从中间断开,引发问题和错误.这就需要我们进行转义. 而ora ...

  2. 5.html基础标签:块级+行级元素+特殊字符+嵌套规则

    <!DOCTYPE html> <html lang="en"> <head><meta charset="UTF-8" ...

  3. 针对七牛含有特殊字符的文件名,对特殊字符编码处理

    源字符串: a a 1 ~`!@#$%^&()_+-={}[];',.- + 编码后: a%20a%201%20~%60%21@%23$%25%5E&%28%29_+-=%7B%7D% ...

  4. HTML 基础知识(特殊字符的转义)

    1. body.head(meta) <body></body>标签的常见属性: bgcolor:整个页面的背景: text:设置文本颜色 link:设置连接颜色(),vlin ...

  5. 存储mysql数据存在特殊字符时处理_转义 存储数据时特殊符号的处理

    function url_base64_encode($str){ //将这个方法处理后的数据可以存储,不会有特殊符号 if($str=="") return "&quo ...

  6. Python统计字符串中的中英文字符、数字空格,特殊字符

    # -*- coding:utf8 -*-import stringfrom collections import namedtuple def str_count(s): '''找出字符串中的中英文 ...

  7. JSON.parse解析特殊字符报错解决方案

    2019独角兽企业重金招聘Python工程师标准>>> 具体案例: 页面点击"下一任务" 会去请求后台,这里出现的问题是有虚拟任务的时候.然后会返回一个map,也 ...

  8. XML 特殊字符处理和 CDATA

    在处理XML数据时,特殊字符要特殊处理,不能和节点字符混淆. 所有 XML 文档中的文本均会被解析器解析. 只有 CDATA 区段(CDATA section)中的文本会被解析器忽略. PCDATA ...

  9. String spilt时转义特殊字符【转】

    在使用String.split方法分隔字符串时,分隔符如果用到一些特殊字符,可能会得不到我们预期的结果. 我们经常使用public String[] split(String regex)方法来拆分一 ...

最新文章

  1. 樊登高效休息法读书心得_《读懂一本书:樊登读书法 》作者:樊登
  2. CISCO NAT 经典配置合集
  3. Windows核心编程 第2 5章 未处理异常和C ++异常(上)
  4. 【Flutter】Flutter 开发环境搭建 ( 2021年08月25日 补充最新资料 | 最新安装教程 )
  5. c++控制台下输出sin函数图形
  6. 从初创公司的角度来看微服务
  7. Struts2中配置默认Action
  8. copyof java_死磕 java集合之CopyOnWriteArrayList源码分析
  9. ASP.Net Core MVC 发生二次请求
  10. 天正计算机命令大全,天正CAD 中按Ctrl+v在不同图中粘贴出现“未知命令T81_tpasteclip”,直接在CAD中就能操作...
  11. python安装多久_python安装与使用
  12. 阶段1 语言基础+高级_1-3-Java语言高级_05-异常与多线程_第4节 等待唤醒机制_6_等待唤醒机制概述...
  13. ListView嵌套GridView使用解析
  14. Qt界面刷新优化的一些心得
  15. 中值定理9-极值点判断
  16. Windows7 SP1旗舰版精简版最终版本
  17. 怦然心动(Flipped)-7
  18. Linux格式化硬盘
  19. 场地通推出2.0 打造大学会务场地预定新平台
  20. 【Unity植物大战僵尸】太阳花功能基本完善(八)

热门文章

  1. Kotlin学习笔记(二)——函数操作符内置函数
  2. Spring boot + netty开发即时通讯 IM
  3. html打印为pdf表格显示不全,打印表格时内容显示不完整怎么办?四种方法解决WPS不完整问题...
  4. 月薪40K起,什么是Python全栈工程师?全栈工程师薪资为何这么高?
  5. 【noip模拟赛5】细菌
  6. 【一个故事讲完https】聊聊https的诞生
  7. 互联网已到中年,下一个产业革命是?
  8. Java实现多线程远程投屏并打包可执行文件(从代码到.exe)
  9. Picture HDU - 1828 (扫描线求矩形周长并)
  10. Alkyne-PEG-OH 炔烃PEG羟基Alkyne-PEG-OH 炔烃PEG羟基