ascii(美国信息交换标准码):
    最早的字符编码,使用7位二进制数字代表一个字符,使用一个字节(Byte)存储,最高位置0。ascii可以表示128个字符,包括所有的大小写英文字母、数字、标点符号及一些特殊字符,详见附图。
扩展ascii:
最高位置1,使用8位二进制数字表示256种字符。增加了128个特殊符号和外来语字母。

区位码:
     一种表示汉字的方法,我们在高考、四级等等报名时在机读卡上都填写过。由4位十进制构成。前两位为区码,后两位为位码。01-09区是特殊字符、10-55区是按拼音排序的3755个常用汉字、56-87区是3008个按部首排序的汉字。

gb2312(汉字信息交换码):
   ascii码只能表示英文,为了在计算机输入汉字,所以国家根据区位码制定了gb2312(国标码)。包含682个符号和6763个汉字。gb码由4位十六进制数字构成,两个首位为0的字节表示一个字符,是一种双字节编码,编码范围0x2121-0x7E7E。
    区位码和国标码之间的对应关系--将汉字区位码的区号和位号分别转换成十六进制,然后加0x2020就可以得到gb码。

gbk(汉字扩展内码规范):
    由于gb2312只收录了常用汉字,在应用经常有生僻字无法表示,所以国家扩展了gb2312得到的大字符集,共有20902个汉字。

机内码:
    由于gb码制定的时候,晕了头把最高位规定为0,在实际应用中和ascii码产生了冲突,计算机无法分辨一个字节是一个ascii字符还是半个gb字符,所以搞了个补丁似的机内码。机内码把gb码的2个字节最高位置1,这样计算机认字符时就知道看到首位为1的字节,2个组成一个字符。gb码就可以在计算机中和ascii无冲突的存储与使用。
机内码和gb码的对应关系--将gb码加上0x8080就是机内码了。

asni码:
    在ascii基础上扩充的其它语言字符编码。gb码就是其中的一种,还包括日文、朝鲜文、繁体中文(big5)等等,它们都和ascii兼容。不过这些编码互相却不兼容,因为它们都用最高为1的字节存储,计算机无法区分也就不能同时使用。

big5(大五码):
    这也是我们用得较多的内码,由台湾制定的汉字编码,包含420个符号和13070个繁体汉字。编码范围是0x8140-0xFE7E和0x81A1-0xFEFE,图形符号存储在0xA140-0xA17E及0xA1A1-0xA1FE,汉字为0xA440-0xF97E及0xA4A1-0xF9FE。

附录:

1.ascii码表

2.扩展ascii码表

3.部分区位码表
  01区 (各类符号)
    0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
  0100  、 。 · ˉ ˇ ¨ 〃 々 - ~ ‖ … ' ' " " 〔 〕
  0120 〈 〉 《 》 「 」『 』 〖 〗 【 】 ± × ÷ ∶ ∧ ∨ ∑ ∏
  0140 ∪ ∩ ∈ ∷ √ ⊥ ∥ ∠ ⌒ ⊙ ∫ ∮ ≡ ≌ ≈ ∽ ∝ ≠ ≮ ≯
  0160 ≤ ≥ ∞ ∵ ∴ ♂ ♀ ° ′ ″ ℃ $ ¤ ¢ £ ‰ § № ☆ ★
  0180 ○ ● ◎ ◇ ◆ □ ■ △ ▲ ※ → ← ↑ ↓ 〓
  02区 (各类数字)
    0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
  0200 ⅰ ⅱ ⅲ ⅳ ⅴ ⅵ ⅶ ⅷ ⅸ ⅹ            ⒈ ⒉ ⒊
  0220 ⒋ ⒌ ⒍ ⒎ ⒏ ⒐ ⒑ ⒒ ⒓ ⒔ ⒕ ⒖ ⒗ ⒘ ⒙ ⒚ ⒛ ⑴ ⑵ ⑶
  0240 ⑷ ⑸ ⑹ ⑺ ⑻ ⑼ ⑽ ⑾ ⑿ ⒀ ⒁ ⒂ ⒃ ⒄ ⒅ ⒆ ⒇ ① ② ③
  0260 ④ ⑤ ⑥ ⑦ ⑧ ⑨ ⑩ ㈠ ㈡ ㈢ ㈣ ㈤ ㈥ ㈦ ㈧ ㈨ ㈩
  0280 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ Ⅹ Ⅺ Ⅻ
  08区 (拼音、注音)
    0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
  0800 ā á ǎ à ē é ě è ī í ǐ ì ō ó ǒ ò ū ú ǔ
  0820 ù ǖ ǘ ǚ ǜ ü ê ㄅ ㄆ ㄇ
  0840 ㄈ ㄉ ㄊ ㄋ ㄌ ㄍ ㄎ ㄏ ㄐ ㄑ ㄒ ㄓ ㄔ ㄕ ㄖ ㄗ ㄘ ㄙ ㄚ ㄛ
  0860 ㄜ ㄝ ㄞ ㄟ ㄠ ㄡ ㄢ ㄣ ㄤ ㄥ ㄦ ㄧ ㄨ ㄩ
  09区 (制表符)
    0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
  0900 ─ ━ │ ┃ ┄ ┅ ┆ ┈ ┉ ┉ ┊ ┋ ┌ ┍ ┎ ┏
  0920 ┐ ┑ ┒ ┓ └ ┕ ┖ ┗ ┘ ┙ ┚ ┛ ├ ┝ ┞ ┟ ┠ ┡ ┢ ┣
  0940 ┤ ┥ ┦ ┧ ┨ ┩ ┪ ┫ ┬ ┭ ┮ ┯ ┰ ┱ ┲ ┳ ┴ ┵ ┶ ┷
  0960 ┸ ┹ ┺ ┻ ┼ ┽ ┾ ┿ ╀ ╁ ┃ ╃ ╄ ╅ ╆ ╇ ╈ ╉ ╊ ╋

字符编码:区位/国标(gb2312、gbk)/机内码/ASCII/ANSI/Big5相关推荐

  1. 字符编码、常见字符集解析(ASCII、Unicode、UTF-8、GB2312等)

    文章目录 字符编码 ASCII Unicode UTF-8 GB2312 C++中的字符类型 python中的字符编码 小结 各种字符编码的转换是个非常容易混淆的问题,这篇文章旨在梳理字符编码.常见字 ...

  2. java中文乱码解决之道(二)—–字符编码详解:基础知识 + ASCII + GB**

    原文出处:http://cmsblogs.com/?p=1412 在上篇博文(java中文乱码解决之道(一)-–认识字符集)中,LZ简单介绍了主流的字符编码,对各种编码都是点到为止,以下LZ将详细阐述 ...

  3. 字符编码——详解常用字符集(ASCII,ISO8859-1,GB2312,GBK,Unicode)和字符编码(UTF-8,UTF-16)

    目录 ASCII 由来 包含哪些字符 采用什么字符编码,如何编码 每个字符占几个字节 ISO8859-1 由来 包含哪些字符 采用什么字符编码,如何编码 每个字符占几个字节 GB2312 由来 包含哪 ...

  4. 关于JAVA字符编码:Unicode,ISO-8859-1,GBK,UTF-8编码及相互转换

    出处: https://www.cnblogs.com/haimishasha/p/6117968.html 目录 1.1. ISO-8859-1 通常叫做Latin-1 1.2. GB2312/GB ...

  5. 【转】刨根究底字符编码【2.0版】(3):字符编码的由来、演变与ASCII码

    为什么需要字符编码 1. 计算机一开始发明出来时是用来解决数字计算问题的,后来人们发现,计算机还可以做更多的事,例如文本处理. 但计算机其实挺"笨"的,它只"认识&quo ...

  6. Qt 字符编码转换(UTF-8 转换为 GBK) \u7528\u6237\u672a\u7b7e\u7ea6

    UTF-8 转换为 GBK \u7528\u6237\u672a\u7b7e\u7ea6 编码知识(\u7528\u6237\等的就是Unicode编码) 转换编码示例 编码知识(\u7528\u62 ...

  7. C语言判断读取的文件内容字符编码是UTF-8还是GBK

    自定义两个字符编码判断函数 bool is_str_utf8(const char* str); bool is_str_gbk(const char* str); 测试文件 代码详细: #inclu ...

  8. c++ string/char* 字符编码转换 (utf8,chs,gbk...)

    本文用于介绍不同编码格式的string(char*)之间的转换.明确Unicode,UTF-8,string,wstring概念,以及locale name之前, 先简单了解两个概念 字符集: 为每一 ...

  9. C++中字符编码的转换(Unicode、UTF-8、ANSI)

    C++的项目,字符编码是一个大坑,不同平台之间的编码往往不一样,如果不同编码格式用一套字符读取格式读取就会出现乱码.因此,一般都是转化成UTF-8这种平台通用,且支持性很好的编码格式. Unicode ...

最新文章

  1. 《软件测试的艺术》读书笔记 - 1
  2. oidc_使用Java EE和OIDC构建Java REST API
  3. Spring AOP配置文件
  4. Laravel.com 中国镜像、中文站点
  5. Hiho----无间道之并查集
  6. MISRA C_2012规则翻译、解读、示例
  7. 同济大学计算机系的课程,同济大学计算机系本科生培养方案
  8. 第四章 函数式编程(Lambda表达式Stream流)
  9. linux中mtd动态加载,Linux 2.6.11 下 MTD驱动情景实例分析
  10. python图片转pdf
  11. 用计算机解决问题听课笔记,《用计算机解决问题的一般步骤》说课稿
  12. IT基础架构规划方案三(IT基础软件和系统规划)
  13. 混沌图像---蔡氏电路的漩涡
  14. CISSP资料:独家笔记
  15. 怎么样培养极限运动身体素质
  16. benchmarksql测试mysql_使用benchmarkSQL测试数据库的TPCC
  17. 产品的发展趋势—让人类充满幸福感的产品
  18. CNN卷积神经网络 ILSVRC-2012
  19. Android开发实战《智慧北京》——4.WebView的使用
  20. 计算机鼠标左键不起作用,鼠标左键失灵怎么办 鼠标左键失灵处理方法【详解】...

热门文章

  1. SQL Server 查看表结构
  2. SAP系统PM模块概述-OVERVIEW
  3. mysql 秒和时分秒格式相互换算
  4. 青春痘的日常治疗方法
  5. WEB前端开发工具--整理
  6. DM7全库备份失败报错“管道连接超时”处理流程
  7. AS7341光谱传感器测量色温color_temperature_学习笔记
  8. 莫烦python教程部分代码
  9. 如何编写高质量的 JS 函数(3) --函数式编程[理论篇]
  10. 四个步骤实现在ESRI ArcMap中加载17.6G离线卫星地图的方法