常用字符集分类
ASCII及其扩展字符集
作用:表语英语及西欧语言。
位数:ASCII是用7位表示的,能表示128个字符;其扩展使用8位表示,表示256个字符。
范围:ASCII从00到7F,扩展从00到FF。
ISO-8859-1字符集
作用:扩展ASCII,表示西欧、希腊语等。
位数:8位,
范围:从00到FF,兼容ASCII字符集。
GB2312字符集
作用:国家简体中文字符集,兼容ASCII。
位数:使用2个字节表示,能表示7445个符号,包括6763个汉字,几乎覆盖所有高频率汉字。
范围:高字节从A1到F7, 低字节从A1到FE。将高字节和低字节分别加上0XA0即可得到编码。
BIG5字符集
作用:统一繁体字编码。
位数:使用2个字节表示,表示13053个汉字。
范围:高字节从A1到F9,低字节从40到7E,A1到FE。
GBK字符集
作用:它是GB2312的扩展,加入对繁体字的支持,兼容GB2312。
位数:使用2个字节表示,可表示21886个字符。
范围:高字节从81到FE,低字节从40到FE。
GB18030字符集
作用:它解决了中文、日文、朝鲜语等的编码,兼容GBK。
位数:它采用变字节表示(1 ASCII,2,4字节)。可表示27484个文字。
范围:1字节从00到7F; 2字节高字节从81到FE,低字节从40到7E和80到FE;4字节第一三字节从81到FE,第二四字节从30到39。
UCS字符集
作用:国际标准 ISO 10646 定义了通用字符集 (Universal Character Set)。它是与UNICODE同类的组织,UCS-2和UNICODE兼容。
位数:它有UCS-2和UCS-4两种格式,分别是2字节和4字节。
范围:目前,UCS-4只是在UCS-2前面加了0×0000。
UNICODE字符集
作用:为世界650种语言进行统一编码,兼容ISO-8859-1。
位数:UNICODE字符集有多个编码方式,分别是UTF-8,UTF-16和UTF-32。
原文地址:http://blog.sina.com.cn/s/blog_97ca688b010130kl.html

GB2312、GB18030、GBK、UNICODE、BIG5之间兼容关系如何?相关推荐

  1. GB2312、GBK、BIG5、Unicode及字符编码基础知识

    GB2312.GBK.BIG5.Unicode及字符编码基础知识 在搜狗的设置里面有个选项,要用户选择使用GBK还是GB2312,论坛里面常常有人要求输入法支持BIG5编码,也有人提到 Unicode ...

  2. GBK与Big5之间如何做内码转换?

    GBK与Big5之间如何做内码转换? this is a question posted on 2012-08-19 10:11 lexus 阅读(...) 评论(...) 编辑 收藏 转载于:htt ...

  3. 各种编码格式(GB2312,GBK,GB18030,unicode,utf-8)之间的关系

    汉字常用编码格式 为了在屏幕上显示字符.需要下面几个步骤: 制作所有字符对应的字模.比如大写字母A长什么样.这个模样就是最终显示在屏幕上图形,即我们看到的字符A. 为对所有的字符进行编码.比如大写字母 ...

  4. ASCII、Unicode、GBK、UTF-8之间的关系

    一.ASCII编码 目录 一.ASCII编码 二.GBK编码 三.Unicode编码 四.UTF-8编码 五.Unicode和UTF-8之间的转换 六.Little endian 和 Big endi ...

  5. ASCII, GB2312, GBK, Unicode, UTF8之间的区别和联系

    原文链接:https://zhuanlan.zhihu.com/p/258345888 感谢原作者的分享~本博客仅仅是为了做笔记 计算机是美国人发明的, 早期在处理文字方面, 美国人很自然地只考虑处理 ...

  6. NVIDIA,显卡驱动,CUDA版本之间兼容关系及安装

    NVIDIA显卡,显卡驱动版本及CUDA版本兼容关系及如何选择 NVIDIA显卡,显卡驱动版本及CUDA版本兼容关系及如何选择 要配置NVIDIA显卡的CUDA,各种版本之间的依赖关系以及与其他使用G ...

  7. 【图形处理】字模软件与汉字取模(GB2312、GBK,BIG5)(草稿)

    由于需要在LCD显示屏上绘制汉字,找了N多的字模软件. 现将个人对汉字取模的实现过程及软件使用写出来,不足之处,望留言指正. 导论 文章将按照汉字编码.图像取模. 一.汉字编码 1234 GB2312 ...

  8. 【码农说码】手撕锟斤拷,彻底搞懂GB2312,GBK,Big5,ASCII,UTF-8,UTF-32的前世今生

    详解Java中的标识符,字符,占位符·_m0_56164356的博客-CSDN博客 手撕原理,拳拳到肉,剖析初识Java时那些困惑你我的牛马问题之:标识符,字面量,字符以及格式化占位符 Java中的基 ...

  9. 字符编码ASCII、ANSI、DBCS、MBCS、GB2312、GBK、GB18030、UTF-8、UTF-16、Unicode、emoji

    字符必须编码后才能被计算机处理.计算机使用的缺省编码方式就是计算机的内码. 内码是指操作系统内部的字符编码.早期操作系统的内码是与语言相关的.现在的Windows在系统内部支持Unicode,然后用代 ...

最新文章

  1. FFmpeg将Jpeg 编码到视频中
  2. android 继承ListView实现滑动删除功能.
  3. 如何实现Android平台GB28181前端设备接入
  4. Linux 下 -bash: mysql: command not found解决办法
  5. 十六进制报文用wireshark打开
  6. 光猫gpon和epon的区别
  7. SQL数据库恢复挂起
  8. Endnote X8激活注册信息
  9. 【经验】使用WPS的公式编辑器时,弹出提示“MT Extra 字体无效,请重新安装”
  10. Python-获取法定节假日
  11. 2003服务器安全攻略
  12. day_7:代理使用
  13. java fmail发送邮件_【已实测通过】JavaMail常用的几种邮件发送方式
  14. Open For Bussiness (HelloWorld)
  15. 7-26 输出大写英文字母
  16. sonar本地扫描,没有胡里花哨的操作,通俗易懂~
  17. A股-入门-融资融券介绍及操作技巧
  18. A_Prn_Barcode 应用code128码的 注意事项
  19. Android常用加密手段之MD5加密(字符串加密和文件加密)
  20. JS 排序算法详解(冒泡排序,选择排序,插入排序,希尔排序,快速排序)

热门文章

  1. android 音频显示器,安卓手机投屏(带声音同步)教程
  2. git ------ git clone方法总结(可直接加账户和密码)
  3. Android项目实战(二十六):蓝牙连接硬件设备开发规范流程
  4. NatApp免费实现内网穿透
  5. wxPython 4.2.0 发布
  6. 硬件工程师都没人干了_将软件带到硬件上,到底意味着什么?
  7. 关于GPS 坐标系的那些事
  8. Spring Boot+JOOQ(五)进阶查询操作
  9. 如何查询大量DHL国际快递物流轨迹、签收情况
  10. php字符串加加运算,php 学习笔记