GB2312、GB18030、GBK、UNICODE、BIG5之间兼容关系如何?
常用字符集分类 ASCII及其扩展字符集 作用:表语英语及西欧语言。 位数:ASCII是用7位表示的,能表示128个字符;其扩展使用8位表示,表示256个字符。 范围:ASCII从00到7F,扩展从00到FF。 ISO-8859-1字符集 作用:扩展ASCII,表示西欧、希腊语等。 位数:8位, 范围:从00到FF,兼容ASCII字符集。 GB2312字符集 作用:国家简体中文字符集,兼容ASCII。 位数:使用2个字节表示,能表示7445个符号,包括6763个汉字,几乎覆盖所有高频率汉字。 范围:高字节从A1到F7, 低字节从A1到FE。将高字节和低字节分别加上0XA0即可得到编码。 BIG5字符集 作用:统一繁体字编码。 位数:使用2个字节表示,表示13053个汉字。 范围:高字节从A1到F9,低字节从40到7E,A1到FE。 GBK字符集 作用:它是GB2312的扩展,加入对繁体字的支持,兼容GB2312。 位数:使用2个字节表示,可表示21886个字符。 范围:高字节从81到FE,低字节从40到FE。 GB18030字符集 作用:它解决了中文、日文、朝鲜语等的编码,兼容GBK。 位数:它采用变字节表示(1 ASCII,2,4字节)。可表示27484个文字。 范围:1字节从00到7F; 2字节高字节从81到FE,低字节从40到7E和80到FE;4字节第一三字节从81到FE,第二四字节从30到39。 UCS字符集 作用:国际标准 ISO 10646 定义了通用字符集 (Universal Character Set)。它是与UNICODE同类的组织,UCS-2和UNICODE兼容。 位数:它有UCS-2和UCS-4两种格式,分别是2字节和4字节。 范围:目前,UCS-4只是在UCS-2前面加了0×0000。 UNICODE字符集 作用:为世界650种语言进行统一编码,兼容ISO-8859-1。 位数:UNICODE字符集有多个编码方式,分别是UTF-8,UTF-16和UTF-32。
原文地址:http://blog.sina.com.cn/s/blog_97ca688b010130kl.html
GB2312、GB18030、GBK、UNICODE、BIG5之间兼容关系如何?相关推荐
- GB2312、GBK、BIG5、Unicode及字符编码基础知识
GB2312.GBK.BIG5.Unicode及字符编码基础知识 在搜狗的设置里面有个选项,要用户选择使用GBK还是GB2312,论坛里面常常有人要求输入法支持BIG5编码,也有人提到 Unicode ...
- GBK与Big5之间如何做内码转换?
GBK与Big5之间如何做内码转换? this is a question posted on 2012-08-19 10:11 lexus 阅读(...) 评论(...) 编辑 收藏 转载于:htt ...
- 各种编码格式(GB2312,GBK,GB18030,unicode,utf-8)之间的关系
汉字常用编码格式 为了在屏幕上显示字符.需要下面几个步骤: 制作所有字符对应的字模.比如大写字母A长什么样.这个模样就是最终显示在屏幕上图形,即我们看到的字符A. 为对所有的字符进行编码.比如大写字母 ...
- ASCII、Unicode、GBK、UTF-8之间的关系
一.ASCII编码 目录 一.ASCII编码 二.GBK编码 三.Unicode编码 四.UTF-8编码 五.Unicode和UTF-8之间的转换 六.Little endian 和 Big endi ...
- ASCII, GB2312, GBK, Unicode, UTF8之间的区别和联系
原文链接:https://zhuanlan.zhihu.com/p/258345888 感谢原作者的分享~本博客仅仅是为了做笔记 计算机是美国人发明的, 早期在处理文字方面, 美国人很自然地只考虑处理 ...
- NVIDIA,显卡驱动,CUDA版本之间兼容关系及安装
NVIDIA显卡,显卡驱动版本及CUDA版本兼容关系及如何选择 NVIDIA显卡,显卡驱动版本及CUDA版本兼容关系及如何选择 要配置NVIDIA显卡的CUDA,各种版本之间的依赖关系以及与其他使用G ...
- 【图形处理】字模软件与汉字取模(GB2312、GBK,BIG5)(草稿)
由于需要在LCD显示屏上绘制汉字,找了N多的字模软件. 现将个人对汉字取模的实现过程及软件使用写出来,不足之处,望留言指正. 导论 文章将按照汉字编码.图像取模. 一.汉字编码 1234 GB2312 ...
- 【码农说码】手撕锟斤拷,彻底搞懂GB2312,GBK,Big5,ASCII,UTF-8,UTF-32的前世今生
详解Java中的标识符,字符,占位符·_m0_56164356的博客-CSDN博客 手撕原理,拳拳到肉,剖析初识Java时那些困惑你我的牛马问题之:标识符,字面量,字符以及格式化占位符 Java中的基 ...
- 字符编码ASCII、ANSI、DBCS、MBCS、GB2312、GBK、GB18030、UTF-8、UTF-16、Unicode、emoji
字符必须编码后才能被计算机处理.计算机使用的缺省编码方式就是计算机的内码. 内码是指操作系统内部的字符编码.早期操作系统的内码是与语言相关的.现在的Windows在系统内部支持Unicode,然后用代 ...
最新文章
- FFmpeg将Jpeg 编码到视频中
- android 继承ListView实现滑动删除功能.
- 如何实现Android平台GB28181前端设备接入
- Linux 下 -bash: mysql: command not found解决办法
- 十六进制报文用wireshark打开
- 光猫gpon和epon的区别
- SQL数据库恢复挂起
- Endnote X8激活注册信息
- 【经验】使用WPS的公式编辑器时,弹出提示“MT Extra 字体无效,请重新安装”
- Python-获取法定节假日
- 2003服务器安全攻略
- day_7:代理使用
- java fmail发送邮件_【已实测通过】JavaMail常用的几种邮件发送方式
- Open For Bussiness (HelloWorld)
- 7-26 输出大写英文字母
- sonar本地扫描,没有胡里花哨的操作,通俗易懂~
- A股-入门-融资融券介绍及操作技巧
- A_Prn_Barcode 应用code128码的 注意事项
- Android常用加密手段之MD5加密(字符串加密和文件加密)
- JS 排序算法详解(冒泡排序,选择排序,插入排序,希尔排序,快速排序)