编码方式:UTF-8和GBK
UTF-8 是一种国际化标准的文字编码,GBK 是中国自己的文字编码,Windows系统程序已经将最初的UTF-8转向Unicode。
1、UTF-8
1.1 背景
1.2 特点
- 英文使用一个字节编码(8bit),中文使用3个字节编码(24bit).所以对于中文而言,GBK更加节省空间;对于英文而言,GB更加耗费空间。
- 包含全世界所有国家需要用到的字符,是世界标准
2、GBK
2.1 背景
GBK是在国家标准GB2312基础上扩容后兼容GB2312标准,包含全部中文字符。
2.2 特点
- 不论中 | 英 文,都采用双字节表示,只不过中文的最高位为1
- 包括所有的中文字符
- GB2312、GBK、GB18030都是中文编码方式,向下兼容。GB2312包含7000多个汉字和字符,GBK包含21000多个,GB18030包含27000多个。
- 跟ascii是怎么区分的呢?
- 如果高字节的高位为1(也就是高字节大于127),就表示是汉字
3、ASCII编码(ISO-8859-1)
3.1 背景
3.2 特点
- 是鼻祖,最简单的方式,字节高位为0。
4、Unicode编码
4.2 特点
- Unicode是统一编码,它建立了一个全世界统一的码表。世界上的所有文字,在这张码表中都是唯一的
- UTF-8是Unicode的一种存储、传输方式。它将整个Unicode码表分为3部分
- 000 - 007F 这部分是最初的ascii部分,按原始的存储方式,即0xxxxxxx
- 0080 - 07FF 这部分存储为110xxxxx 10xxxxxx
- 0800 - FFFF 这部分存储为1110xxxx 10xxxxxx 10xxxxxx
参考文献
[ 1 ] UTF-8与GBK的区别
编码方式:UTF-8和GBK相关推荐
- 常见编码方式(码表)
ASCII:美国标准信息交换码 用一个字节的7位可以表示(只有英文.阿拉伯数字以及一些特殊符号) ISO8859-1(Latin-1):欧洲码表or拉丁码表 用一个字节的8位表示.又称Latin-1( ...
- 彻底搞懂编码ASCII、Unicode、GBK 和 UTF8 、UTF-16、UTF-32编码方式(非常经典)
GBK,ISO-8859-1,GB2312的本质区别 编码有几种 ,计算机最初是在美国等国家发明的 所以表示字符只有简单的几个字母只要对字母进行编码就好 我们标准码 iso-8859-1 这就是一个标 ...
- 字符集、字符编码、国际化、本地化简要总结(UNICODE/UTF/ASCII/GB2312/GBK/GB18030)
PS:要转载请注明出处,本人版权所有. PS: 这个只是基于<我自己>的理解, 如果和你的原则及想法相冲突,请谅解,勿喷. 环境说明 普通的linux 和 普通的windows. ...
- Java编码ASCII、GB2312、GBK、Unicode、UTF-8、UTF-16 编码方式详解
1 ASCII American Standard Code for Information Interchange.最早最通用的单字节编码系统,因为发明时间早,所以ASCII编码表的设计较为简单. ...
- Unicode、UTF 和 ISO-8859-1等编码方式详解与浏览器URL编码
将字符转换为二进制码的过程,我们称为编码,将二进制码转换为字符的过程,我们称为解码. 编码和解码时所采用的规则,我们称为字符集 常见的字符集: ASCII - 美国人编码,使用7位来对美国常用的字符进 ...
- mysql默认编码改为gbk_查看改mysql编码方式让它支持中文(gbk或者utf8)
MySQL的默认编码是Latin1,不支持中文,要支持中文需要把数据库的默认编码改为gbk或者utf8. 1.需要以root用户身份登录才可以查看数据库编码方式(以root用户身份登录的命令为:> ...
- html转换编码格式,html编码转换 html编码设置utf gbk编码转换图文教程
html编码转换 html编码设置utf gbk编码转换图文教程篇 常用HTML编码之urf-8编码转换为gb2312编码或者gb2312转换为utf-8编码快速转换设置,这里DIVCSS5介绍使用D ...
- 字符的编码方式 ASCII 、GBK 、UTF-8 、Unicode 、Unicode big endian
字符的编码方式很多种 ,我们常用到的是ASCII .GBK .UTF-8 .Unicode .Unicode big endian等. 想查看的话,可以用记事本新建一个txt文档,里面输入字符或汉字, ...
- 常见编码方式(ASKII、GBK、UTF-8等)
常见编码方式 1.美国 1.1 ASCII 2. 西欧 2.1 ISO-8859-1 2.2 windows-1252 3. 中国 3.1 GB2312 3.2 GBK 3.3 GB18030 4. ...
最新文章
- java 基础知识八 正则表达式
- 使用TestStack.White进行Windows UI的自动化测试 (1) 基础篇
- Android中文输入的新选择——搜狗拼音输入法
- python中id3决策树算法_ID3决策树算法实现(Python版)
- ECS 选款利器!PTS助您快速上云!
- java axis2小实例_java webservice axis2简单开发实例
- 《白鹿原》金句摘抄(八)
- 微信小程序最常用的布局——Flex布局
- 响应式网页设计简单入门
- 华为鸿蒙OS 2.0系列Beta 2发布:逼近公测版
- 为什么我花了三个半月准备的面试还是砸了?附 iOS 开发者求职攻略
- 图像的像素原点_超火的机器视觉OpenCVSharp学习笔记3——图像形态学处理
- 打开excel后,提示更新链接的原因(含批量处理VBA代码)
- 【滤波器】基于matlab GUI IIR数字滤波器设计【含Matlab源码 044期】
- 如何将Android手机用作调制解调器; 无需生根,Redux
- 你会用计算机吗怎么写,你会用computer吗
- 你需要一个什么样的网站开发流程?
- 黑魂3无法从服务器获取信息,黑魂3怎么读取信息 | 手游网游页游攻略大全
- 求生之路2服务器模式修改参数,求生之路2参数修改控制台命令_求生之路2参数修改控制台命令方法_牛游戏网...
- C语言与C++常见问答题