UTF-8 是一种国际化标准的文字编码,GBK 是中国自己的文字编码,Windows系统程序已经将最初的UTF-8转向Unicode。

1、UTF-8

1.1 背景

1.2 特点

  • 英文使用一个字节编码(8bit),中文使用3个字节编码(24bit).所以对于中文而言,GBK更加节省空间;对于英文而言,GB更加耗费空间。
  • 包含全世界所有国家需要用到的字符,是世界标准

2、GBK

2.1 背景

GBK是在国家标准GB2312基础上扩容后兼容GB2312标准,包含全部中文字符。

2.2 特点

  • 不论中 | 英 文,都采用双字节表示,只不过中文的最高位为1
  • 包括所有的中文字符
  • GB2312、GBK、GB18030都是中文编码方式,向下兼容。GB2312包含7000多个汉字和字符,GBK包含21000多个,GB18030包含27000多个。
  • 跟ascii是怎么区分的呢?
    • 如果高字节的高位为1(也就是高字节大于127),就表示是汉字

3、ASCII编码(ISO-8859-1)

3.1 背景

3.2 特点

  • 是鼻祖,最简单的方式,字节高位为0。

4、Unicode编码

4.2 特点

  • Unicode是统一编码,它建立了一个全世界统一的码表。世界上的所有文字,在这张码表中都是唯一的
  • UTF-8是Unicode的一种存储、传输方式。它将整个Unicode码表分为3部分
    • 000 - 007F 这部分是最初的ascii部分,按原始的存储方式,即0xxxxxxx
    • 0080 - 07FF 这部分存储为110xxxxx 10xxxxxx
    • 0800 - FFFF 这部分存储为1110xxxx 10xxxxxx 10xxxxxx

参考文献

[ 1 ] UTF-8与GBK的区别

编码方式:UTF-8和GBK相关推荐

  1. 常见编码方式(码表)

    ASCII:美国标准信息交换码 用一个字节的7位可以表示(只有英文.阿拉伯数字以及一些特殊符号) ISO8859-1(Latin-1):欧洲码表or拉丁码表 用一个字节的8位表示.又称Latin-1( ...

  2. 彻底搞懂编码ASCII、Unicode、GBK 和 UTF8 、UTF-16、UTF-32编码方式(非常经典)

    GBK,ISO-8859-1,GB2312的本质区别 编码有几种 ,计算机最初是在美国等国家发明的 所以表示字符只有简单的几个字母只要对字母进行编码就好 我们标准码 iso-8859-1 这就是一个标 ...

  3. 字符集、字符编码、国际化、本地化简要总结(UNICODE/UTF/ASCII/GB2312/GBK/GB18030)

    PS:要转载请注明出处,本人版权所有. PS: 这个只是基于<我自己>的理解, 如果和你的原则及想法相冲突,请谅解,勿喷. 环境说明   普通的linux 和 普通的windows.    ...

  4. Java编码ASCII、GB2312、GBK、Unicode、UTF-8、UTF-16 编码方式详解

    1 ASCII American Standard Code for Information Interchange.最早最通用的单字节编码系统,因为发明时间早,所以ASCII编码表的设计较为简单. ...

  5. Unicode、UTF 和 ISO-8859-1等编码方式详解与浏览器URL编码

    将字符转换为二进制码的过程,我们称为编码,将二进制码转换为字符的过程,我们称为解码. 编码和解码时所采用的规则,我们称为字符集 常见的字符集: ASCII - 美国人编码,使用7位来对美国常用的字符进 ...

  6. mysql默认编码改为gbk_查看改mysql编码方式让它支持中文(gbk或者utf8)

    MySQL的默认编码是Latin1,不支持中文,要支持中文需要把数据库的默认编码改为gbk或者utf8. 1.需要以root用户身份登录才可以查看数据库编码方式(以root用户身份登录的命令为:> ...

  7. html转换编码格式,html编码转换 html编码设置utf gbk编码转换图文教程

    html编码转换 html编码设置utf gbk编码转换图文教程篇 常用HTML编码之urf-8编码转换为gb2312编码或者gb2312转换为utf-8编码快速转换设置,这里DIVCSS5介绍使用D ...

  8. 字符的编码方式 ASCII 、GBK 、UTF-8 、Unicode 、Unicode big endian

    字符的编码方式很多种 ,我们常用到的是ASCII .GBK .UTF-8 .Unicode .Unicode big endian等. 想查看的话,可以用记事本新建一个txt文档,里面输入字符或汉字, ...

  9. 常见编码方式(ASKII、GBK、UTF-8等)

    常见编码方式 1.美国 1.1 ASCII 2. 西欧 2.1 ISO-8859-1 2.2 windows-1252 3. 中国 3.1 GB2312 3.2 GBK 3.3 GB18030 4. ...

最新文章

  1. java 基础知识八 正则表达式
  2. 使用TestStack.White进行Windows UI的自动化测试 (1) 基础篇
  3. Android中文输入的新选择——搜狗拼音输入法
  4. python中id3决策树算法_ID3决策树算法实现(Python版)
  5. ECS 选款利器!PTS助您快速上云!
  6. java axis2小实例_java webservice axis2简单开发实例
  7. 《白鹿原》金句摘抄(八)
  8. 微信小程序最常用的布局——Flex布局
  9. 响应式网页设计简单入门
  10. 华为鸿蒙OS 2.0系列Beta 2发布:逼近公测版
  11. 为什么我花了三个半月准备的面试还是砸了?附 iOS 开发者求职攻略
  12. 图像的像素原点_超火的机器视觉OpenCVSharp学习笔记3——图像形态学处理
  13. 打开excel后,提示更新链接的原因(含批量处理VBA代码)
  14. 【滤波器】基于matlab GUI IIR数字滤波器设计【含Matlab源码 044期】
  15. 如何将Android手机用作调制解调器; 无需生根,Redux
  16. 你会用计算机吗怎么写,你会用computer吗
  17. 你需要一个什么样的网站开发流程?
  18. 黑魂3无法从服务器获取信息,黑魂3怎么读取信息 | 手游网游页游攻略大全
  19. 求生之路2服务器模式修改参数,求生之路2参数修改控制台命令_求生之路2参数修改控制台命令方法_牛游戏网...
  20. C语言与C++常见问答题

热门文章

  1. BIM室内装饰应用到底有多牛?Revit插件告诉你!
  2. 五脏六腑是怎么运作的?五脏六腑是怎么运作的?
  3. 图像旋转(C语言实现)
  4. oracle左外连接语法,Oracle 左外连接、右外连接、全外连接小总结
  5. seo是什么意思,seo是什么意思 职业
  6. OBIEE使用”集合操作”完成复杂格式报表
  7. 2019高速数据采集卡动态
  8. 【python】给你女神制作一个520图片墙吧~
  9. 浅析饥荒的游戏设计元素
  10. 【职场一些事】震撼职场的十一个寓言故事