UTF8、UTF16、UTF32都是unicode字符集的字符编码。

UTF意思是unicode转换格式(Unicode transform format),出现UTF8、UTF16、UTF32是出于要在内存中存储字符的目的而对unicode字符编号进行编码。

UTF8、UTF16、UTF32区别:(8、16、32可看做每种字符编码存储所需的最少的比特位数)

UTF8:存在单字节编码,兼容ASCII;当编码为一个字节,则设最高比特位为0;当编码超过一个字节,则需要几个字节,就在第一个字节从最高位开始令连续的几个比特位为1,之后的字节最高位为10。

UTF32:用固定长度的字节存储字符编码,不管Unicode字符编号需要几个字节,全部都用4个字节存储,直接存储Unicode编号。无需经过字符编号向字符编码的转换步骤,提高效率,用空间换时间。

UTF16:使用2或4个字节进行存储。对于Unicode编号范围在0~FFFF之间的字符,统一用两个字节存储,无需字符转换,直接存储Unicode编号。对于Unicode字符编号在10000-10FFFF之间的字符,UTF16用四个字节存储,简单说就是:将Unicode字符编号(3字节)分为两部分,高位部分(Unicode字符编号中占1.5个字节)用一个值介于 D800-DBFF (110110yy yyyyyyyy,y为0/1)之间的双字节存储,低位部分用一个值介于 DC00-DFFF (110111xx xxxxxxxx,x为0/1)的双字节存储。而介于D800-DFFF之间的编码在Unicode中是预留的,不安排字符,如果Unicode中有字符的编号是这之间的值,会引发冲突和歧义,很有可能一个不常见字符(存储为四个字节)最后被读成两个常见字符(存储为两个字节)。

参考:https://blog.csdn.net/pipi1375/article/details/84784392

UTF8、UTF16、UTF32区别相关推荐

  1. Unicode, UTF8, UTF16, UTF32

    Unicode, UTF8, UTF16, UTF32之间的关系 Unicode是编码字符集,而UTF-8, UTF-16, UTF-32是字符集编码. Unicode用一些基本的保留字符制定了三套编 ...

  2. UTF-8,UTF-16,UTF-32编码方式都是UNICODE,但只是他们的保存方式不同。

    这是转载自网络上的博文,UTF-8,UTF-16,UTF-32编码方式都是UNICODE,但只是他们的保存方式不同. Unicode(统一码.万国码.单一码)是一种在计算机上使用的字符编码.它为每种语 ...

  3. UTF-8/UTF-16/UTF-32、Unicode和GB18030编码的关系

     1.除了极其少量的API,操作系统内部操作串已经是UNICODE的了,使用ANSI版本的API只会增加额外的转换操作,性能其实降低了. 2.对于多语言混合的字符串,如果采用ANSI编码,显示一定 ...

  4. Unicode,UTF-8,UTF-16,UTF-32

    这是转载自网络上的博文,UTF-8,UTF-16,UTF-32编码方式都是UNICODE,但只是他们的保存方式不同. Unicode(统一码.万国码.单一码)是一种在计算机上使用的字符编码.它为每种语 ...

  5. Unicode, UTF-8, UTF-16, UTF-32, UCS-2, UCS-4

    1. Unicode与ISO 10646 全世界很多个国家都在为自己的文字编码,并且互不想通,不同的语言字符编码值相同却代表不同的符号(例如:韩文编码EUC-KR中"한국어"的编码 ...

  6. 大端小端,ascii,unicode,utf8,utf16,utf32,gb2312,gbk,gb18030等字符编码问题

    字符编码的问题让我困惑了好久的一段时间,其实简单的想,字符编码没有什么东西的,可是想真弄明白还是花去了我一点时间,前端时间写了一个简单的log程序,主要的工作就是支持系统运行时输出日志信息,同时允许定 ...

  7. gbk, gb2312,big5,unicode,utf-8,utf-16的区别

    本文转自http://blog.chinaunix.net/uid-446337-id-94462.html详细说明了各种编码的区别于联系,对于支持国际化很重要,否则各种乱码能搞死人! Unicode ...

  8. 编码全解:从ASCII/ISO-8859/GB2312/GBK到Unicode的UCS-2/UCS-4/UTF-8/UTF-16/UTF-32

    1.ASCII编码 为了能在电报.打印机.计算机等电信设备上进行信息交换,就必须为不同的设备制定统一的编码格式.早期的电信设备字符编码基本都是使用6位编码.1963年美国国家标准协会(ANSI)制定并 ...

  9. 细说ASCII、GB2312/GBK/GB18030、Unicode、UTF-8/UTF-16/UTF-32编码

    参考: <编码标准-GB2312 GBK GB18030> <字符编码笔记:ASCII,Unicode 和 UTF-8> <字体编辑用中日韩汉字Unicode编码表> ...

  10. 关于UTF8,UTF16,UTF32,UTF16-LE,UTF16-BE

    Unicode是Unicode.org制定的编码标准,目前得到了绝大部分操作系统和编程语言的支持.Unicode.org官方对Unicode的定义是:Unicode provides a unique ...

最新文章

  1. 阿尔法特磁悬浮制冷机组荣获“2016年度中国数据中心优秀节能产品”殊荣
  2. 上海大学计算机学院客座教授,刘云虹教授受聘上海大学外国语学院客座教授并做学术讲座...
  3. php tp写构造函数,tp5参数绑定到构造函数
  4. STM32单片机启动文件startup_stm32f10x_hd.s详解
  5. Xshell出现要继续使用此程序必须应用到最新的更新或使用新版本
  6. 综合云平台 - OpenShift - 07
  7. Linux上安装gcc
  8. Android微信emoji表情,Android 软键盘和emoji表情切换方案,和微信几乎一样的体验...
  9. Drools规则引擎-如果Fact对象参数为null如何处理
  10. el-upload手动上传图片并限制图片数量、大小和格式
  11. mysql中的查找算法_7种查找算法解析
  12. 参赛必备 | “互联网+”大赛参赛攻略
  13. 工作展望简短_工作展望简短_时间2017工作展望
  14. 手机软件可让全民监控蚊媒病毒
  15. 机器学习之过拟合和欠拟合
  16. iperf测试工具使用方法
  17. 某公司高管疾呼:底层程序员离职率太高,有人入职不到半年就走!建议把恶意离职加入征信,让年轻人对公司有起码的尊重!...
  18. 第一篇文章,我想记录一点小小的成就感
  19. 度小满-数据仓库面试
  20. 解决国内vscode快速下载办法 下载vscode慢、网络失败的问题

热门文章

  1. 使用sil9233a芯片控制海思hi3531d的hdmi输入
  2. 程序员如何自我认知 自我了解
  3. windows7经典开机音乐_Windows 7正式退休,微软出手,网友含泪告别情怀:感谢11年陪伴...
  4. 制作“大白菜”启动U盘教程
  5. MySQL初级篇——视图的相关概念及应用举例
  6. Eclipse 安装 Jrebel插件
  7. 计算机 查找 功能的使用,详解电脑搜索快捷键是什么?
  8. android 陀螺仪滤波_Arduino MPU6050陀螺仪运用卡尔曼滤波姿态解算实验
  9. 66页三级医院智慧医院 信息化建设规划
  10. 口碑好工作站服务器维修,童颜玩物 惠普Z800顶级工作站深度拆解