Unicode 是容纳世界所有文字符号的国际标准编码,使用四个字节为每个字符编码。

UTF 是英文 Unicode Transformation Format 的缩写,意为把 Unicode 字符转换为某种格式。UTF 系列编码方案(UTF-8、UTF-16、UTF-32)均是由 Unicode 编码方案衍变而来,以适应不同的数据存储或传递,它们都可以完全表示 Unicode 标准中的所有字符。目前,这些衍变方案中 UTF-8 被广泛使用,而 UTF-16 和 UTF-32 则很少被使用。

UTF-8 使用一至四个字节为每个字符编码,其中大部分汉字采用三个字节编码,少量不常用汉字采用四个字节编码。因为 UTF-8 是可变长度的编码方式,相对于 Unicode 编码可以减少存储占用的空间,所以被广泛使用。

UTF-16 使用二或四个字节为每个字符编码,其中大部分汉字采用两个字节编码,少量不常用汉字采用四个字节编码。UTF-16 编码有大尾序和小尾序之别,即 UTF-16BE 和 UTF-16LE,在编码前会放置一个 U+FEFF 或 U+FFFE(UTF-16BE 以 FEFF 代表,UTF-16LE 以 FFFE 代表),其中 U+FEFF 字符在 Unicode 中代表的意义是 ZERO WIDTH NO-BREAK SPACE,顾名思义,它是个没有宽度也没有断字的空白。

UTF-32 使用四个字节为每个字符编码,使得 UTF-32 占用空间通常会是其它编码的二到四倍。UTF-32 与 UTF-16 一样有大尾序和小尾序之别,编码前会放置 U+0000FEFF 或 U+FFFE0000 以区分。
关于Unicode和UTF编码转换可以使用一个网站工具Unicode和UTF编码转换,可以清晰查看编码格式的内存格式

本文摘自:https://www.qqxiuzi.cn/bianma/Unicode-UTF.php

Unicode和UTF编码转换相关推荐

  1. UTF-8,Unicode,GB2312编码转换(C语言)

    UTF-8,Unicode,GB2312编码转换(C语言) 最近在做MQTT客户端的时候,遇到需要将输入的GB2312中文转换为UTF8的问题,这边做一个整理. UTF-8转GB2312 代码: /* ...

  2. 简单介绍Unicode和utf编码

    Unicode是一个字符集,码点范围为U+0000~U+10FFFF,共有1+2^20的取值空间,可以容纳超过100万个字符,至少需要21Bit(位)编码空间. 码点的意思是,这个字符集内的字符按序编 ...

  3. 汉字和utf编码转换

    package Sambo;public class URLtoUTF8 {//将汉字转换为编码public static String toUtf8String(String s) {StringB ...

  4. 编码转换以及乱码恢复

    ASCII编码 128个字符用7个位表示,计算机最小存储单位是byte,即8位.ASCII最高位是0,剩余7位表示字符.7位刚好表示0-127. 具体表示如下: Ascii 码对美国是够用了,但对别的 ...

  5. c++语言转换为字符串函数,C++字符编码转换函数

    1.MultiByteToWideChar 函数功能:该函数映射一个字符串到一个宽字符(unicode)的字符串.由该函数映射的字符串没必要是多 字节字符组. 函数原型: int MultiByteT ...

  6. Java 中文 Unicode 编码转换

    Java作为支持多平台的高级程序设计语言自然要支持多种编码方式才能满足程序设计的需要.但是在处理中文&其他编码之间的转换问题时往往出现各种问题,另程序员大伤脑筋.本文着重阐述了Java中文与U ...

  7. UTF-8到Unicode的编码转换

    开发者在线 Builder.com.cn 更新时间:2008-03-25作者:happykevins 来源:CSDN 本文关键词: 编码转换 unicode UTF-8 游戏 UTF-8就是Unico ...

  8. Unicode(UTF-8, UTF-16)令人混淆的概念 和 python unicode转中文及转换默认编码

    Unicode(UTF-8, UTF-16)令人混淆的概念 [转载](https://www.cnblogs.com/fnlingnzb-learner/p/6163205.html) 为啥需要Uni ...

  9. Qt中文编码和QString类Unicode编码转换

    1 window中文GBK编码和Unicode编码转换 //GBK‐> QString QString str = QString::fromLocal8Bit("新浪微博" ...

  10. 关于Laravel中使用response()方法调用json()返回数据unicode编码转换的问题解决

    关于Laravel中使用response()方法调用json()返回数据unicode编码转换的问题解决 参考文章: (1)关于Laravel中使用response()方法调用json()返回数据un ...

最新文章

  1. leetcode算法题--扁平化多级双向链表★
  2. (转)SQL 查找重复记录
  3. 【转】UML基础: 第 2 部分 - 对象图 (Object Diagram)
  4. centos eclipse java_CentOS7 安装 Eclipse
  5. css居中的几种方法_CSS布局中的水平居中的方法
  6. ZooKeeper:协调分布式系统入门指南
  7. ABP官方文档翻译 1.5 多租户
  8. 页面图片中间有条线----解决
  9. 工业和信息化部教育考试中心职业技术证书有必要考吗?
  10. (转发)详解汽车UDS诊断协议(二)
  11. DOS窗口的一些简单介绍
  12. java网络通信技术示例:简单的聊天小程序
  13. matlab 画折线图并美化
  14. 刘士颉老师——德鲁克“卓有成效”管理理论的践行者,曾任宜信公司培训负责人
  15. HTML——<blockquote>与<q>的区别
  16. 共模信号和差模信号的区别和抑制
  17. 数据库服务:数据库表空间扩容
  18. mysql1273,phpmysql错误 – #1273 – #1273 – 未知排序规则:’utf8mb4_general_ci’
  19. 互联网专利战场急先锋-高智发明,微软苹果等撑腰
  20. android网络转圈,网络请求时显示正在请求转圈

热门文章

  1. php 日期函数大全,php日期函数
  2. linux的ssh漏洞,Debian GNU/Linux Rssh安全绕过漏洞
  3. 铺铜规则在哪设定_干货丨PCB layout结合生产设计必须遵循这六大规则!
  4. matlab 差影法,MATLAB人体姿态行为识别[差影法,多姿势]
  5. 小菜找实习——阿里3月27日场笔试第一题
  6. matlab元素相同,Matlab:访问所有堆叠结构中的相同元素
  7. tensorrt 分割_超多,超快,超强!百度飞桨发布工业级图像分割利器PaddleSeg
  8. 20180124现货黄金复盘
  9. navicat for MySQL连接本地数据库时报1045错误的解决方法
  10. python 基础语法梳理(二)