0)学习笔记:

我们常说的这句话“Unicode字符是2个字节”这句话有毛病

Unicode目前规划的总空间有17个平面, 0x0000---0x10FFFF,每个平面有 65536 个码点.

Unicode支持的字符上限是65536个 这句话也是有问题的,这65536个字符是我们最常用的基本字符,但是还有很多字符是在0x0000--0xFFFF之外的

unicode存储在计算机内存里肯定是需要编码的,那么就有UTF-8,UTF-16,UTF-32等编码方案。

每种编码方式有自己的特点,不同范围内的字符用不同的编码方式存储所需的字节数是不一样的。

1)

UTF-8具体的表现形式为:

  • 0xxxxxxx:单字节编码形式,这和 ASCII 编码完全一样,因此 UTF-8 是兼容 ASCII 的;
  • 110xxxxx 10xxxxxx:双字节编码形式;
  • 1110xxxx 10xxxxxx 10xxxxxx:三字节编码形式;
  • 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx:四字节编码形式。

转自: Unicode字符需要几个字节来存储? - 筱筱的春天 - 博客园

Unicode字符需要几个字节来存储?相关推荐

  1. 如何处理emoji等4字节的Unicode字符 - utf8mb4 vs. utf8 Collations

    1. Unicode是什么 Unicode(中文:万国码.国际码.统一码.单一码)是计算机科学领域里的一项业界标准.它对世界上大部分的文字系统进行了整理.编码,使得电脑可以用更为简单的方式来呈现和处理 ...

  2. MySQL字符编码的讨论:如何处理emoji等4字节的Unicode字符 - utf8mb4 vs. utf8 Collations

    1. Unicode是什么 Unicode(中文:万国码.国际码.统一码.单一码)是计算机科学领域里的一项业界标准.它对世界上大部分的文字系统进行了整理.编码,使得电脑可以用更为简单的方式来呈现和处理 ...

  3. 大容量导入或导出的数据格式 -- Unicode字符格式

    应用场景 使用包含扩展/DBCS 字符的数据文件在多个 SQL Server 实例之间大容量传输数据时,建议使用 Unicode 字符格式. 从服务器导出数据时,Unicode 字符数据格式允许使用与 ...

  4. unicode字符编码表下载_详解字符编码(上)

    作者 | 张奎 字符编码相关问题是软件开发过程中的常见问题,本文对字符编码的概念进行了介绍,并针对字符编码的常见问题给出了解释. 字符编码概念 下面以一个例子来引入对字符编码的介绍,汉字"柯 ...

  5. unicode字符、python乱码问题

    http://www.cnblogs.com/BeginMan/archive/2013/08/08/3246619.html#a1  Python常见常用知识点 http://blog.csdn.n ...

  6. 使用T-SQL管理数据中的Unicode字符

    In this article, I'll provide some useful information to help you understand how to use Unicode in S ...

  7. utf-8的英文字母和中文汉字是一个字符占几个字节

    转自https://blog.csdn.net/kindsuper_liu/article/details/80202150 英文字母和中文汉字在不同字符集编码下的字节数 英文字母: 字节数 : 1; ...

  8. ascii码 iso 8859-1 Unicode 字符编码 UTF8编码 区别 表格

    第一:编码简单描述 一.ASCII码:美国佬最初把自己的语言用计算表示,发现 0--127  能把字母表+其它符号全能表示出来 二.  iso 8859-1:欧洲人,0---127 是ASCII码,1 ...

  9. 一个字符究竟占多少字节辨析

    字符和字节的换算,则与编码方式有关,不同的字符所占的字节是不同的.: ASCII码: 一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间.一个二进制数字序列,在计算机中作为一个数 ...

  10. 转:Unicode字符集和多字节字符集关系

    原文地址: http://my.oschina.net/alphajay/blog/5691 unicode.ucs-2.ucs-4.utf-16.utf-32.utf-8 http://stallm ...

最新文章

  1. 多个if语句并列_P009 python基础之控制语句01
  2. 中山大学提出SimAM:无参Attention!助力分类/检测/分割涨点!
  3. python哪一版好用-Python 可视化工具库哪款最好用?哪款最不好用?
  4. java 周易解梦接口_周公解梦
  5. Django基础知识MTV
  6. RecyclerView的版本要和appcompat 的版本不一致 引发的错误
  7. layui获取checkbox选中值_小程序之十二 获取多选按钮数值及后续想法
  8. 美术师关于自己的报酬与工作的看法
  9. 单元测试JUnit 4 (一)——keeps the bar green to keeps the code clean
  10. 如果使用SQLExpress 2005时要求'sp_configure 'User instances enabled''
  11. cdo收取邮件_C#使用CDO发送邮件的方法
  12. python中bar是什么_python-如何添加一个单独的colobar,它将显示来...
  13. 第8-9讲 视觉里程计2
  14. oracle alter system kill,ALTER SYSTEM KILL SESSION详解
  15. 因子分析模型 - Python 做因子分析简直比 SPSS 还简单 - ( Python、SPSS)
  16. 全球及中国手机塔防游戏行业研究及十四五规划分析报告(2022)
  17. Oracle数据操作和控制语言详解
  18. kettle使用命令行来运行ktr和kjb
  19. C++ - 整数反转
  20. 最全的解酒方法-----让你千杯不...

热门文章

  1. 苹果偷学微信代码,程序员小哥:天知道微信为什么会引用这个变量
  2. 网站项目管理规范指南
  3. 开源推荐:表单收集系统-TDuck填鸭 v2版本!
  4. MVC 《web考勤管理系统》 项目研发文献
  5. 使用MySQL管理工具-SQLyog9.63报错号码2003,超详细解析
  6. css被点击后改变样式,Js 通过点击改变css样式
  7. 在线编辑Excel——插入图表
  8. Ansible自动化运维
  9. 华为服务器欧拉系统怎么改ip,EulerOS系统配置
  10. 温度循环试验标准gjb150-温度循环试验检测机构报告