搞清楚字符编码07-万国码[3]
这篇博客介绍万国码中的实际存储编码
ucs-2
变长存储与不变长存储
ucs-2
是我们介绍的第一种实际存储编码,对实际存储编码我们要先说两个概念:变长存储
与不变长存储
- 变长存储:各个字符编码的长度可能不同,如
utf-8
- 不变长存储:每个字符编码的长度都是相同的,如
ucs-2
、utf-32
ucs-2是什么
ucs2
是一种理论编码
,ucs-2
是一种实际存储编码
,它是对ucs2的实现.ucs-2
编码有时也称为Unicode
编码
ucs-2的特点
- ucs-2每个编码都是2个字节,不变长存储.
- 最多可以有65536个编码.
引出utf-8
- 在ucs-2中每个字符都是2个字节,对于汉字来说还好,所在的汉字这两个字节都会用到.
- 但对于拉丁字符,就会浪费高8位的那个一字节,例如
A
在ucs-2中的编码就是00000000 01000001
,高8位的那个0
就是为了2个字节的定长存储填充上去的,显然这个字节的空间就浪费了. - 为了解决这个问题,出现了
utf-8
搞清楚字符编码07-万国码[3]相关推荐
- 搞清楚字符编码08-万国码[4](utf-8)
这篇博客介绍万国码中的实际存储编码utf-8 utf-8是什么 utf-8是一种实际存储编码 它即可以存储理论编码ucs2又可以存储理论编码ucs4 变长存储,各个字符编码的长度可能不相同. 它是为了 ...
- 搞清楚字符编码10-万国码[6]
这篇博客简要介绍一下万国码的BOM信息以及万国码的大小端 实际存储编码总结 在前边的几篇博客中介绍在主要的几种万国码的实际存储编码,在这里简单的总结一下. 实际存储编码 对应的理论编码 是否变长存储 ...
- 搞清楚字符编码09-万国码[5]
这篇博客我们来介绍万国码实际存储编码中的utf-16与utf-32 utf-16是什么 utf-16是理论编码ucs4的一种实际存储编码 基本单元是2个字节 变长存储,存储BMP时长度是2个字节,存储 ...
- 搞清楚字符编码05-万国码[1]
万国码的基本知识点 万国码是由国际标准组织和统一码联盟共同制定的. 万国码有两个版本,第一个版本的最大编码长度是2个字节,第二个版本的最大编码长度是4个字节. 万国码的实现 万国码的实现分为两个层次: ...
- 搞清楚字符编码06-万国码[2]
这篇博客介绍理论编码ucs4 编码范围 ucs4共有4个字节,理论允许的编码范围为 00000000 00000000 00000000 00000000 至 11111111 11111111 11 ...
- python day2 python基础 列表、元组操作 字符串操作 字典操作 集合操作 文件操作 字符编码与转码...
本节内容 列表.元组操作 字符串操作 字典操作 集合操作 文件操作 字符编码与转码 1. 列表.元组操作 列表是我们最以后最常用的数据类型之一,通过列表可以对数据实现最方便的存储.修改等操作 定义列表 ...
- php查看字符编码,PHP实现检测当前字符编码并转码的方法
本文主要和大家分享PHP实现检测当前字符编码并转码的方法,结合文字和代码,希望能帮助到大家. 一.检测当前字符串编码并将编码改为utf-8 1 获取当前字符串的编码 $encode = mb_dete ...
- Python之令人心烦意乱的字符编码与转码
ASC-II码:英文1个字节(8 byte),不支持中文: 高大上的中国,扩展出自己的gbk.gb2312.gb2318等字符编码. 由于各个国家都有自己的编码,于是就需要统一的编码形式用于国际流传, ...
- 彻底搞懂 字符 编码 GBK 和 UTF8
转:彻底搞懂编码GBK和UTF8 彻底搞懂编码 GBK 和 UTF8 常用编码格式一览 首先来看一下常用的编码有哪些,截图自Notepad++.其中ANSI在中国大陆即为GBK(以前是GB2312), ...
最新文章
- phoenix kerberos 连接配置
- .NET 大数据实时计算--学习笔记
- SEO原创文章制作器
- R 读取excel的方法
- 使用haystack实现django全文检索搜索引擎功能
- 【软件工程】极限编程
- ffmpeg 封面提取
- 编译器错误消息: CS0006: 未能找到元数据文件 System.EnterpriseServices
- 关闭Windows 2008下面应用程序出错后的提示
- 简单易懂的softmax交叉熵损失函数求导
- java文件转码工具-native2ascii.exe命令简介
- 阿里巴巴java开发手册心得_阿里巴巴JAVA开发手册总结
- matlab kdj代码,KDJ交易系统原理、用法及源代码(KDJ系统)
- Matlab中图形对象属性gcf使用
- 专项训练——判断推理
- PADS Logic Decal、Layout Decal绘制
- javaSE 笔记全!
- 打开网站报数据库错误 is marked as crashed and should be repaired (搞定)
- 开源为什么是“白色”的?
- 关于制作赛车游戏的一些入门知识