各种编码中字母和汉字分别占多少字节
一、简单介绍
- ASCII (ASCII编码表一个字节表示,一个128个字符,实际上一个字节可以表示256个字符,只用128个)
- Unicode (Unicode编码表固定大小的编码使用两个字节来表示字符,字母和汉字统一都是占用两个字节这样浪费空间)
- utf-8(编码表,大小可变的编码字母使用1个字节,汉字使用3个字节)
- gbk(可以表示汉字,而且范围广,字母使用1个字节,汉字2个字节)
- gb2312(可以表示汉字,gb2312<gbk)
- big5码(繁体中文,台湾,香港)
二、常用的三种编码
ASCII编码介绍
1. ASCII码:上个世纪60年代,美国制定了一套字符编码(使用一个字),对英语字符与二进制位之间的关系,做了统一规定。这被称为ASCII码。ASCII码一共规定了128个字符的编码,只占用了一个字节的后面七位,最前面的1位统一规定为0。
特别提示:一个字节可以表示256个字符,ASCII码只用了128个字符
2.看一个完整的ASCII码表(可以自行百度)3.缺点:不能表示所有字符。
Unicode编码介绍
1.Unicode的好处:一种编码,将世界上所有的符号都纳入其中。每一个符号都给予一个独一无二的编码,使用Unicode没有乱码的问题。
2. Unicode的缺点:一个英文字母和一个汉字都占用2个字节,这对于存储空间来说是浪费。3.2的16次方是65536,所以最多编码是65536个字符。
4.编码0-127的字符是与ASCII的编码一样.比如 'a'在ASCII码是Ox61,在unicode码是
ox0061,都对应97.因此 Unicode码兼容ASCII码.
UTF-8编码介绍
1. UTF-8是在互联网上使用最广的一种 Unicode的实现方式(改进)
2.UTF-8是一种变长的编码方式。它可以使用1-6个字节表示一个符号,根据不同的符号而变化字节长度。
3.使用大小可变的编码字母占1个字节,汉字占3个字节
关于字符型本质探讨:
字符型存储到计算机中,需要将字符对应的码值(整数)找出来,比如'a'
存储:'a'==>码值97 ==>二进制(110 0001) ==>存储
读取:二进制(110 0001) =>97 ===> 'a'=>显示
各种编码中字母和汉字分别占多少字节相关推荐
- UTF-8 编码里,一个汉字占用多少个字节 -转
在查找 UTF-8 编码资料时发现,很多的帖子说的 UTF-8 编码里,一个汉字占用3个字节,有的还做了个证明,大概是这样的,创建一个没有BOM的UTF-8编码的文本文件,里面保存了几个汉字,然后查看 ...
- 关于C语言中的结构体所占的字节数 sizeof(struct)
C语言中的结构体所占的字节数 ,用sizeof求一个结构体的大小 C语言中用sizeof求结构体所占字节数的详细方法. 一.非嵌套结构体 struct one{char a; // 1(char所占字 ...
- python一个中文占几个字节_python中英文字母和中文汉字所占的字节
原博文 2020-04-13 21:27 − print(type('李杰'.encode('utf-8')))# print(type('李杰'.encode('gbk')))# print(len ...
- python中英文字母和中文汉字所占的字节
1.判断所占字节数可以用下面语句判断: 中文和符号: print(type('中文'.encode('utf-8'))) #输出为bytes类型 执行结果: <class 'bytes'> ...
- Java 一个数字、字母、汉字各占几个字节
汉字字符 2字节 英文字符 1字节 中文标点 2字节 英文标点 1字节 中国字比较复杂,1字节=8位,8位从0000 0000到1111 1111只能表示256个字符,2个字节是2*8=16位,从00 ...
- 常见编码介绍。一个字符在不同编码中分别占几个字节(新手向)
目录 什么是ASCII码? 1.介绍: 2.代码演示: 什么是Unicode码? 1.介绍: 2.注意事项的代码演示: 什么是utf-8? 一个字符在不同编码中分别占几个字节? 什么是ASCII码? ...
- utf-8 中的一个汉字占几个字节
utf-8 中的一个汉字占几个字节 占 2 个字节的:〇 占 3 个字节的:基本等同于 GBK,含 21000 多个汉字 占 4 个字节的:中日韩超大字符集里面的汉字,有 5 万多个 1 个 utf8 ...
- python中一个汉字点3个字节? utf-8
今天发现了一个汉字占了3个字节,一开始以为是两个呢,字符串切片时总出现乱码,后来才发现一个中文占3个字节.这才解决了乱码问题 原来 1. utf-8 编码中,一个汉字占三个字节.英文字母是一个占用一 ...
- utf-8编码下,一个字符最多占几个字节?
在UTF-8编码中:一个中文等于三个字节,中文标点占三个字节. 一个英文字符等于一个字节,英文标点占一个字节. Unicode编码:一个英文等于两个字节,一个中文(含繁体)等于两个字节.中文标点占两个 ...
最新文章
- ImageView.ScaleType /android:scaleType值的意义区别
- python画图,使用matplotlib和seaborn来设置图形的字体大小,坐标轴的线宽,风格,取值范围
- 浙江理工大学-2018-2019学年面向对象程序设计A-期末复习资料
- 多核cpu应用场景_操作系统基础11-关于多核编程
- 左神算法:单调栈结构(Java版)
- 我更看好rust飞鸽传书
- 使用php-amqplib连接rabbitMQ 学习笔记及总结
- orac l e数据库第一章
- 光缆成端接头的含义是指
- ax 2012 随笔
- 计算机管理如何格式化u盘,u盘无法格式化?0字节?教你5种方法格式化u盘,超简单!...
- kafka报错zookeeper is not a recognized option
- 用gin+xorm+docker编写Online Judge后端
- EfficientFormer | 苹果手机实时推理的Transformer模型,登顶轻量化Backbone之巅
- 通过.frm和.idb文件恢复mysql数据库
- 装饰者模式、代理模式与AOP
- Unable to start debugging.报错
- 两台虚拟服务器如何串联,两台tp-link路由器串联设置教程 | 192路由网
- 如何用css写出一个三角形
- [linux学习]centos下mysql的简单使用教程
热门文章
- 田忌赛马可能赢的场次
- linux mdev 命令,linux设备驱动----利用mdev(udev)自动创建设备文件节点
- 侵权:前端可能涉及到的侵权有哪些
- webrtc scoped_refptr
- SprinBoot-黑马-笔记
- 打开游戏提示“没有找到openal32.dll”问题的修复
- php token 自动过期,请求时token过期自动刷新token
- 弹性布局的应用-淘宝商品展示模块
- linux中创建压缩文件系统----squashfs
- 基于arm64的万兆网驱动(82599ES)的移植与编译(ZYNQMP)