一、简单介绍

  • ASCII (ASCII编码表一个字节表示,一个128个字符,实际上一个字节可以表示256个字符,只用128个)
  • Unicode (Unicode编码表固定大小的编码使用两个字节来表示字符,字母和汉字统一都是占用两个字节这样浪费空间)
  • utf-8(编码表,大小可变的编码字母使用1个字节,汉字使用3个字节)
  • gbk(可以表示汉字,而且范围广,字母使用1个字节,汉字2个字节)
  • gb2312(可以表示汉字,gb2312<gbk)
  • big5码(繁体中文,台湾,香港)

二、常用的三种编码

ASCII编码介绍

1. ASCII码:上个世纪60年代,美国制定了一套字符编码(使用一个字),对英语字符与二进制位之间的关系,做了统一规定。这被称为ASCII码。ASCII码一共规定了128个字符的编码,只占用了一个字节的后面七位,最前面的1位统一规定为0。
特别提示:一个字节可以表示256个字符,ASCII码只用了128个字符
2.看一个完整的ASCII码表(可以自行百度)

3.缺点:不能表示所有字符。

Unicode编码介绍

1.Unicode的好处:一种编码,将世界上所有的符号都纳入其中。每一个符号都给予一个独一无二的编码,使用Unicode没有乱码的问题。
2. Unicode的缺点:一个英文字母和一个汉字都占用2个字节,这对于存储空间来说是浪费。

3.2的16次方是65536,所以最多编码是65536个字符。
4.编码0-127的字符是与ASCII的编码一样.比如 'a'在ASCII码是Ox61,在unicode码是
ox0061,都对应97.因此 Unicode码兼容ASCII码.

UTF-8编码介绍

1. UTF-8是在互联网上使用最广的一种 Unicode的实现方式(改进)
2.UTF-8是一种变长的编码方式。它可以使用1-6个字节表示一个符号,根据不同的符号而变化字节长度。
3.使用大小可变的编码字母占1个字节,汉字占3个字节

关于字符型本质探讨:

字符型存储到计算机中,需要将字符对应的码值(整数)找出来,比如'a'

存储:'a'==>码值97 ==>二进制(110 0001) ==>存储

读取:二进制(110 0001) =>97 ===> 'a'=>显示

各种编码中字母和汉字分别占多少字节相关推荐

  1. UTF-8 编码里,一个汉字占用多少个字节 -转

    在查找 UTF-8 编码资料时发现,很多的帖子说的 UTF-8 编码里,一个汉字占用3个字节,有的还做了个证明,大概是这样的,创建一个没有BOM的UTF-8编码的文本文件,里面保存了几个汉字,然后查看 ...

  2. 关于C语言中的结构体所占的字节数 sizeof(struct)

    C语言中的结构体所占的字节数 ,用sizeof求一个结构体的大小 C语言中用sizeof求结构体所占字节数的详细方法. 一.非嵌套结构体 struct one{char a; // 1(char所占字 ...

  3. python一个中文占几个字节_python中英文字母和中文汉字所占的字节

    原博文 2020-04-13 21:27 − print(type('李杰'.encode('utf-8')))# print(type('李杰'.encode('gbk')))# print(len ...

  4. python中英文字母和中文汉字所占的字节

    1.判断所占字节数可以用下面语句判断: 中文和符号: print(type('中文'.encode('utf-8'))) #输出为bytes类型 执行结果: <class 'bytes'> ...

  5. Java 一个数字、字母、汉字各占几个字节

    汉字字符 2字节 英文字符 1字节 中文标点 2字节 英文标点 1字节 中国字比较复杂,1字节=8位,8位从0000 0000到1111 1111只能表示256个字符,2个字节是2*8=16位,从00 ...

  6. 常见编码介绍。一个字符在不同编码中分别占几个字节(新手向)

    目录 什么是ASCII码? 1.介绍: 2.代码演示: 什么是Unicode码? 1.介绍: 2.注意事项的代码演示: 什么是utf-8? 一个字符在不同编码中分别占几个字节? 什么是ASCII码? ...

  7. utf-8 中的一个汉字占几个字节

    utf-8 中的一个汉字占几个字节 占 2 个字节的:〇 占 3 个字节的:基本等同于 GBK,含 21000 多个汉字 占 4 个字节的:中日韩超大字符集里面的汉字,有 5 万多个 1 个 utf8 ...

  8. python中一个汉字点3个字节? utf-8

    今天发现了一个汉字占了3个字节,一开始以为是两个呢,字符串切片时总出现乱码,后来才发现一个中文占3个字节.这才解决了乱码问题 原来  1. utf-8 编码中,一个汉字占三个字节.英文字母是一个占用一 ...

  9. utf-8编码下,一个字符最多占几个字节?

    在UTF-8编码中:一个中文等于三个字节,中文标点占三个字节. 一个英文字符等于一个字节,英文标点占一个字节. Unicode编码:一个英文等于两个字节,一个中文(含繁体)等于两个字节.中文标点占两个 ...

最新文章

  1. ImageView.ScaleType /android:scaleType值的意义区别
  2. python画图,使用matplotlib和seaborn来设置图形的字体大小,坐标轴的线宽,风格,取值范围
  3. 浙江理工大学-2018-2019学年面向对象程序设计A-期末复习资料
  4. 多核cpu应用场景_操作系统基础11-关于多核编程
  5. 左神算法:单调栈结构(Java版)
  6. 我更看好rust飞鸽传书
  7. 使用php-amqplib连接rabbitMQ 学习笔记及总结
  8. orac l e数据库第一章
  9. 光缆成端接头的含义是指
  10. ax 2012 随笔
  11. 计算机管理如何格式化u盘,u盘无法格式化?0字节?教你5种方法格式化u盘,超简单!...
  12. kafka报错zookeeper is not a recognized option
  13. 用gin+xorm+docker编写Online Judge后端
  14. EfficientFormer | 苹果手机实时推理的Transformer模型,登顶轻量化Backbone之巅
  15. 通过.frm和.idb文件恢复mysql数据库
  16. 装饰者模式、代理模式与AOP
  17. Unable to start debugging.报错
  18. 两台虚拟服务器如何串联,两台tp-link路由器串联设置教程 | 192路由网
  19. 如何用css写出一个三角形
  20. [linux学习]centos下mysql的简单使用教程

热门文章

  1. 田忌赛马可能赢的场次
  2. linux mdev 命令,linux设备驱动----利用mdev(udev)自动创建设备文件节点
  3. 侵权:前端可能涉及到的侵权有哪些
  4. webrtc scoped_refptr
  5. SprinBoot-黑马-笔记
  6. 打开游戏提示“没有找到openal32.dll”问题的修复
  7. php token 自动过期,请求时token过期自动刷新token
  8. 弹性布局的应用-淘宝商品展示模块
  9. linux中创建压缩文件系统----squashfs
  10. 基于arm64的万兆网驱动(82599ES)的移植与编译(ZYNQMP)