一个英文字母,一个中文各占多少字节
首先不同编码,所占字节数不同。
1,ASCII码:一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字度节的空间。
2,UTF-8编码:一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。中文标点占三个字节,英文标点占一个字节
3,Unicode编码:一个英文等于两个字节,一个中文(含繁体)等于两个字节。中文标点占两个字节,英文标点占两个字节
字节是指Byte
字符是一种数据类型,通常是char,更具不同语言,占据不同字节大小。
Java:
(1)、英文和数字占一个字节
(2)、中文占一个字符,也就是两个字节
(3)、字符 不等于 字节。
字符(char)是 Java 中的一种基本数据类型,由 2 个字节组成( java采用unicode编码,故均占两个字节),范围从 0 开始,到 2^16-1。
字节是一种数据量的单位,一个字节等于 8 位。所有的数据所占空间都可以用字节数来衡量。例如一个字符占 2 个字节,一个 int 占 4 个字节,一个 double 占 8 个字节 等等。
1字符=2字节;
1Byte=8bit
b:位;B:字节
1kb=1024 位1kB=1024 字节
1 Byte = 8 Bits
1 Kilobyte (KB) = 1024 Bytes
1 Megabyte (MB) = 1024 KB
1 Gigabyte (GB) = 1024 MB
1 Terabyte (TB) = 1024 GB
1 Petabyte (PB) = 1024 TB
1 Exabyte (EB) = 1024 PB
1 Zettabyte (ZB) = 1024 EB
1 Yottabyte (YB) = 1024 ZB
python
中文和符号:
print(type('中文'.encode('utf-8'))) #输出为bytes类型
执行结果:
<class 'bytes'>print(type('中文'.encode('gbk')))
执行结果:
<class 'bytes'>print(len('中文'.encode('utf-8'))) #输出几个字节
执行结果:
6print(len('中文'.encode('gbk')))
执行结果:
4print(len(',。'.encode('gbk')))
执行结果:
4
英文字母和符号:
print(type('ab'.encode('utf-8')))
执行结果:
<class 'bytes'>
print(len('ab'.encode('utf-8')))
执行结果:
2print(len(',.'.encode('gbk')))
执行结果:
2
总结
utf-8编码:一个中文包含繁体字等于三个字节,一个英文字符等于一个字节。
gbk编码:一个中文包含繁体字等于二个字节,一个英文字符等于一个字节。
一个英文字母,一个中文各占多少字节相关推荐
- utf-8的英文字母和中文汉字是一个字符占几个字节
转自https://blog.csdn.net/kindsuper_liu/article/details/80202150 英文字母和中文汉字在不同字符集编码下的字节数 英文字母: 字节数 : 1; ...
- 输入一个英文字母(可能是大写,也可能是小写),输出该字母在字母表中的序号(’a’和’A’的序号为1)
#include<stdio.h> int main() {/*输入一个英文字母(可能是大写,也可能是小写),输出该字母在字母表中的序号('a'和'A'的序号为1). 输入*/char n ...
- 字数统计,一个英文字母算一个字,一个汉字算一个字,一个符号算一个字
//============================================================================= // // 字数统计,一个英文字母算一个 ...
- 编写程序,从键盘输入 一个 英文字母(有若干行)。如果是大写字母,则输出它对应的小写字母;如果是小写字母,则输出它对应的大写字母。
撰写人--软工二班--陈喜平 题目描述 编写程序,从键盘输入 一个 英文字母(有若干行).如果是大写字母,则输出它对应的小写字母:如果是小写字母,则输出它对应的大写字母. 输入 一个英文字母.(有多组 ...
- 从键盘输入一个英文字母,如果它是大写英文字母,则将其转换为小写英文字母,如果它是小写英文字母,则将其转换为大写英文字母,然后将它及其ASCII码值显示到屏幕上,如果不是英文字母,则不转换直接输出到屏幕
从键盘输入一个英文字母,如果它是大写英文字母,则将其转换为小写英文字母,如果它是小写英文字母,则将其转换为大写英文字母,然后将它及其ASCII码值显示到屏幕上,如果不是英文字母,则不转换直接输出到屏幕 ...
- 从键盘输入一个英文字母,进行大小写字母转换,并输出。
#include<stdio.h> int main() { char i,n; printf("请输入一个英文字母:"); scanf("%c", ...
- 英文字母和中文汉字在不同字符集编码下的字节数
英文字母和中文汉字在不同字符集编码下的字节数 英文字母: 字节数 : 1;编码:GB2312 字节数 : 1;编码:GBK 字节数 : 1;编码:GB18030 字节数 : 1;编码:ISO-8859 ...
- 英文字母和中文汉字在不同字符集编码下的字节数(详细解释)
英文字母和中文汉字在不同字符集编码下的字节数 英文字母: 字节数 : 1;编码:GB2312 字节数 : 1;编码:GBK 字节数 : 1;编码:GB18030 字节数 : 1;编码:ISO-8859 ...
- java 英文字符 字节_3、在JAVA语言中,每个英文字符占 个字节,每个中文汉字占( )个字节。...
[判断题]中心原子中的几个原子轨道杂化时,必形成数目相同的杂化轨道. [单选题]集合 用区间表示正确的是 ( ) [单选题]15.Java语言的类间的继承关系是 [单选题]8.编译Java Appli ...
- 一个16进制的数占多少字节?(半个字节)
1个字节是8位,二进制8位:xxxxxxxx 范围从00000000-11111111,表示0到255.一位16进制数(用二进制表示是xxxx)最多只表示到15(即对应16进制的F),要表示到255, ...
最新文章
- R语言数据类型及数据类型判断
- 使用Spring MVC HandlerExceptionResolver处理异常
- 拋棄虛擬機,微軟實驗讓我們在線做(二)
- C 语言链表其他实现
- MNIST机器学习入门(学习记录)——1
- DataTable转换Xml Xml流转换DataSet
- AI算力霸主诞生!英伟达发布首款安培架构GPU,性能提升20倍
- A fully managed website and blog hosting platform
- linux slf4j.rpm,Centos下安装nginx rpm包
- DiffPDF(pdf文件比较工具)官方正式版V6.0.0 | diffpdf如何使用 | 含diffpdf的软件安装教程
- SDK学院--易接网游SDK中间件接入使用说明-Unity3D游戏接口
- python长度单位转化_所有长度单位的换算
- 带你读懂Spring 事务——事务的隔离级别(超详细,快藏)
- 人工智能大战苹果缺席 保护用户隐私拖慢其步伐
- 德纳:Mecha《机甲变形》NFT元宇宙链游开发技术详情
- 软件行业的发展要尊重软件工程的价值规律
- linux鼠标滚轮不能上下滚动页面,Windows10鼠标滚轮无法滚动页面如何解决
- 勇敢者游戏(捡石子问题)
- MICCAI 2022:使用自适应条形采样和双分支 Transformer 的 DA-Net
- 各类数据库驱动包列表下载