一个英文字母字符存储需要1个字节。在 GB 2312 编码或 GBK 编码中,一个汉字字符存储需要2个字节。 在UTF-8编码中,一个英文字母字符存储需要1个字节,一个汉字字符储存需要3到4个字节。在UTF-16编码中,一个英文字母字符或一个汉字字符存储 都需要2个字节(Unicode扩展区的一些汉字存储需要4个字节)。在UTF-32编码中,世界上任何字符的存储都需要4个字节。

其次还要知道一点常识,就是我们在记事本等一些文本工具中 写的都是字符,没有谁会去写字节(可以写字节,但是要用具特殊的编辑器),但是其实,我们的写的是字符,但磁盘上真实存储的是字节。

这里就出现了转换的问题,当然,这些问题记事本本身会帮助我们解决。我们打开一个记事本,然后文件--另存为,你会发现有几种存储格式供您选择,

ANSI格式:就是ascii的格式

Unicode格式:采用国际通用的编码存储

Unicode big endian格式:这个和unicode有点区别,但我也不明太具体的不同

UTF-8:采用utf-8存储,看过上面的两篇文章,你会十分的了解这里介绍的编码。Utf-8,是unicode的一种实现方式。

例如我们在记事本里面输入“连通”两个字。

1.我们另存记事本的时候,采用unicode存储,那么虽然我们看到的字符还是“连通”,但是其实存储在磁盘上的字节 确实

8FDE(连) 901A (通),这个是规定的,unicode是国际上规定的,给世界上的每个字符分配的唯一编码。获取某个字符的unicode的方法,可以去网上查找,最简单 的方法,就是打开word文档,输入字符,把光标移动到字符后面,按alt+x,word会自动把字符转换成unicode编码,这里呢我们也可以看到, 用unicode存储汉字啊,每个汉字占用两个字节。

2.我们另存记事本的时候,采用utf-8存储,虽然我们看到的字符还是“连通”,但是其实存储在磁盘上的字节 确实已经变化了,这时候存储的是

E8 BF 9E (连)E9 80 9A(通)。这就是utf-8的存储的编码,至于utf-8为什么这样存储,你可以阅读上面的两篇文章来了解,可以看到,utf-8使用3个字节存储一个汉字。

另外我们还要知道的就是:电脑怎么区分一个记事本是用什么存储的呢?

换句话说,为什么我用unicode存储的8FDE(连) 901A (通),电脑就知道这是unicode编码,从而使用unicode解码,还原为“连通”呢?电脑又怎么知道E8 BF 9E (连)E9 80 9A(通)这是按照utf-8的存储方式存储的呢?

这里有一点标记,就是在存储字节的时候,记事本首先在最前面 标明,这个记事本下面的存储格式 是utf-8,还是unicode。

例如,

1.unicode存储“连通”。磁盘字节真实存储的其实是:

FF FE 8FDE 901A

前两个FF FE是标记,告诉电脑,这个文档的存储方式是unicode

2.utf-8存储“连通”。磁盘字节真实存储的其实是:

EF BB BF E8 BF 9E E9 80 9A

前三个EF BB BF 告诉电脑 这个文档是utf-8存储的

java 字节编码_java中字符与字节的编码关系相关推荐

  1. java字节字符_java中字符和字节的区别

    byte(字节): byte即字节的意思,是java中的基本数据类型,用来申明字节型的变量,一个字节包含8个位,所以,byte类型的取值范围是-128到127. 通常在读取非文本文件时(如图片,声音, ...

  2. java stringbuffer数组_Java中字符数组、String类、StringBuffer三者之间相互转换

    一.StringBuffer与String的相互转换 1.将StringBuffer转换成String StringBuffer类成员toString函数可将其转换成String类型. StringB ...

  3. java byte 判断_Java中取出一个字节,如何判断这一个字节是否是一个汉字中的一部分...

    展开全部 String a = new String("我是一串含有中文的字符串");然后对byte[] b = a.getBytes();转化为字节类型的数组,626169647 ...

  4. java 半角数字_Java中字符的半角和全角

    前几天在工作中遇到一个问题 在一个程序中进行Excel的导入,将Excel中的一系列城市编码在程序中解析,转换为int型,因为Excel中的部分城市编码带有空格,因此需要在代码中将其转换为String ...

  5. java http url 编码_Java中的HTTP URL地址编码

    java.net.URI类可以帮助;在URL的文档中找到 Note, the URI class does perform escaping of its component fields in ce ...

  6. java repaint闪烁_java中paint,repaint,update之间的关系(闪烁问题的解决)

    最近总结了一下java中的paint,repaint和updata三者之间的关系,首先咱们都知道用paint方法来绘图,用repaint重绘,用update来写双缓冲.但是他们之间是怎么来调用的呢,咱 ...

  7. java中字符和字节的转换_Java最佳实践–字符到字节和字节到字符的转换

    java中字符和字节的转换 在使用Java编程语言时,我们将继续讨论与建议的实践有关的系列文章,我们将讨论String性能调优. 特别是,我们将着重于使用默认编码时如何有效地处理字符到字节和字节到字符 ...

  8. java字符编码详解_Java中字符编码格式详解

    一.前言 在分析Comparable和Comparator的时候,分析到了String类的compareTo方法,String底层是用char[]数组来存放元素,在比较的时候是比较的两个字符串的字符, ...

  9. java中字符和字节的区别是什么?

    关于java字符的文章早已是非常多了,本文是对我个人过往学习java,理解及应用java中字符的一个总结.此文内容涉及字符和字节的基本概念,以及java中字符和字节的区别是什么等相关问题,希望对大家有 ...

最新文章

  1. 人群分割--Fully Convolutional Neural Networks for Crowd Segmentation
  2. **52.常用的存储保护方法有哪些?
  3. QualityCenter的备份
  4. 【软考高项】信息系统项目管理师 论文写作技巧分享 (下)
  5. 【编程范式】连续数据的前面部分后移的实现
  6. 公用机房配置台式计算机,计算机网络在公共机房中的应用
  7. 2013年计算机考试ppt,2013年全国专业技术人员计算机应用能力考试PPT题库
  8. 项目管理考试中的几个等级以及常考知识点
  9. html 常用button事件
  10. android中stagefright和OMXCodec原理分析
  11. linux puppy 安装软件,小芭比linux下载
  12. 算法导论———归并排序(JAVA、Python)
  13. 拆解PowerApps - 请假申请 - 4
  14. Go学习之编码实现区块链 - 【blockchain】
  15. 延续精彩分享,感受技术力量 | 开发者说·DTalk 鉴赏
  16. 解决 golang 中 wrote more than the declared Content-Length
  17. 自动化测试到底该怎么学?
  18. 基于事件的视觉传感器及其应用综述
  19. vue小黑记事本--摘抄
  20. 关于a:visited稀奇古怪直接生效或不生效的问题

热门文章

  1. ajax如何用编号查询姓名,Ajax js 使用Ajax检测用户名是否存在
  2. 几十m的中文linux系统,体积只有十几M的linux系统Tiny Core安装体验
  3. View事件机制分析
  4. 比特币收购足球队,区块链准备登上绿茵场
  5. sql里 where和order by一起使用是怎样的顺序
  6. 11.python并发入门(part3 多线程与互斥锁)
  7. python笔记--元组
  8. 武侠人士的10大绝招
  9. OOJ-面向对象编程的三大特点-封装,继承,多态分析与实例
  10. layui table数据修改的回显