UNICODE是万能编码,包含了所有符号的编码,它规定了所有符号在计算机底层的二进制的表示顺序。

在UTF-8编码中一个中文占三个字节

比如 汉字 "张" 对应的三字节编码是[229 188 160]

但是如何判断,229 188 160 是组合的呢,这里涉及到一套规则

UTF规定:

如果一个符号只占一个字节,那么这个8位字节的第一位就为0。

如果为两个字节,那么规定第一个字节的前两位都为1,然后第一个字节的第三位为0,第二个字节的前两位为10

然后如果是三个字节的话,那么第一个字节的前三位为111,第四位为0,剩余的两个字节的前两位都为10。

所以一个字节最大是 011111111 转换成十进制是 127 如果大于127则认为不止一个字节

两个字节最大数是 11011111 10111111  转成成十进制分别是223 和 191

三个字节最大数是 11101111  10111111 10111111    转成成十进制分别是239 和 191 和 191

这里设n为字节

n<128 则为1个字节

128<n<223为两个字节

223<n<239 为三个字节

这样可以轻松判断出来是否是一组

转载来源

https://www.cnblogs.com/Mrycy/p/12013274.html

https://blog.csdn.net/hck341204/article/details/84157134​​​​​​​

如何判断一个字节是否是一个汉字中的一部分相关推荐

  1. 计算机存储一个字节数是,一个字节可以存储多大的数字?

    一个字节有8位,每一位两种状态1或者0计算机储存数据是以二进制的方式,有一位为符号位,所以最大数为01111111转化为十进制数为127.若无符号,最大数为11111111转化为十进制为255.二进制 ...

  2. java byte 判断_Java中取出一个字节,如何判断这一个字节是否是一个汉字中的一部分...

    展开全部 String a = new String("我是一串含有中文的字符串");然后对byte[] b = a.getBytes();转化为字节类型的数组,626169647 ...

  3. go 向buff写入一个字节_我在 Go 中犯的 5 个错误

    人皆犯错,宽恕是德 - Alexander Pope 这些都是我在写 Go 中犯的错误.尽管这些可能不会导致任何类型的错误,但它们可能会潜在地影响软件.   内循环   有几种方法可以造成循环内部的混 ...

  4. 计算机中1字节无符号整数的取值范围是,一个字节的无符号数能表达的数值范围是0----255,...

    0既不是正数也不是负数,而是正数和负数的分界点.因为0不是正数,2^8=256  从0-256刚好256个数. 两个字节代表可以储存的最大数为2^16=65536,两个字节若不考虑符号问题,那么可以储 ...

  5. 计算机中一个汉字占用 存储空间,一个字母、数字、汉字所占用的内存空间

    字节(Byte):通常将可表示常用英文字符8位二进制称为一字节. 一个英文字母(不分大小写)占一个字节的空间.一个中文汉字占两个字节的空间. 符号:英文标点2占一个字节.中文标点占两个字节. 一个二进 ...

  6. 在计算机领域中 ascii码,在计算机领域中,ascii码用一个字节来干什么

    在计算机领域中,ASCII码用一个字节来表示一个字符,存入1024个字符需要的字节数是1KB.字节通常简写为"B",1KB等于1024B:一个字节来表示一个字符,存入1024个字符 ...

  7. 位,字节,字符,汉字的区别

    1.计算机存储信息的最小单位,称之为位(bit),音译为比特,二进制的一个"0"或一个"1"叫一位. 2.计算机存储容量基本单位是字节(Byte),音译为拜特, ...

  8. 【编程练习题】实现一个算法,确定一个字符串的所有字符是否全都不同。假使不允许使用额外的数据结构,又该如何处理。

    在编写算法之前,要先确认是ascii字符串还是unicode字符串 Ascii码表最多就256个字符:以一个字节来存放一个 ASCII 字符 1byte = 8bit ,故最多能存放2^8 = 256 ...

  9. 如何判断一个字符串里有多少个汉字?(原理及过程)

           前言:在站里看到许多关于这个问题的文章,都大差不差,但基本用的java语言,且讲述原理的过程比较繁琐.晦涩,不适于c语言初学者.文中涉及到区位码.国标码.机内码的转换,可跳过. 解该题目 ...

最新文章

  1. [Java] 初始化与清理
  2. 深度学习 Deep LearningUFLDL 最新Tutorial 学习笔记 2:Logistic Regression
  3. java异常类子类和父类的关系
  4. GeoServer+MySQL安装及配置过程
  5. 技术宝典 | WebRTC 技术解析之 Android VDM
  6. java运行时参数_运行时的Java 8参数名称
  7. 前端学习(2786):完成推荐商品结构之头部标签栏
  8. linux上pyenv卸载,在Ubuntu 18.04系统下安装pyenv的方法
  9. “用户、组或角色'XXX'在当前数据库中已存在”问题
  10. 问题:npm WARN ajv-keywords@3.2.0 requires a peer of ajv@^6.0.0 but none is installed.
  11. bat递归查找指定文件_批处理脚本遍历指定文件夹下的文件
  12. 15_传智播客iOS视频教程_OC语言完全兼容C语言
  13. mysql两个空值相同吗_你知道mysql中空值和null值的区别吗
  14. mysql备份单实例(一)shell
  15. mysql concat算法_MySQL CONCAT()用法及代码示例
  16. Symfony2Book16:Symfony2内部03-事件调度
  17. ul1977标准_UL1977标准连接器UL认证测试内容
  18. 团队管理之—— 大项目:把握关键点,谋定而后动
  19. PHP TP5框架 发送短信验证码
  20. 优步司机如何联系客服?uber客服渠道,Uber优步司机客服渠道

热门文章

  1. 怎么可以让计算机不能联网,我想让电脑:只能收发电子邮件,不能上网,怎样设置?...
  2. 飞海豚与“美学康养”之“龙天光明”“龙天护正”参展台北高阶美学本能展
  3. посматрите!这里有一个新惊喜哦
  4. shell脚本函数返回数组
  5. 计算机图形学之生成直线的DDA算法(C#)
  6. c语言 类型转换 小数*int,C语言数据类型转换
  7. Unity lua内存泄漏与性能检测
  8. 浅谈如何写好一个接口
  9. 张小龙 2019 微信公开课总结的 20 条微信未来发展重点
  10. errno 错误码说明