在UTF-8编码中:一个中文等于三个字节,中文标点占三个字节。

一个英文字符等于一个字节,英文标点占一个字节。

Unicode编码:一个英文等于两个字节,一个中文(含繁体)等于两个字节。中文标点占两个字节,英文标点。

UTF-8使用1~4字节为每个字符编码:

1,一个US-ASCIl字符只需1字节编码(Unicode范围由U+0000~U+007F)。

2,带有变音符号的拉丁文、希腊文、西里尔字母、亚美尼亚语、希伯来文、阿拉伯文、叙利亚文等字母则需要2字节编码(Unicode范围由U+0080~U+07FF)。

3,其他语言的字符(包括中日韩文字、东南亚文字、中东文字等)包含了大部分常用字,使用3字节编码。

4,其他极少使用的语言字符使用4字节编码。

utf-8编码下,一个字符最多占几个字节?相关推荐

  1. 一个字符究竟占多少字节辨析

    字符和字节的换算,则与编码方式有关,不同的字符所占的字节是不同的.: ASCII码: 一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间.一个二进制数字序列,在计算机中作为一个数 ...

  2. c语言fgetc()函数(从指定的流 stream 获取下一个字符(一个无符号字符),并把位置标识符往前移动)

    C 标准库 - <stdio.h> 文章目录 描述 声明 参数 返回值 实例 描述 C 库函数 int fgetc(FILE *stream) 从指定的流 stream 获取下一个字符(一 ...

  3. mysql逗号分隔正则查询_正则表达式在逗号分隔的列表中查找字符串和下一个字符-MySQL?...

    要搜索以逗号分隔的列表,请使用MySQL find_in_set().这里不需要为此使用正则表达式.语法如下-select *from yourTableName where find_in_set( ...

  4. C++ 查看输入流中的下一个字符

    peek() 是 istream 类的成员函数,它的原型是: int peek(); 此函数返回输入流中的下一个字符,但是并不将该字符从输入流中取走相当于只是看了一眼下一个字符,因此叫 peek. c ...

  5. oracle GBK编码下的字符类型

    一.查询数据库编码 方式一:select userenv('language') from dual; 查询结果是SIMPLIFIED CHINESE_CHINA.ZHS16GBK,是适用于中国的中文 ...

  6. mysql utf-8不支持生僻字_关于 MySQL UTF8 编码下生僻字符插入失败/假死问题的分析...

    1.问题:mysql 遇到某些中文插入异常 最近有同学反馈了这样一个问题: 上述语句在脚本中 load 入库的时候会 hang 住,web 前端.命令行操作则要么抛出 Incorrect string ...

  7. java获取字符串占用的字节大小,以及不同编码下一个汉字占用的字节数

    其实就是String.getBytes().length这样就可以获得字节长度了. 我们知道一个数字是一个字节,一个汉字是2个字节,但是这个不是绝对的,在不同的编码下,字节数是不一样的 英文字母和中文 ...

  8. 在数据库中一个汉字到底占几个字节

    首先要知道,一个汉字在MySQL中占几个字节是跟编码方式有关的 GBK编码:一个汉字占2个字节 UTF-8编码:一个汉字占3个字节 一般数据库设置的编码格式都是UTF-8,那就以UTF-8为例,var ...

  9. python文件读取下一个字符_python文件的读写总结

    读写文件是最常见的IO操作.Python内置了读写文件的函数,用法和C是兼容的. 读写文件前,我们先必须了解一下,在磁盘上读写文件的功能都是由操作系统提供的,现代操作系统不允许普通的程序直接操作磁盘, ...

最新文章

  1. 如何用Pandas处理文本数据?
  2. 【每日一算法】唯一摩尔斯密码词
  3. 小米8 SE和小米9 SE 开源 Android 9 Pie 内核代码
  4. Python之初识函数
  5. 12张PPT看懂中国虚拟数字人产业现状:应用不止于虚拟偶像,2030年市场达2700亿|量子位智库(附下载)...
  6. 原理剖析-Netty之服务端启动工作原理分析(上)
  7. 卡巴斯基授权许可文件_安全许可证的申请流程有哪些?
  8. OllyDbg的一些快捷键
  9. java hashtable keys_Java Hashtable keys()方法与示例
  10. JavaScript小效果的实现(笔记)
  11. 稳扎稳打Silverlight(30) - 2.0Tip/Trick之Silverlight.js, Silverlight.supportedUserAgent.js
  12. java读写文件操作
  13. 4a安全管控 java cas_单点登录与权限管理本质:单点登录介绍
  14. 利用workbench建立的响应面模型质量很差,该如何解决?求指点
  15. php服务器代维,服务器维护
  16. 批量导出二维码并生成压缩文件
  17. c语言中除法与余数,带符号整数的除法与余数
  18. Linux下编译程序/usr/bin/ld: cannot find -l*错误的解决方法
  19. html怎么设置div只读,html怎么设置只读状态
  20. Encountered a duplicated sql alias [NAME] during auto-discovery of a native-sql query

热门文章

  1. redis使用c++ API 的hiredis连接详解
  2. DBNet++(TPAMI) 原理与代码解析
  3. 通信原理chapter2总结(内含多径效应和多普勒效应MATLAB仿真)
  4. check-蓝鲸CTF hta,VMP
  5. 新增用户-用户密码加密-无解密
  6. maven打jar包,并将依赖jar打入外部lib文件中
  7. 游标定义,多行,一行
  8. 火热朝天?现在的技术VC该何去何从
  9. Linux环境下weblogic的安装与配置
  10. 个人喜欢的网站http://www.w3school.com.cn