在百度百科中,是这样定义的,字符编码(Character encoding)也叫字符码,是把中的为指定中某一(例如:模式、、8位组或者),以便在中存储和通过的传递。实际上就就记住一句话,字符编码就是为了方便信息存储和传递。

常用编码:

ASCII:表示英语及西欧语言,占1bytes,基本的ASCII字符集共有128个字符,其中96个可打印字符,适用于不同地区的扩充的ASCII字符集,扩充字符的编码均为高位为1的8位代码,即128-255,也称为扩展ASCII码。

linux查看ASCII命令:

man ascii(#centos中需要安装man-pages)

GB2312:简体中文字符集,兼容ASCII,占2bytes,由于我们汉字比较复杂,又不能和ASCII编码冲突,所以,中国制定了GB2312编码,并且需要两个字节。

Unicode:国际标准组织统一标准字符集,占2bytes,简单的说是为了解决不同编码兼容性问题,就是在不同的字符集下,怎么正常显示不同的字符集。就是将世界上所有的符号都纳入其中,无论中文、英文、日文等,这样就不会出现乱码了,这就是Unicode编码。

GBK:GB2312的扩展字符集,支持繁体字,兼容GB2312,占2bytes,由于汉字太多,太复杂,GB2312无法处理所有的汉字,这就出现GBK字符集,它扩展了GB2312编码,加入了更多的汉字。

UTF-8:不定长编码,占1-3bytes,它的出现是为了提高Unicode编码的效率,根据不同符号自动选择编码的长短。

这些是我们常用的字符编码,还有很多我们不怎么常用的,比如:Big5、MBCS、Base64、UTF-16等等。

varchar汉字占几个字符_常用字符编码介绍相关推荐

  1. java一个中文几个字节_java一个汉字占几个字节;一个字符占几个字节?redis一个汉字占几个字节;一个字符占几个字节?...

    脱离字符集编码 谈这个问题没什么实际意义 我不知道你讲的Java 中汉字是几个字节具体是什么意思 Java 中 Character 采用的是 utf-16 编码,那么就是两个字节(0----65535 ...

  2. ## c 连接字符_用于字符比较的C#程序

    ## c 连接字符 Input characters and compare them using C# program. 输入字符并使用C#程序进行比较. Prerequisite: Methods ...

  3. python处理字符_常用python字符串处理

    import re p = re.compile(r'\d+') print p.split('one1two2three3four4') ### output ### # ['one', 'two' ...

  4. java用正则表达式表示非法字符_非法字符的正则表达式

    搜索热词 public final static String SEARCHKEYREGEX = "[~!/@#$%^&*()\\-_=+\\|[{}];:\'\",< ...

  5. nginx服务(五)_常用配置指令介绍

    Main 全局配置段常见的配置指令分类 文档: https://nginx.org/en/docs/ngx_core_module.html#accept_mutex 分类: 正常运行必备的配置 优化 ...

  6. 网络编程_常用的基本函数介绍——htonl、ntohl、htons、ntohs

    1.htonl函数 将主机的unsigned long值转换成网络字节顺序(32位)(一般主机跟网络上传输的字节顺序是不通的,分大小端),函数返回一个网络字节顺序的数字. #include " ...

  7. Oracle中一个汉字占几个字节

    Oracle中一个汉字占几个字节? 某天,在向一个字段类型为CHAR(6)的表中插入数据'大沽口'时报错,提示'too large for column(actual: 9 ,maximum: 6)' ...

  8. 计算机会不会把一个汉字误认为两个西文字符,一个汉字用两个字节 一个西文字符用一个字节 那计算机会不会把一个汉字误认为两个西文?为什么...

    一般从ASCII码来判断: 当认为存放字符的单元是无符号字符时,ASCII小于等于127的是西文字符(或常用字符),否则是汉字. 当认为存放字符的单元是有符号字符时,ASCII为正数的字符为西文字符, ...

  9. 一个汉字占多少字节?

    一.前言: 1.GBK编码,一个汉字占2个字节. 2.UTF-16编码,通常汉字占2个字节,CJKV扩展B区.扩展C区.扩展D区中的汉字占4个字节(一般字符的Unicode范围是U+0000至U+FF ...

最新文章

  1. LeetCode: 929. Unique Email Addresses
  2. 做事情的价值和看待方式
  3. WebSocket In ASP.NET Core
  4. jquery对象和DOM对象的相互转换详解
  5. 模型训练太慢?显存不够用?这个算法让你的GPU老树开新花
  6. web前端 真是一条不归路,2年前的文章 如今依然影响很多人
  7. mysql表导入redis_MySQL数据导入Redis
  8. 看不懂简明python教程_简明python教程之Python文件头注释的含义,你肯定不懂
  9. Swift 5 用TableView实现动态Excel表格Spreadsheet
  10. win10很多软件显示模糊_三菱PLC编程软件GX WORKS2在WIN10 中的应用技巧
  11. 基于.net开发chrome核心浏览器
  12. [Swift]Swift中的extension
  13. 为羊哥点赞,利用云服务器搭建私人云笔记
  14. Win10系统打开共享文件提示没有权限使用网络资源怎么处理
  15. MsDos下的Debug调试器与8080汇编小实验
  16. 优雅写代码的45个小技巧
  17. 03虚幻4 场景中的基础光源和视觉效果
  18. Java 解析xml 使用SAXReader获取所有标签的key和value的代码实例
  19. samba 本地设备名已在使用中 此连接尚未恢复
  20. app 自动化 打开app (二)

热门文章

  1. 什么是布隆过滤器?如何解决高并发缓存穿透问题?
  2. 雷军这个程序员!真的牛逼!
  3. 笑抽了!这个程序员正在坐电梯,被HR逮到偷偷出去面试!
  4. 文科生也能当工程师?我用了一年半
  5. 月薪5万程序员眼中的单例模式
  6. 构建更好的敏捷项目管理组织所需的4种工具
  7. 绩效面谈的细节,阿里巴巴是如何做的?
  8. 7个问题,直击管理的本质
  9. 从在线教育交易平台看系统阶段性演进
  10. python正则提取mysql中文数据