计算机编码的作用

主要是解决将文字转换为二进制码的过程:

bytes–>encode–> str --> decode --> bytes

ASCII

只适合英文编码,用一个字节来表示,最多表示256的字符。


gbk

可以表示中文,两个字节表示,但是每个国家都存在自己语言的编码,没有统一起来;


unicode

编码界的通用语言,包含了跟全球所有国家的字符映射关系。
两个字节表示,若表示ascii原本只需要一个字节,现在需要两个字节,在存储和传输过程就出现了资源浪费,例如:
字母A用ascii编码是十进制的65,二进制的01000001。
数字0用ascii编码是十进制的48,二进制的00110000。
汉子“中”已经超出了ascii编码的范围,用unicode编码是十进制的20013,二进制的00101101。
如果把ascii编码的A用unicode编码,只需要在前面补0就可以,因此,A的Unicode编码是00000000 01000001,所以编码存储ascii中的字符的时候会占用双倍的内存空间。


utf-8

utf-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉子通常是3个字节,只有很生僻的字符才会被编码成4-6个字节。如果要传输的文本中包含大量的英文字符,用utf-8就会很节省空间。


在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输的时候,就以utf-8的格式编码,例如用记事本编辑的时候,从文件读取utf-8字符被转换为Unicode格式字符加载到内存里,编辑完成后,保存的时候再把Unicode转换为utf-8格式保存到文件。

计算机编码种类(ASCII/gbk/unicode/utf-8)相关推荐

  1. ASCII,GBK,Unicode(UTF-32/UTF-8),乱码,ANSI详解

    前言 总目录 日常开发过程中,经常会遇到ASCII,GBK,Unicode(UTF-32/UTF-8)等名词,对于这些概念是不是有点傻傻分不清呢?相信看下本文,你会有自己的理解. 一.ASCII码 1 ...

  2. 三种字符编码:ASCII、Unicode和UTF-8

    原文:三种字符编码:ASCII.Unicode和UTF-8 什么是字符编码? 计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理.最早的计算机在设计时采用8个比特(bit)作为一个字 ...

  3. 字符编码原理 ASCII,Unicode和UTF-8 - - ITeye技术网站

    字符编码原理 ASCII,Unicode和UTF-8 - - ITeye技术网站 字符编码原理 ASCII,Unicode和UTF-8 博客分类:coder加密与解密 编码utf-8unicode原理 ...

  4. ASCII GBK Unicode 等各种字符编码

    ASCII 码(仅适用全英文字符): 编码规则:总共0~127共128个字符编码:占用一个字节的后面7位,最前面的一位统一规定为0 0-31及127(共33个)是控制字符或通信专用字符(不可显示字符) ...

  5. 计算机编码简介(ASCII、ANSI、EBCDIC、Unicode)

    1) ASCII(American Standard Code for Information Interchange,美国信息交换标准码)是使用最广的.使用ASCII码编码的文件称为ASCII文件. ...

  6. ASCII码、Unicode编码对照表 —— ASCII控制字符 Unicode编码 字符编码的前世此生

    ASCII控制字符  Unicode编码 ASCII(American Standard Code for Information Interchange,美国信息互换标准代码,ASCⅡ)是基于拉丁字 ...

  7. 编码方式 / ASCII、UNICODE、UTF-8、ANSI

    一.ASCII 全称:American Standard Code for Information Interchange. 占用 1 个字节. 共可以表示 128 个字符,因为最前面那一位始终为 0 ...

  8. 深入理解字符编码(ASCII、Unicode、UTF-8、UTF-16、UTF-32)

    大家都知道,程序中的所有信息都是以二进制的形式存储在计算机的底层的,也就是说我们在代码中定义的一个 char 字符或者一个 int 整数都会被转换成二进制码储存起来,这个过程可以被称为编码,而将计算机 ...

  9. 字符编码,ASCII、Unicode与UTF-8的理解

    首先我们先要明白的两点是:1.计算机中的信息都是由二进制的0和1储存的:2.我们再计算机屏幕上看到的各种字符都是计算机系统按照一定的规则将二进制数字转换而来的. 一.基本概念. 1.字符集(chars ...

最新文章

  1. 利用SMS OSD实现win2008操作系统的部署
  2. Qt调用MATLAB
  3. 高性能计算专家Jack Dongarra获2021年图灵奖
  4. python编程有用吗-编程小白提问Python好吗?它的用途?
  5. CISCO交换机如何删除 Vlan
  6. 无声息格式化磁盘的API,VB版
  7. linux 广播命令,Linux基础命令---ping
  8. 为什么防火墙透传不过去VLAN11?
  9. django使用mysql_设置Django以使用MySQL
  10. python实践答辩ppt_看完这篇Python操作PPT总结,从此使用Python玩转Office全家桶没压力!...
  11. linux 用户及用户授权
  12. 徐州医科大学党委书记夏有兵一行莅临云创
  13. 索引超出了数组界限(Microsoft.SqlServer.Smo)
  14. 【STM32F407开发板用户手册】第2章 STM32F407的开发环境搭建
  15. EBS R12.2 ADOP (R12.2 AD Online Patching) - 3
  16. 安卓手机测评_鲁大师又在找事?一季度安卓系统流畅度排名出炉,小米MIUI吊车尾...
  17. 跟小静读CLR via C#(06)- 构造器
  18. 非标准武术擂台机器人的设计思想——机械结构的设计思想
  19. SAR成像系列:【11】干涉合成孔径雷达(干涉SAR,Interferometric SAR,InSAR)
  20. 红帽上安装wireshark

热门文章

  1. 原生js打造自定义播放器
  2. 最简单有效的Win10清理C盘的多个方法
  3. 每秒上万并发下的Spring Cloud性能优化之道
  4. 测试是ufs3.0的软件,可怕!UFS 3.0测试首曝光:速度竟是UFS 2.1的3倍
  5. The annotation of C++ primer {藤原豆腐坊自家用}
  6. 卫星历史影像数据—六种查看方法
  7. 自我复盘-20210820
  8. 【电脑】你了解电脑吗?
  9. 长春有学计算机的中专吗,长春比较好的中专学校
  10. 智慧树源码_公众号题库源码