ASCII编码和Unicode编码

计算机是以二进制的形式来存储数据的,它只认识0和1两个数字,我们在屏幕上看到的文字,在存储到内存之前也都被转换成了二进制。下面是小编分享的ASCII编码和Unicode编码,欢迎大家参考!

可想而知,特定的文字必然对应着固定的二进制,否则将无法转换。那么,怎样将文字与二进制对应呢?这就需要有一套规范,计算机公司和软件开发者都必须遵守。

ASCII码

我们知道,一个二进制位(Bit)有0、1两种状态,一个字节(Byte)有8个二进制位,有256种状态,每种状态对应一个符号,就是256个符号,从00000000到11111111。

计算机诞生于美国,早期的计算机使用者大多使用英文,上世纪60年代,美国制定了一套英文字符与二进制位的对应关系,称为ASCII码,沿用至今。

ASCII码规定了128个英文字符与二进制的对应关系,占用一个字节(实际上只占用了一个字节的后面7位,最前面1位统一规定为0)。例如,字母 a 的的`ASCII码为 01100001,那么你暂时可以理解为字母 a 存储到内存之前会被转换为 01100001,读取时遇到 01100001 也会转换为 a。

Unicode编码

随着计算机的流行,使用计算机的人越来越多,不仅限于美国,整个世界都在使用,这个时候ASCII编码的问题就凸现出来了。

ASCII编码只占用1个字节,最多只能表示256个字符,我大中华区10万汉字怎么表示,日语韩语拉丁语怎么表示?所以90年代又制定了一套新的规范,将全世界范围内的字符统一使用一种方式在计算机中表示,这就是Unicode编码(Unique Code),也称统一码、万国码。

Unicode 是一个很大的集合,现在的规模可以容纳100多万个符号,每个符号的对应的二进制都不一样。Unicode 规定可以使用多个字节表示一个字符,例如 a 的编码为 01100001,一个字节就够了,”好“的编码为 01011001 01111101,需要两个字节。

为了兼容ASCII,Unicode 规定前0~127个字符与ASCII是一样的,不一样的只是128~255的这一段。

【ASCII编码和Unicode编码】相关文章:

ascii码01100001_ASCII编码和Unicode编码相关推荐

  1. Python 入门 26 —— ASCII 编码、Unicode 编码、 UTF-32、 UTF-16、 UTF-8、 GB2312 编码、 GBK 编码

    计算机存储和处理信息都是以一个8位的二进制字节为单位的,例如:0b 1111 0000.一个字母.汉字等如何用一个二进制的数(编码)来表示呢.在计算机发展初期,因为没有人能预料到计算机会有现在这么大的 ...

  2. ASCII编码和Unicode编码的区别和联系

    编码背景 因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理.最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进 ...

  3. linux ascii字符编码,ASCII编码与Unicode编码

    ASCII编码与Unicode编码 下文将为大家介绍关于ASCII编码与Unicode编码,欢迎学习! ASCII编码与Unicode编码 ASCII码 我们知道,一个二进制位(Bit)有0.1两种状 ...

  4. php中文ascii码范围,标准ascii码字符集共有几个编码?

    标准ascii码字符集共有128个编码.标准ASCII码是用7个二进制位表示1个字符,由于2的7次方为128,所以标准ASCII码字符集共有编码128个:而每一个编码代表一个基本符号,也就是说,使用A ...

  5. python 文本文件的编码格式:ASCII编码和UNICODE编码

    欢迎关注博主 python老鸟 或 前往 『Python自学网』, 从基础入门免费课程开始,逐步深入学习python全栈体系课程,适合新手入门到精通全栈开发. 免费专栏传送门:<Python基础 ...

  6. Python中文本文件的编码格式——ASCII编码和UNICODE编码

    文本文件的编码格式 文本文件存储的内容是基于 字符编码 的文件,常见的编码有 ASCII 编码,UNICODE 编码等 Python 2.x 默认使用 ASCII 编码格式 Python 3.x 默认 ...

  7. ASCII码、ISO8859-1、Unicode、GBK和UTF-8 的区别

    为什么需要编码? 计算机中最小的存储单位是字节(byte),一个字节所能表示的字符数又有限,1byte=8bit,一个字节最多也只能表示255个字符,而世界上的语种又多,都有各种不同的字符,无法用一个 ...

  8. 打包解包模块总结:VS2010中默认的编码是Unicode编码

    我把vc6.0上运行没有问题的代码挪到vs2010上,出现了一系列问题. 其根本原因是两种编译器默认编码不一样,vc6.0中默认的编码是(多字节)Ascii编码,VS2010中默认的编码是Unicod ...

  9. 字符编码之Ascll编码,ANSI编码,Unicode编码,UTF-8编码 ,BOM

    从大一上C语言就开始认识了Ascll编码,ascll码也算是我们最早所接触的编码 [1]Ascll码 Ascll码由三部分组成: 第一部分从00H到1FH共32个,一般用来通信或作为开工至之用,有的可 ...

最新文章

  1. ceph bluestore源码分析:非对齐写逻辑
  2. c#中如何跨线程调用windows窗体控件?
  3. TensorFlow超级指南 | 你能想到的TF教程和资源都在这里(附链接视频)
  4. javascript中实现跨域的方式总结
  5. 如何用JavaScript手动实现一个栈
  6. U3D5.3.5f Monodevelop 仅支持到.NET 3.5
  7. Fabric学习笔记-PBFT算法
  8. transaction already active
  9. Maven - Maven3实战学习笔记(1)Maven使用入门
  10. Linux一些基本概念
  11. python循环的基本思想是重复_python基础-循环
  12. HBuilder X 报 Error: Unbalanced delimiter found in string 错误
  13. 11 EDA技术实用教程【时序电路的Verilog设计2】
  14. SPI通信协议详解(一)
  15. 服务器lsass占用内存_Lsass.exe进程占用大量内存
  16. MT7628处理器介绍,MT7628芯片原理图资料
  17. win10 cmd中文显示乱码
  18. 如何打开html格式文件?Win11打开html文件的方法
  19. 网络通过mac定位机器_如何设置Mac以充当网络时间机器驱动器
  20. http://blog.csdn.net/LANGXINLEN/article/details/50421988

热门文章

  1. axios 最全 请求拦截器 响应拦截器 配置公共请求头 超时时间 以及get delete post put 四种请求传参方式
  2. 宁波中小学生计算机技术展示,2020年宁波市中小学生电脑制作活动创客竞赛暨2020年宁波市中小学生创客大赛顺利举行...
  3. 回到顶部JavaScript实现
  4. vue click同时传入事件对象和自定义参数
  5. 华为鲲鹏arm架构linux服务器安装mysql教程
  6. JavaScript算法与数据结构——字典详解
  7. Windows - node版本管理工具NVM
  8. 天津政府应急系统之GIS一张图(arcgis api for flex)解说(二)鹰眼模块
  9. Bzoj1029 [JSOI2007]建筑抢修
  10. python OpenGL 安装