一、基础知识简介

1.1、位(bit)

位(bit):是计算机的最小数据存储单位(即:由二进制数字0和1表示)可用小写的b表示

现代计算机存储和处理的信息以二值信号表示。这些微不足道的二进制数字,或者称
为位 (bit);二值信号能够很容易地被表示、存储和传输。

例如:可以表示为穿孔卡片上有洞或无洞、导线上的高电压或低电压,或者顺时针或逆时针的磁场。对二值信号进行存储和执行计算的电子电路非常简单和可靠。

1.2、字节

字节(Byte):是计算机用于计量存储容量的最小单位(一种计量单位),一个字节由 8 位组成,可用大写的B表示。在二进制表示法中,它的值域是:

单位换算比例
  • 1byte=8bit【1字节=8比特】
  • 1KB=1024B=1024 字节
  • 1MB=1024KB=1024×1024 字节
  • 1GB=1024MB=1024×1024×1024 字节
  • 1TB=1024GB=1024×1024×1024×1024 字节

1.3、编码

编码是指:规定每个“字符”分别用一个字节还是多个字节存储,用哪些字节来存储的这个规定;

(即:编码是先按照既定规则对字符进行翻译成对应的二进制数,然后在计算器中运行存储,最后用户在使用或浏览的时候,在用对应的编码格式解析存储的二进制数呈现出用户能够看懂的内容)。

1.3.1、字符

字符指类字形单位或符号,包括字母、数字、运算符号、标点符号和其他符号,以及一些功能性符号。 比如:我们常见的汉字、阿拉伯数字、26个英文字母、特殊符号等。

字符示例
序号 字符类型 字符形式
1 汉字 中华人民共和国等等
2 阿拉伯数字 0123456789
3 26个英文字母 Aa Bb Cc Dd Ee Ff Gg Hh Ii Jj Kk Ll Mm Nn Oo Pp Qq Rr Ss Tt Uu Vv Ww Xx Yy Zz
4 特殊符号 +-*/ > < = ( ) ~!?@#$^&'

1.3.2、字符编码

在计算机的具体表示中,又有不同的编码,常见有ASCII码、GB2312、GBK,UTF-8编码、Unicode编码。

程序员必备:彻底弄懂常见的7种中文字符编码https://zhuanlan.zhihu.com/p/46216008

常见的字符编码
序号 字符编码 字符编码网址
1 ASCII

ASCII Code - The extended ASCII table

ASCII码一览表,ASCII码对照表

2 GB2312

GB2312区位码全表

GB2312简体中文编码表 - 常用参考表对照表

3 GBK

最全面的GBK编码表/GBK字符集 - 常用参考表对照表

GBK 编码范围, GBK 编码表

GBK 编码

4 UTF-8

UTF-8 遍地开花 (utf8everywhere.org)

字符编码笔记:ASCII,Unicode 和 UTF-8

5 Unicode

Unicode

彻底弄懂 Unicode 编码

一图弄懂ASCII、GB2312、GBK、GB18030编码

Unicode编码

二、常用编码介绍

2.1、标准ASCII编码

2.1.1、标准ASCII介绍

ASCII(美国信息互换标准代码[American Standard Code for Information Interchange])是一套基于拉丁字母的字符编码,共收录了 128 个字符( 33 个控制字符(具有某些特殊功能但是无法显示的字符)和 95 个可显示字符),用一个字节就可以存储,它等同于国际标准 ISO/IEC 646。

由于7位还还不够1个字节,而计算机又是使用字节作为最小存储单位,且每个字节中多出来的最高位用0替代; 【因此使用0-127来表示ASCII编码,高位用0来替代】

示例:在ASCII码中:

①字符'A'----对应二进制【01000001】(十进制65)表示;

②字符'a'----对应二进制【01100001】(十进制97)表示;

2.1.2、标准ASCII码值域

将标准的ASCII所有位置为1,得到二进制代码(00000000----11111111【十进制:0---255】);所以字符集范围是【0---255】共256个字符;

2.2、GB2312编码

2.2.1、GB2312介绍

GB2312(信息交换用汉字编码字符集是由中国国家标准总局1980年发布,1981年5月1日开始实施的一套国家标准,标准号是GB 2312—1980)

GB2312编码适用于汉字处理、汉字通信等系统之间的信息交换,通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。

基本集共收入汉字6763个和非汉字图形字符682个。整个字符集分成94个区,每区有94个位。每个区位上只有一个字符,因此可用所在的区和位来对汉字进行编码,称为区位码。

2.2.2、GB2312值域

所有汉字字符在计算机内部采用2个字节来表示每个字节的最高位规定为1【正好与标准ASCii字符(最高位是0)不重叠,并兼容】,不支持繁体字; 

    所以:gb2312表示汉字的编码为:[129--255][129--255]  (两个字节,每个字节最高位是1);小于127的字符,与ASCii编码相同;两个字节的二进制代码(00000000 00000000---11111111 11111111【十进制:0-65535】);所以字符集范围是【0---65535】共65536个字符;

2.3、GBK编码

GBK编码,是对GB2312编码的扩展,因此完全兼容GB2312-80标准;除了收录gb2312所有的字符外,还收录了其他不常见的汉字、繁体字等;

gbk中字符是一个或两个字节,单字节字符00--7F(0---127)这个区间和ASCII是一样的;

双字节字符的第一个字节是在81--FE(129--254)之间。通过这个可以判断是单字节还是双字节(即:在gbk字符编码,如果第一个字节是>128的,则再往后找一个字节,组成汉字;如果第一个字节<128,则表示的是一个单字节(此时和ASCII是一样的))。

2.4、常用编码所占字节情况

常用编码占用字节情况
序号 常用编码名称 占用字节情况
1 ASCII

①1个英文字母(不分大小写)= 1个字节的空间

②1个ASCII码 = 一个字节

③1个中文汉字 = 2个字节的空间

2 GB2312

①1个英文字母(不分大小写)= 1个字节的空间

②1个汉字(简体)= 2个字节的空间

2 UTF-8

①1个英文字符 = 1个字节

② 英文标点  = 1个字节

③1个中文(简体、繁体) = 3个字节

④中文标点 = 3个字节

3 Unicode

①1个英文字符 = 2个字节

②英文标点  = 2个字节

③1个中文(简体、繁体) = 2个字节

④中文标点 = 2个字节

三、其他进制用二进制的表示

3.1、十进制为什么用4位二进制表示

因为十进制的基础是数字( '0'~'9' ),而最大的数字9使用二进制表示为(1001),故每个十进制可使用4位二进制表示;比如(0【0000】、1【0001】、2【0010】)。

3.2、十六进制

十六进制(简写为 "hex");使用数字 '0'~'9' 以及字符 'A'~'F' 来表示 16 个可能的值,

在 C 语言中,以 0x 或 ox 开头的数字常量被认为是十六进制的值。字符 'A'~'F'
既可以是大 写 ,也可以是小写。例如,我们可以将16进制数字 FB1C37D1E 写作 Ox FB1C37D1E, 或者Ox fb1c37d1e, 甚至是大小写混合,比如, Ox Fb1C37d1E。

3.3、大小端字序

  • 大端字节序:高位字节在前,低位字节在后(大端字节序是我们人类熟悉的方法)
  • 小端字节序:低位字节在前,高位字节。

 大 多 数 Int e l 兼容机都只用小端模式。

理解字节序https://www.ruanyifeng.com/blog/2016/11/byte-order.html

位(bit)、字节(byte)、字符、编码之间的关系https://www.cnblogs.com/xuwc/p/14091593.html

计算机的基础知识---位(bit)、字节(byte)、编码(Encoding)和大小端相关推荐

  1. 字长为16位的计算机_必看!计算机考试基础知识总结1

    必看!计算机考试基础知识总结1 1. 1946年,美国宾夕法尼亚大学研制成功了电子数字积分式计算机ENIAC 2. 美籍匈牙利数学家冯•诺依曼总结并归纳了ENIAC以下3点. •采用二进制:在计算机内 ...

  2. 计算机基础知识---位运算的应用

    Author:baiyucraft BLog: baiyucraft's Home 前置学习: 计算机基础知识-位运算的简介   在了解位运算后,我们要明白一点:为什么要学习位运算呢.其实很重要的一个 ...

  3. 计算机中常用英文字母bit表示,1计算机那基础知识.ppt

    1计算机那基础知识 [例]: 有符号数运算,有溢出表示结果是错误的 无符号数运算,有进位表示结果是错误的 1 0 1 1 0 1 0 1 + 1 0 0 0 1 1 1 1 1 0 1 0 0 0 1 ...

  4. 计算机组装的必备知识,计算机组装基础知识.ppt

    <计算机组装基础知识.ppt>由会员分享,可在线阅读,更多相关<计算机组装基础知识.ppt(28页珍藏版)>请在装配图网上搜索. 1.计算机组装与维修,信息技术系,计算机系统的 ...

  5. 计算机文档培训讲座,计算机的基础知识培训讲座.ppt

    (7)运算速度.运算速度是指计算机每秒所能执行的指令条数,一般用MIPS为单位.它是计算机的主要技术指标之一. (8)主频.主频是指计算机的时钟频率,单位用MHz表示.它是计算机的主要技术指标之一. ...

  6. 计算机基础知识会考,计算机会考基础知识.doc

    计算机会考基础知识.doc (53页) 本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦! 21.9 积分 知识点第一篇第一章1. 信息•信息是表示事物运动的状态 ...

  7. c语言比特和字节,详解 比特(位,bit),字节(Byte),字符的区别 *(转)

    比特(位):英文bit,是计算机晶体管的一种状态(通电与断电).就是0与1,真与假,是计算机最基本的传输单位. 示例: 2bit : 10; 4bit : 1111; 8bit : 1111 1111 ...

  8. 计算机二级基础知识试题,xx年计算机二级基础知识试题及答案

    xx年计算机二级基础知识试题及答案 (7页) 本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦! 9.90 积分 XX年计算机二级基础知识试题及答 案XX年计算机二 ...

  9. 2016年计算机基础知识试题及答案,2016年计算机二级基础知识试题及答案

    2016年计算机二级基础知识试题及答案 (13页) 本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦! 9.90 积分 2016 年计算机二级基础知识试题及答案7 ...

最新文章

  1. 放置奇兵 算法 月度活动 破碎时空记录 1-3关
  2. Beautifulsoup的使用
  3. IDEA启动项目报错:Error:(1, 1) java: 非法字符: '\ufeff'
  4. opencv 图片叠加_基于OpenCV的红绿灯识别代码解析
  5. Python3 configparser值为多行时配置文件书写格式
  6. python爬虫数据分析案例-Python 爬虫和数据分析实战
  7. IT公司对员工电脑监控一般使用什么软件?
  8. Web渗透测试之信息收集
  9. 如何使用你的 ETH 赚取更多 ETH?这 5 大策略了解一下
  10. lsf服务器窗口显示,LSF指定进程提交到指定QUEUES中
  11. android 渠道包 作用,谈谈我的Android多渠道打包方式
  12. 有道手机词典(安卓版)离线和发音包…
  13. isis宣告网络_ISIS是一个分级的链接状态路由协议
  14. Pytnon画一个小猪佩奇
  15. pta 7-20 xrf的镜子碎了?
  16. 国内各银行间异地汇款手续费对照表
  17. Chinese Segmentation Introduction
  18. 《JAVA》编程创建一个Box类(长方体),在Box类中定义三个变量
  19. 深度学习电脑配置选择
  20. logisim 文档

热门文章

  1. android 联通时间同步,NTP时间同步技术在中国联通信息化中的应用
  2. 计算机英语单词怎么巧背,巧背英语单词的方法
  3. 【进阶4-2期】Object.assign 原理及其实现
  4. 前端架构带你 封装axios,一次封装终身受益「美团后端连连点赞」
  5. 如何用python破解热点_Python程序员:没有我蹭不成功的网。教你如何愉快的蹭到WIFI?...
  6. [python]数据整理,将取得的众多的沪深龙虎榜数据整一整
  7. 前端晋升ppt_web前端幻灯片.ppt
  8. php api视频教程,PHP开发APP接口视频教程
  9. Java高级开发0-1项目实战-青鸟商城-Day03
  10. 华为云服务器新增d盘,华为桌面云【windows组策略】桌面重定向