1.各种编码方式

 ASCII:http://zh.wikipedia.org/zh-hans/ASCIIUnicode:http://zh.wikipedia.org/zh-hans/UnicodeUTF-8:http://zh.wikipedia.org/zh/UTF-8GBK:http://zh.wikipedia.org/zh/%E6%B1%89%E5%AD%97%E5%86%85%E7%A0%81%E6%89%A9%E5%B1%95%E8%A7%84%E8%8C%83

 GB_2312:http://zh.wikipedia.org/zh/GB_2312

2.各种编码方式的来由

1.编码:
在计算机中,所有的数据在存储和运算时都要使用二进制数表示(因为计算机用高电平和低电平分别表示1和0).具体用哪些二进制数字表示哪个符号,当然
每个人都可以约定自己的一套(这就叫编码),而大家如果要想互相通信而不造成混乱,那么大家就必须使用相同的编码规则,于是美国有关的标准化组织就
出台了ASCII编码,统一规定了上述常用符号用哪些二进制数来表示。

2.ASCII(American Standard Code for Information Interchange):
众所周知,计算机是由美国人发明的,那么ASCII的制定也是由美国人完成的,因此ASCII的制定是为了显示现代美国英语。其中包括:
26个基本拉丁字母、阿拉伯数字和英式标点符号。

3.GB2312 :ASCII只能解决美国人的信息交换需求,对于以汉字汉语为交流工具的中国人必须制定自己的编码方式,才能解决信息交流的要求。
GB2312就是这样一种编码方式,它是中华人民共和国国家标准简体中文字符集,全称《信息交换用汉字编码字符集·基本集》。

4.Unicode: 世界上有200多个国家和地区,常用的语言文字也有几十种,各国都制定了自己的编码标准。例如日本:Shift_JIS,韩国:Euc-kr,各国有各国的标
准,就会不可避免地出现冲突,结果就是,在多语言混合的文本中,显示出来会有乱码。 Unicode的产生就是为了解决这个问题的。Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了。
常用的是用两个字节表示一个字符(如果要用到非常偏僻的字符,就需要4个字节)。现代操作系统和大多数编程语言都直接支持Unicode。

既然Unicode方式解决了冲突,也就是能达到全世界交换信息的需求,那又是为什么要有utf-8这种编码方式呢?看下图

5.UTF-8(8-bit Unicode Transformation Format)
如果信息基本上全部是英文的话,用Unicode编码比ASCII编码需要多一倍的存储空间,在存储和传输上就十分不划算。所以,为了节约空间,又出现了把Unicode编码转化为“可变长编码”的UTF-8编码。UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符,用UTF-8编码就能节省空间。

Python学习之——编码方式相关推荐

  1. 【Python】python3编码方式encode介绍

    上一篇文章介绍了计算机编码发展历史和编码方式,现在我们聚焦到python语言中,在最新的Python3版本中,字符串是以Unicode编码的,也就是说,Python的字符串支持多语言.例如: prin ...

  2. python中的编码方式

    说明 这里我们以python2.7为例讲解python的编码方式 指定执行编码方式 python2.7的默认编码方式为ascii字符集,这里所说的编码方式指执行编码方式,在编程过程中,有三个地方都涉及 ...

  3. python查看字符串编码方式_Python字符编码判断方法分析

    本文实例讲述了Python字符编码判断方法.分享给大家供大家参考,具体如下: 方法一: isinstance(s, str) 用来判断是否为一般字符串 isinstance(s, unicode) 用 ...

  4. python学习日常-编码与字符串格式化

    python编码也是遵循计算机技术的编码的,英文编码还是遵循ascii码,中文编码遵循gb2312,都遵循的是utf-8编码. 值得注意的是几个函数,ord("a"),是查询a的u ...

  5. 修改python默认的编码方式

    今天碰到了 python 编码问题, 报错信息如下 Traceback (most recent call last):   File "ntpath.pyc", line 108 ...

  6. Python学习-字符编码的理解

    Unicode编码和ASCII码两者都是机器能够理解的编码,你就是说出现一个码,计算机知道它对应哪种符号.因为这种编码形式将不同的字符全都和电平的高低电位联系在一起. Unicode,这种编码是全球通 ...

  7. Python 学习之[编码]

    全世界最早的编码是ASCII 最早只有 256个bit 8位 但是只用了128位 剩下一位补零.最早是美国人发明的 只支持英文 数字 和符号 一个字母是 8bit=1byte 随着计算机的世界普遍应用 ...

  8. Python学习---Python安装与基础1205

    1.0. 安装 1.1.1. 下载 官网下载地址:https://www.python.org/downloads/release/python-352/ 1.1.2. 配置环境变量 因为在安装的时候 ...

  9. 我的python学习笔记全集_记录我的Python学习笔记

    不想再像以前那样,什么都从头开始学习语法.总结语法,这样反而会过分纠结于语法,耽误了开发,毕竟语言的主要属性是工具,次要的属性是语言本身. 所以还是先熟练使用语言去进行开发,等足够熟悉了,再去研究语言 ...

最新文章

  1. 图像处理 100 问!!
  2. 面试官:关于负载均衡你了解多少
  3. 深度解读 OpenYurt:从边缘自治看 YurtHub 的扩展能力
  4. Ruby/Rails 生态环境、社区、资料 Ecosystem
  5. ruby中的复制 dup clone
  6. 云网络丢包故障定位全景指南
  7. .NET Exceptionless 日志收集框架本地环境搭建
  8. javascript中打印对象显示[object object]_js如何打印object对象
  9. hive 创建访问用户_hive创建角色并赋权
  10. python dict相加_Python合并字典操作时同key的value应该如何相加
  11. 编程语言对比 异常处理
  12. WordPress网站屏蔽后台搜索词广告-奇它博客
  13. Trend Micro 趋势科技
  14. magicyang语录
  15. app推广假量怎么识别?
  16. 恒压板框过滤实验数据处理_内江靠谱压滤机板框-清源环保
  17. 啊,这该死的天气和路况,让我特靠谱爱车失灵了《打工人的那些事》
  18. ubuntu16.04解决耳机没有声音
  19. python入门爬取表情包
  20. 标题创建实体类商品,包含属性:商品名称,商品价格,包含2个属性的构造函数

热门文章

  1. Android上传队列使用
  2. WPF自定义空心文字
  3. 影响Python运行效率的因素有哪些?
  4. 谈谈HTTP1.0,HTTP1.1和HTTP2.0区别
  5. linux之文件的高级命令
  6. Servlet3.0 Test
  7. winform如何保持TreeView节点展开和折叠的状态
  8. .NET重构—单元测试的代码重构
  9. Control Compliance Suite,听说过吗?
  10. Android Chromium WebView Crash