Python学习之——编码方式
1.各种编码方式
ASCII:http://zh.wikipedia.org/zh-hans/ASCIIUnicode:http://zh.wikipedia.org/zh-hans/UnicodeUTF-8:http://zh.wikipedia.org/zh/UTF-8GBK:http://zh.wikipedia.org/zh/%E6%B1%89%E5%AD%97%E5%86%85%E7%A0%81%E6%89%A9%E5%B1%95%E8%A7%84%E8%8C%83 GB_2312:http://zh.wikipedia.org/zh/GB_2312
2.各种编码方式的来由
1.编码: 在计算机中,所有的数据在存储和运算时都要使用二进制数表示(因为计算机用高电平和低电平分别表示1和0).具体用哪些二进制数字表示哪个符号,当然 每个人都可以约定自己的一套(这就叫编码),而大家如果要想互相通信而不造成混乱,那么大家就必须使用相同的编码规则,于是美国有关的标准化组织就 出台了ASCII编码,统一规定了上述常用符号用哪些二进制数来表示。
2.ASCII(American Standard Code for Information Interchange): 众所周知,计算机是由美国人发明的,那么ASCII的制定也是由美国人完成的,因此ASCII的制定是为了显示现代美国英语。其中包括: 26个基本拉丁字母、阿拉伯数字和英式标点符号。
3.GB2312 :ASCII只能解决美国人的信息交换需求,对于以汉字汉语为交流工具的中国人必须制定自己的编码方式,才能解决信息交流的要求。 GB2312就是这样一种编码方式,它是中华人民共和国国家标准简体中文字符集,全称《信息交换用汉字编码字符集·基本集》。
4.Unicode: 世界上有200多个国家和地区,常用的语言文字也有几十种,各国都制定了自己的编码标准。例如日本:Shift_JIS,韩国:Euc-kr,各国有各国的标
准,就会不可避免地出现冲突,结果就是,在多语言混合的文本中,显示出来会有乱码。 Unicode的产生就是为了解决这个问题的。Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了。
常用的是用两个字节表示一个字符(如果要用到非常偏僻的字符,就需要4个字节)。现代操作系统和大多数编程语言都直接支持Unicode。
既然Unicode方式解决了冲突,也就是能达到全世界交换信息的需求,那又是为什么要有utf-8这种编码方式呢?看下图
5.UTF-8(8-bit Unicode Transformation Format) 如果信息基本上全部是英文的话,用Unicode编码比ASCII编码需要多一倍的存储空间,在存储和传输上就十分不划算。所以,为了节约空间,又出现了把Unicode编码转化为“可变长编码”的UTF-8编码。UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符,用UTF-8编码就能节省空间。
Python学习之——编码方式相关推荐
- 【Python】python3编码方式encode介绍
上一篇文章介绍了计算机编码发展历史和编码方式,现在我们聚焦到python语言中,在最新的Python3版本中,字符串是以Unicode编码的,也就是说,Python的字符串支持多语言.例如: prin ...
- python中的编码方式
说明 这里我们以python2.7为例讲解python的编码方式 指定执行编码方式 python2.7的默认编码方式为ascii字符集,这里所说的编码方式指执行编码方式,在编程过程中,有三个地方都涉及 ...
- python查看字符串编码方式_Python字符编码判断方法分析
本文实例讲述了Python字符编码判断方法.分享给大家供大家参考,具体如下: 方法一: isinstance(s, str) 用来判断是否为一般字符串 isinstance(s, unicode) 用 ...
- python学习日常-编码与字符串格式化
python编码也是遵循计算机技术的编码的,英文编码还是遵循ascii码,中文编码遵循gb2312,都遵循的是utf-8编码. 值得注意的是几个函数,ord("a"),是查询a的u ...
- 修改python默认的编码方式
今天碰到了 python 编码问题, 报错信息如下 Traceback (most recent call last): File "ntpath.pyc", line 108 ...
- Python学习-字符编码的理解
Unicode编码和ASCII码两者都是机器能够理解的编码,你就是说出现一个码,计算机知道它对应哪种符号.因为这种编码形式将不同的字符全都和电平的高低电位联系在一起. Unicode,这种编码是全球通 ...
- Python 学习之[编码]
全世界最早的编码是ASCII 最早只有 256个bit 8位 但是只用了128位 剩下一位补零.最早是美国人发明的 只支持英文 数字 和符号 一个字母是 8bit=1byte 随着计算机的世界普遍应用 ...
- Python学习---Python安装与基础1205
1.0. 安装 1.1.1. 下载 官网下载地址:https://www.python.org/downloads/release/python-352/ 1.1.2. 配置环境变量 因为在安装的时候 ...
- 我的python学习笔记全集_记录我的Python学习笔记
不想再像以前那样,什么都从头开始学习语法.总结语法,这样反而会过分纠结于语法,耽误了开发,毕竟语言的主要属性是工具,次要的属性是语言本身. 所以还是先熟练使用语言去进行开发,等足够熟悉了,再去研究语言 ...
最新文章
- 图像处理 100 问!!
- 面试官:关于负载均衡你了解多少
- 深度解读 OpenYurt:从边缘自治看 YurtHub 的扩展能力
- Ruby/Rails 生态环境、社区、资料 Ecosystem
- ruby中的复制 dup clone
- 云网络丢包故障定位全景指南
- .NET Exceptionless 日志收集框架本地环境搭建
- javascript中打印对象显示[object object]_js如何打印object对象
- hive 创建访问用户_hive创建角色并赋权
- python dict相加_Python合并字典操作时同key的value应该如何相加
- 编程语言对比 异常处理
- WordPress网站屏蔽后台搜索词广告-奇它博客
- Trend Micro 趋势科技
- magicyang语录
- app推广假量怎么识别?
- 恒压板框过滤实验数据处理_内江靠谱压滤机板框-清源环保
- 啊,这该死的天气和路况,让我特靠谱爱车失灵了《打工人的那些事》
- ubuntu16.04解决耳机没有声音
- python入门爬取表情包
- 标题创建实体类商品,包含属性:商品名称,商品价格,包含2个属性的构造函数