1----字符编码:

    字符编码(英语:Character encoding)、字集码是把字符集中的字符编码为指定集合中某一对象(例如:比特模式、自然数串行、8位组或者电脉冲),以便文本在计算机中存储和通过通信网络的传递。

    常见的例子包括将拉丁字母表编码成摩斯电码和ASCII。其中,ASCII将字母、数字和其它符号编号,并用7比特的二进制来表示这个整数。通常会额外使用一个扩充的比特,以便于以1个字节的方式存储。

    ASCII(pronunciation: 英语发音:/ˈæski/ ASS-kee[1],American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,它主要用于显示现代英语,而其扩展版本EASCII则可以部分支持其他西欧语言,并等同于国际标准ISO/IEC 646。由于万维网使得ASCII广为通用,直到2007年12月,逐渐被Unicode取代。

        0~31及127(共33个)是控制字符或通信专用字符(其余为可显示字符)

        32~126(共95个)是字符(32是空格),其中48~57为0到9十个阿拉伯数字

        65~90为26个大写英文字母,

        97~122号为26个小写英文字母,其余为一些标点符号、运算符号等

    Unicode(中文:万国码、国际码、统一码、单一码)是计算机科学领域里的一项业界标准。它对世界上大部分的文字系统进行了整理、编码,使得电脑可以用更为简单的方式来呈现和处理文字Unicode至今仍在不断增修,每个新版本都加入更多新的字符。目前最新的版本为7.0.0,已收入超过十万个字符(第十万个字符在2005年获采纳)。Unicode涵盖的数据除了视觉上的字形、编码方法、标准的字符编码外,还包含了字符特性,如大小写字母。

          

    UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,也是一种前缀码。它可以用来表示Unicode标准中的任何字符,且其编码中的第一个字节仍与ASCII兼容,这使得原来处理ASCII字符的软件无须或只须做少部份修改,即可继续使用。因此,它逐渐成为电子邮件、网页及其他存储或发送文字的应用中,优先采用的编码

        python2默认的编码是ascii

如何避免中文乱码:

1)使用utf-8编码方案

    #-*-coding:utf-8-*-

    #coding:utf-8  

2)或者遇到字符(节)串,立刻转化为unicode,不要用str(),直接就用unicode()

    unicode_str=unicode('中文‘,eccoding=‘utf-8’)

    printunicode_str.encode('utf-8')

3)如果对文件操作,打开文件的时候,最好用codecs.open,替代open(这个后面会讲到,先放在这里)

    

import codecs
codecs.open('filename', encoding='utf8')

      

转载于:https://www.cnblogs.com/xiaoyoucai/p/6543467.html

17.3.13--python编码问题相关推荐

  1. 【实用篇】Python 编码风格与规范

    前言: 为了让不同编码习惯的开发者更好的协作配合,并且形成良好的基础编码规范与风格,我们以 PEP8 为基础,修改了陈旧的规则,丰富了示例,并整理了工作中常见的不规范操作,最终形成此 Python 编 ...

  2. Python编码---转自金角大王

    本节内容 编码回顾 编码转换 Python的bytes类型 编码回顾 在备编码相关的课件时,在知乎上看到一段关于Python编码的回答 这哥们的这段话说的太对了,搞Python不把编码彻底搞明白,总有 ...

  3. python编码规范手册-PEP8 Python 编码规范整理

    决定开始Python之路了,利用业余时间,争取更深入学习Python.编程语言不是艺术,而是工作或者说是工具,所以整理并遵循一套编码规范是十分必要的.所以今天下午我根据PEP 8整理了一份,以后都照此 ...

  4. PEP8 Python 编码规范整理

    决定开始Python之路了,利用业余时间,争取更深入学习Python.编程语言不是艺术,而是工作或者说是工具,所以整理并遵循一套编码规范是十分必要的.所以今天下午我根据PEP 8整理了一份,以后都照此 ...

  5. 神经网络贷款风险评估(base on keras and python ) 原创 2017年08月18日 14:35:17 标签: python / 神经网络 / keras 300 用我

    神经网络贷款风险评估(base on keras and python ) 原创 2017年08月18日 14:35:17 标签: python / 神经网络 / keras / 300 编辑 删除 ...

  6. Python编码风格指南

    来源 | 异步图书 本节收录了稍作剪辑的PEP 8摘要(Python Enhancement Proposal,Python增强提案).PEP 8由Guido van Rossum和Barry War ...

  7. pep8 python 编码方式_PEP8 Python 编码规范整理

    决定开始Python之路了,利用业余时间,争取更深入学习Python.编程语言不是艺术,而是工作或者说是工具,所以整理并遵循一套编码规范是十分必要的.所以今天下午我根据PEP 8整理了一份,以后都照此 ...

  8. python编码转换在线_Python 编码转换与中文处理

    Python 编码转换与中文处理 python 中的 unicode是让人很困惑.比较难以理解的问题. utf-8是unicode的一种实现方式,unicode.gbk.gb2312是编码字符集. d ...

  9. python编码错误:UnicodeDecodeError: 'utf8' codec can't decode

    python编码错误:UnicodeDecodeError: 'utf8' codec can't decode (2012-11-01 17:16:23) 转载▼ 标签: 杂谈 分类:python学 ...

  10. Python 编码转换与中文处理

    Python 编码转换与中文处理 python 中的 unicode是让人很困惑.比较难以理解的问题. utf-8是unicode的一种实现方式,unicode.gbk.gb2312是编码字符集. d ...

最新文章

  1. mysql中堆和栈_堆和栈的区别
  2. Windows下查找文件或文件夹被哪个进程占用
  3. 为Ubuntu设置新的软件源
  4. 连接不同区块链的跨链技术介绍
  5. 高翔orbslam_高翔博士分享ORBSLAM2_with_pointcloud_map的安装步骤
  6. Hybris Commerce里的持久层
  7. pythonwindows文件_python查询windows文件
  8. POJ 1166 The Clocks (爆搜 || 高斯消元)
  9. C# RangeHelper
  10. 日期选择器_FPGA逻辑部分Verilog实验-选择器电路
  11. Codeforces Round 253 (Div. 2)
  12. rs485接收中断函数使能_RS485通讯几种常见问题
  13. 测试吃鸡游戏帧数软件,帧数暴涨10%+ RX 560D开核“吃鸡”测试
  14. 2022教培机构升级转型新模式
  15. 利用百度地图开放平台的Web API实现检索定位
  16. 弄了一整天,终于把打印自定义纸张大小搞定了
  17. 计算机毕业设计JAVA项目实训管理系统设计与实现mybatis+源码+调试部署+系统+数据库+lw
  18. 企业级360用户画像
  19. ijkplayer系列1:ijkplayer介绍
  20. DNS-over-HTTPS(DoH)简析与配置

热门文章

  1. java smtp pop3_POP3/SMTP指令
  2. Framework学习(二)Android的启动过程
  3. php foreach结果如何保存_每天一个PHP语法四引用使用及实现
  4. vim删除多行_vim文本编辑器
  5. 嵌入式Linux入门11:应用层编程应用和分类
  6. 一个可变参数类型检查的示例
  7. 【kafka】关于Kafka Fetch Session的讨论
  8. 【java】高并发之限流 RateLimiter使用
  9. 【Flink】ProcessFunction:Flink最底层API使用教程
  10. Bash shell脚本打印出正在执行的命令