python中encode函数_python中文处理之encode/decode函数
python中文处理相信迷惑过不少同学。下面说说python2/3的encode和decode函数。
python2中,使用decode()和encode()来进行解码和编码,以unicode类型作为中间类型。即
decode encode
str ---------> unicode --------->str
示例(注意encode和decode的编码必须保持一致):
u = u'中文' #unicode对象u
gb2312_str = u.encode('gb2312') #gb2312编码字符串
gbk_str = u.encode('gbk') #gbk编码字符串
utf8_str = u.encode('utf-8') #utf-8编码字符串
gb2312_u = gb2312_str.decode('gb2312') #gb2312编码的unicode
utf8_u = gb2312_str.decode('utf-8') #utf-8编码的unicode,此处因为编解码方法不一致将导致无法还原原unicode类型
python2编解码处理给人的感觉是较复杂。于是在python3中取消了unicode类型,代替以unicode编码的字符串类型str。str和bytes关系如下:
encode decode
str ---------> bytes --------->str
python中encode函数_python中文处理之encode/decode函数相关推荐
- 基于python中jieba包的中文分词中详细使用
基于python中jieba包的中文分词中详细使用(一) 01.前言 之前的文章中也是用过一些jieba分词但是基本上都是处于皮毛,现在就现有的python环境中对其官方文档做一些自己的理解以及具体的 ...
- Python中的对象,类,super()函数
对象:(1)外观的特征 (2)正在做的事情 比如:那个穿蓝色衣服的正在打球的帅哥 类:属性(静态的变量)+方法(函数)是对对象的近似 类名约定是以大写字母开始的 类的出现: 是为了使得对象可以进行大 ...
- python中的counter()、elements()、most_common()和subtract()函数的用法
python中的counter().elements().most_common()和subtract()函数的用法 counter()方法: class collections.Counter([i ...
- python中怎么输出中文-python中使用print输出中文的方法
看Python简明教程,学习使用print打印字符串,试了下打印中文,不行. 编辑环境:IDLE 上网搜了下解决办法,各种说法,试了两种: print u"学习" print (u ...
- python中对文件、文件夹(文件操作函数)的操作
python中对文件.文件夹(文件操作函数)的操作需要涉及到os模块和shutil模块. 得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd() 返回指定目录下的所有文件和目 ...
- python查找指定字符所在行号_在python中获取当前位置所在的行号和函数名
对于python,这几天一直有两个问题在困扰我: 1.python中没办法直接取得当前的行号和函数名.这是有人在论坛里提出的问题,底下一群人只是在猜测python为什么不像__file__一样提供__ ...
- python中相对路径_Python中的绝对路劲和相对路径
1.绝对路径 os.path.abspath("文件名"): 显示的是一个文件的绝对路劲 eg: >>> import os >>> os.ch ...
- Python中的 len() 是什么?如何使用 len() 函数查找字符串的长度
Python中的 len() 是什么?如何使用 len() 函数查找字符串的长度 在编程语言中,获取特定数据类型的长度是一种常见做法. Python也一样,因为可以使用内置的 len() 函数来获取字 ...
- 基于python中jieba包的中文分词中详细使用(一)
文章目录 基于python中jieba包的中文分词中详细使用(一) 01.前言 02.jieba的介绍 02.1 What 02.2特点 02.3安装与使用 02.4涉及到的算法 03.主要功能 03 ...
- python中print是什么意思中文-python中使用print输出中文的方法
看Python简明教程,学习使用print打印字符串,试了下打印中文,不行. 编辑环境:IDLE 上网搜了下解决办法,各种说法,试了两种: print u"学习" print (u ...
最新文章
- express组合gulp自动更新代码重启浏览器
- Binder子系统之调试分析(二)
- 华为荣耀20计算机,华为云电脑将停止服务/荣耀新机保护壳曝光/小米新机渲染图曝光...
- potplayer 多个进程_创建守护进程的步骤
- java format 补足空格_11 个简单的 Java 性能调优技巧
- 没有样式重置_我不能没有的5个Vue.js库
- SQLCE数据库的几点研究
- Batch Normalization的意义
- [JOYOI] 自然数拆分Lunatic版
- DirectX修复工具的详细使用步骤介绍
- 了解DPDK——内核NIC接口
- 雅戈尔关于媒体报道出澄清公告 谨防股价变动
- 电脑连不上网,排查原因
- Android用Double Array Trie (双数组)实现关键字的搜索
- 《伟大的小细节:互联网产品设计中的微创新思维》——3.6 基于当前场景的前因后果推演...
- 和时间做朋友,在Mate40发布会现场感知“华为精神”
- 数据结构与算法(Python版)十五:无序表抽象数据类型及Python实现
- android edittext限制字节_EditText输入字数限制的三个方法
- matlab 纯迟延_DMC算法MATLAB编程及仿真
- 记录一下excel表中多条件if函数的简单用法