python怎么读中文-python读取中文txt文本的方法
对于python2.7
字符串在Python2.7内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码成unicode,再从unicode编码成另一种编码。
先用一些编辑器(如editplus )看一下你的txt文件保存的是utf-8,还是gb2312或其他的。当你读行时可以这样
line = (file1.readline()).decode('utf-8').encode('gb2312')或
line = (file1.readline()).decode('gb2312').encode('utf-8')
注意:txt使用utf8编码的时候会默认在文件开头插入三个不可见字符。这个是windows用来判断txt编码是否为utf8的。所以如果你直接使用decode('utf-8')的话是得不到正确结果的。
必须先判断前三个字符是否是windows插入的那三个。这个python已经定义了一个常量了,可以直接和这个常量比较,如果一样就删除前三个字符然后再decode。
import codecs
data = open("Test.txt").read()
if data[:3] == codecs.BOM_UTF8:
data = data[3:]
print data.decode("utf-8")
延伸:
因为decode的函数原型是decode([encoding], [errors='strict']),可以用第二个参数控制错误处理的策略,默认的参数就是strict,代表遇到非法字符时抛出异常;
如果设置为ignore,则会忽略非法字符;
如果设置为replace,则会用?取代非法字符;
如果设置为xmlcharrefreplace,则使用XML的字符引用。
对于Python3
python3下比较简单,打开的时候指定encoding参数即可:open("txt.txt", encoding="gbk").read()。
以上这篇python读取中文txt文本的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
python怎么读中文-python读取中文txt文本的方法相关推荐
- python提取列表中文本_python提取图像的名字*.jpg到txt文本的方法
如下所示: # -*- coding:utf-8 -*- import sys sys.path.append('E:\\Anaconda\\libs') import os #os:操作系统相关的信 ...
- python获取图片名称_python提取图像的名字*.jpg到txt文本的方法
如下所示: # -*- coding:utf-8 -*- import sys sys.path.append('E:\\Anaconda\\libs') import os #os:操作系统相关的信 ...
- python读取中文txt文本-python读取中文txt文本的方法
对于python2.7 字符串在Python2.7内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码成unicode,再从unico ...
- python读取txt中的一列称为_python读取中文txt文本的方法
对于python2.7 字符串在Python2.7内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码成unicode,再从unico ...
- python txt默认读取字符还是行,python读取中文txt文本的方法
字符串在Python2.7内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码成unicode,再从unicode编码成另一种编码. ...
- python如何读取中文文件-python读取中文txt文本的方法
对于python2.7 字符串在Python2.7内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码成unicode,再从unico ...
- python 读法-python 怎么读,python 怎么读
python 怎么读 python,英2113[ˈpaɪθən],美[ˈpaɪθɑːn],英["paɪθən]:发音有点像"派森"5261 或 "派粉" ...
- gensim在“中文查找(关键词)“与“txt文本“之间做相似度计算(返回最相似的文本)
本文目的 搜索关键词,返回最相关的txt文本内容(模仿搜索引擎) 网上的例子都是一个list里面放入几句话,然后输入关键词去计算相似度. 无法在实际中应用,例如 http://blog.csdn.ne ...
- python是什么意思怎么读-python怎么读,python是什么意思
python怎么读: 英[ˈpaɪθən] 美[ˈpaɪθɑːn] python是什么意思:中文就是蟒蛇的意思,一种脚本语言 ----------------------------- 小朋友们,欢迎 ...
最新文章
- 我叫Java,2019年总结,大家请查收
- python学习框架图-Python学习—框架篇之初识Django
- Leetcode1700. 无法吃午餐的学生数量[C++题解]:模拟题简单,用queue
- matlab中方差直方图,如何规范直方图在MATLAB?
- CST normalize S-parameter to given impedance
- 强悍的命令行 —— echo、env($PATH)、sudo
- 构建自己的PHP框架(邮件发送)
- 问题三十七:C++怎么解一元四次方程?(1)——怎么解一元二次方程
- echarts改变颜色属性的demo
- 计算机的组策略在什么地方,Win10本地组策略在哪里,Win10怎么打开本地组策略编辑器?...
- 最全H桥电机驱动模块L298N原理及应用
- HDU 2243(AC自动机+矩阵快速幂)
- 07 java.awt.Robot的一些使用
- 葫芦娃用计算机,葫芦娃互通版电脑版
- Java课设设计-家庭财务管理系统
- openCV之waitKey函数简介
- 云服务器(ubuntu)搭建nginx-rtmp服务器 实现直播功能(纯命令行操作)
- HTML+CSS制作二级菜单栏
- ieee 754四字节转浮点数c语言实现,IEEE-754标准浮点数,十六进制与十进制转换方法(附C代码)...
- UCloud Ubuntu 18.04 配置GPU环境踩坑指南,包括驱动,CUDA,Docker,Nvidia-Docker等
热门文章
- debian开机打开浏览器_使自動起動! 我学到了!原来“文件”可以跟“应用程序”一样,都能设置开机自启!!...
- PHP判断ip地址是否合法
- jquery中去重复排序(函数: $.grep() join() sort() )
- iOS 点击Application icon加载推送通知Data
- easyui学习笔记4—panel的实现
- CCF201709-3 JSON查询(100分)【文本处理】
- NUC1177 排序【排序】
- CCF NOI1018 打电话
- CCF201703-1 分蛋糕(100分)
- UVALive5461 UVA615 POJ1308 Is It A Tree?(解法二)【废除!!!】