对于python2.7

字符串在Python2.7内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码成unicode,再从unicode编码成另一种编码。

先用一些编辑器(如editplus )看一下你的txt文件保存的是utf-8,还是gb2312或其他的。当你读行时可以这样

line = (file1.readline()).decode('utf-8').encode('gb2312')或

line = (file1.readline()).decode('gb2312').encode('utf-8')

注意:txt使用utf8编码的时候会默认在文件开头插入三个不可见字符。这个是windows用来判断txt编码是否为utf8的。所以如果你直接使用decode('utf-8')的话是得不到正确结果的。

必须先判断前三个字符是否是windows插入的那三个。这个python已经定义了一个常量了,可以直接和这个常量比较,如果一样就删除前三个字符然后再decode。

import codecs

data = open("Test.txt").read()

if data[:3] == codecs.BOM_UTF8:

data = data[3:]

print data.decode("utf-8")

延伸:

因为decode的函数原型是decode([encoding], [errors='strict']),可以用第二个参数控制错误处理的策略,默认的参数就是strict,代表遇到非法字符时抛出异常;

如果设置为ignore,则会忽略非法字符;

如果设置为replace,则会用?取代非法字符;

如果设置为xmlcharrefreplace,则使用XML的字符引用。

对于Python3

python3下比较简单,打开的时候指定encoding参数即可:open("txt.txt", encoding="gbk").read()。

以上这篇python读取中文txt文本的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

python怎么读中文-python读取中文txt文本的方法相关推荐

  1. python提取列表中文本_python提取图像的名字*.jpg到txt文本的方法

    如下所示: # -*- coding:utf-8 -*- import sys sys.path.append('E:\\Anaconda\\libs') import os #os:操作系统相关的信 ...

  2. python获取图片名称_python提取图像的名字*.jpg到txt文本的方法

    如下所示: # -*- coding:utf-8 -*- import sys sys.path.append('E:\\Anaconda\\libs') import os #os:操作系统相关的信 ...

  3. python读取中文txt文本-python读取中文txt文本的方法

    对于python2.7 字符串在Python2.7内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码成unicode,再从unico ...

  4. python读取txt中的一列称为_python读取中文txt文本的方法

    对于python2.7 字符串在Python2.7内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码成unicode,再从unico ...

  5. python txt默认读取字符还是行,python读取中文txt文本的方法

    字符串在Python2.7内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码成unicode,再从unicode编码成另一种编码. ...

  6. python如何读取中文文件-python读取中文txt文本的方法

    对于python2.7 字符串在Python2.7内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码成unicode,再从unico ...

  7. python 读法-python 怎么读,python 怎么读

    python 怎么读 python,英2113[ˈpaɪθən],美[ˈpaɪθɑːn],英["paɪθən]:发音有点像"派森"5261 或 "派粉" ...

  8. gensim在“中文查找(关键词)“与“txt文本“之间做相似度计算(返回最相似的文本)

    本文目的 搜索关键词,返回最相关的txt文本内容(模仿搜索引擎) 网上的例子都是一个list里面放入几句话,然后输入关键词去计算相似度. 无法在实际中应用,例如 http://blog.csdn.ne ...

  9. python是什么意思怎么读-python怎么读,python是什么意思

    python怎么读: 英[ˈpaɪθən] 美[ˈpaɪθɑːn] python是什么意思:中文就是蟒蛇的意思,一种脚本语言 ----------------------------- 小朋友们,欢迎 ...

最新文章

  1. 我叫Java,2019年总结,大家请查收
  2. python学习框架图-Python学习—框架篇之初识Django
  3. Leetcode1700. 无法吃午餐的学生数量[C++题解]:模拟题简单,用queue
  4. matlab中方差直方图,如何规范直方图在MATLAB?
  5. CST normalize S-parameter to given impedance
  6. 强悍的命令行 —— echo、env($PATH)、sudo
  7. 构建自己的PHP框架(邮件发送)
  8. 问题三十七:C++怎么解一元四次方程?(1)——怎么解一元二次方程
  9. echarts改变颜色属性的demo
  10. 计算机的组策略在什么地方,Win10本地组策略在哪里,Win10怎么打开本地组策略编辑器?...
  11. 最全H桥电机驱动模块L298N原理及应用
  12. HDU 2243(AC自动机+矩阵快速幂)
  13. 07 java.awt.Robot的一些使用
  14. 葫芦娃用计算机,葫芦娃互通版电脑版
  15. Java课设设计-家庭财务管理系统
  16. openCV之waitKey函数简介
  17. 云服务器(ubuntu)搭建nginx-rtmp服务器 实现直播功能(纯命令行操作)
  18. HTML+CSS制作二级菜单栏
  19. ieee 754四字节转浮点数c语言实现,IEEE-754标准浮点数,十六进制与十进制转换方法(附C代码)...
  20. UCloud Ubuntu 18.04 配置GPU环境踩坑指南,包括驱动,CUDA,Docker,Nvidia-Docker等

热门文章

  1. debian开机打开浏览器_使自動起動! 我学到了!原来“文件”可以跟“应用程序”一样,都能设置开机自启!!...
  2. PHP判断ip地址是否合法
  3. jquery中去重复排序(函数: $.grep() join() sort() )
  4. iOS 点击Application icon加载推送通知Data
  5. easyui学习笔记4—panel的实现
  6. CCF201709-3 JSON查询(100分)【文本处理】
  7. NUC1177 排序【排序】
  8. CCF NOI1018 打电话
  9. CCF201703-1 分蛋糕(100分)
  10. UVALive5461 UVA615 POJ1308 Is It A Tree?(解法二)【废除!!!】