需求:使用codecs模块将utf-8的文件保存成gbk格式。

读取的时候,已经将编码设置成utf-8了。输出结果是unicode字符串。

但是在将unicode字符串写入文件并保存为gbk的时候,发现文件内容为空(0kb)。

注:测试的时候,发现有的文件转码的时候,文件变小了,而且内容被截断。

比如:原本a.txt的内容为:

但转码后变成:

原本以为是NUL字符的问题,但后面替换了NUL字符,发现结果还是一样。

python代码如下:

#coding:utf-8

import os

import codecs

def ReadFile(filePath,encoding="utf-8"):

try:

strContent = ""

f = codecs.open(filePath,"r",encoding=encoding)

line = f.readline()

while(line):

strContent += line

line = f.readline()

f.close()

return strContent

except Exception,ex:

return None

def WriteFile(filePath,u,encoding="gb2312"):

try:

f = codecs.open(filePath,"w",encoding)

f.writelines(u)

f.flush()

f.close()

except Exception,ex:

pass

def UTF8_2_GBK(src,dst):

try:

content = ReadFile(src,encoding="utf-8")

WriteFile(dst,content,"gb2312")

except Exception,ex:

pass

python中codecs_Python:如何使用codecs模块将unicode数据保存成gbk格式相关推荐

  1. python codecs_Python:如何使用codecs模块将unicode数据保存成gbk格式

    需求:使用codecs模块将utf-8的文件保存成gbk格式. 读取的时候,已经将编码设置成utf-8了.输出结果是unicode字符串. 但是在将unicode字符串写入文件并保存为gbk的时候,发 ...

  2. python中以表示语块_scikitlearn:将数据拟合成块与将其全部拟合到on

    这取决于您使用的矢量器.在 CountVectorizer统计文档中单词的出现次数. 它为每个文档输出一个(n_words, 1)向量,其中包含每个单词在文档中出现的次数.n_words是文档中的单词 ...

  3. pythonutf8转gbk,Python实现把utf-8格式的文件转换成gbk格式的文件

    需求:将utf-8格式的文件转换成gbk格式的文件 实现代码如下: 代码如下: def ReadFile(filePath,encoding="utf-8″): with codecs.op ...

  4. Python中常用的数据分析工具(模块)有哪些?

    本期Python培训分享:Python中常用的数据分析工具(模块)有哪些?Python本身的数据分析功能并不强,需要安装一些第三方的扩展库来增强它的能力.我们课程用到的库包括NumPy.Pandas. ...

  5. python的IO,以及codecs模块

    读写文件是最常见的IO操作.Python内置了读写文件的函数,用法和C是兼容的. 读文件 打开一个文件,读取后应该close(),为了保证无论是否出错都能正确地关闭文件,我们可以使用try ... f ...

  6. Python中计算程序的运行时间——timeit模块

    Python中计算程序的运行时间--timeit模块 绪论 一.timeit的基本用法 1.1 timeit.timeit()函数: 创建一个Timer实例,并运行代码进行计时,默认将代码执行一百万次 ...

  7. Python中使用sentinelsat包自动下载Sentinel系列数据

    Python中使用sentinelsat包自动下载Sentinel系列数据 前言 普通下载 使用工具批量下载Sentinel 数据 使用SNAP批量下载 第三方软件或网站批量下载 Sentinel-1 ...

  8. python中使用zip函数基于两个列表数据list创建字典dict数据(Create a dictionary by passing the output of zip to dict)

    python中使用zip函数基于两个列表数据list创建字典dict数据(Create a dictionary by passing the output of zip to dict) 目录

  9. python无法打印unicode编码_【整理】Python中实际上已经得到了正确的Unicode或某种编码的字符,但是看起来或打印出来却是乱码...

    [背景] Python中的字符编码,其实的确有点复杂. 再加上,不同的开发环境和工具中,显示的逻辑和效果又不太相同,尤其是,中文的,初级用户,最常遇到的: (1)在Python自带的IDE:IDLE中 ...

最新文章

  1. SAP MM 采购订单含税价实现方式
  2. delphi回调函数
  3. 火狐浏览器pentadatyl插件的基本设置
  4. HDU3496-Watch The Movie
  5. Android中使用画笔和画布绘制一个矩形
  6. gradient 渐变
  7. winform界面闪退
  8. 你的安全设置不允许在您的计算机,你的安全设置不允许网站使用安装在你的计算机上的ActiveX控件...
  9. CF1511G-Chips on a Board【倍增】
  10. mysql 分类汇总_sql多级分类汇总实现介绍
  11. tp5下通过composer实现日志记录功能
  12. php百度语音合成,Drupal 与百度云语音合成(PHP SDK)的集成
  13. 所有的 iPhone 都已经被破解了!
  14. linux下的备份管理rsync
  15. Android 权限清单大全
  16. 高斯误差函数erf的数值计算方法(C++实现)
  17. 《从底层结构开始学习FPGA》目录与传送门
  18. 错过等一年!物流与交通的先锋碰撞,点击进入这场大佬云集的学术盛宴
  19. 科沃斯扫地机器人电路原理图_科沃斯扫地机器人的工作原理及维修方法
  20. 怎么用网线连接开发板

热门文章

  1. foreach 和 map_每个开发人员都应该知道的forEach()和map()之间的差异
  2. ajax存储单个数据_科学家现在可以使用单个原子存储数据
  3. “ create-react-app”和创建React应用程序的未来
  4. 133_Power BI 报表服务器2020年1月版本更新亮点
  5. Java中的equals和==的差别 以及Java中等价性和同一性的讨论
  6. 全程干货,requests模块与selenium框架详解
  7. Python小技巧:如何批量更新已安装的库?
  8. 10个必会的 PyCharm 技巧,附高清大图
  9. Python高级——多线程(threading)
  10. 漫步最优化三——优化算法的一般结构