csv文件编码转换:解决utf-8编码的文件在excel打开时中文乱码问题。

Python完整代码如下:

# -*- coding:utf-8 -*-

# date = 20201231

#将utf-8编码的csv文件转换为gb2312编码的csv文件

import chardet

import codecs

from sys import argv

script,file_name = argv

file_in = file_name

file_out = 'gb2312-'+file_name

encode_in = 'utf-8'

encode_out = 'gb2312'

with codecs.open(filename=file_in,mode='r',encoding=encode_in) as fin:

data = fin.read()

with open(file_out,mode='w',encoding=encode_out,newline='') as fout:

fout.write(data)

fout.close()

with open(file_out,'rb') as f:

data = f.read()

print(chardet.detect(data)['encoding'])

命名为:utf-8-2-gb2312.py,使用时在cmd命令行输入如下:

>python utf-8-2-gb2312.py filename.csv

输出结果:

GB2312

在filename.csv同目录下生成文件:gb2312-filename.csv。

备注:

with open(file_out,mode='w',encoding=encode_out,newline='') as fout:

这里要设置“ newline='' ”,否则在新生成的csv文件中会产生空行。

csv转为utf8编码_将utf-8编码的csv文件转换为gb2312编码的csv文件相关推荐

  1. Source Insight 将UTF-8格式的JAVA文件转换为GB2312格式的JAVA文件

    导师逼着要改进建议,正好最近几天组内的其他成员要进行code review,自己又不想将他们的代码导入eclipse,主要是自己有个强迫症,不喜欢看到工程中有错误和警告,导入他人的代码难免会产生错误. ...

  2. 把UTF-8编码转换为GB2312编码

    最近在做的广告系统中,碰到了一个问题,广告系统采用的UTF-8编码,而一些使用这套广告系统的频道页面使用的是GB2312编码.当然也有使用UTF-8编码的频道使用这套广告系统. 频道页面是通过嵌入类似 ...

  3. PDF文件转换为Base64编码

    在线base64转pdf:格式转换 包名: import java.io.BufferedInputStream; import java.io.BufferedOutputStream; impor ...

  4. csv转为utf8编码_中文的csv文件的编码改成utf8的方法

    直奔主题:把包含中文的csv文件的编码改成utf-8的方法: 啰嗦几句: 在用pandas读取hive导出的csv文件时,经常会遇到类似UnicodeDecodeError: 'gbk' codec ...

  5. python中文字符串编码_浅谈python下含中文字符串正则表达式的编码问题

    前言 Python文件默认的编码格式是ascii ,无法识别汉字,因为ascii码中没有中文. 所以py文件中要写中文字符时,一般在开头加 # -*- coding: utf-8 -*- 或者 #co ...

  6. php将汉字转换为gb2312编码,php实现utf-8和GB2312编码相互转换

    php实现utf-8和GB2312编码相互转换的一个函数,有需要的朋友可以参考下. 复制代码 代码如下: /******************************************** * ...

  7. 此文件是二进制文件或使用了不支持的文本编码_计算机的基本原理(组成、发展、DOS、交互、文件、进制、环境)...

    1.计算机基本概念 1.1 计算机是什么? • 计算机(computer)俗称电脑,是现代一种用于高速计算的电子计算机器 • 特点 : 数值计算 逻辑计算 存储记忆功能 • 总结 : 能够按照程序运行 ...

  8. java string设置编码_详解Java中String类型与默认字符编码

    为什么写这个 至于为什么要写这个,主要是一句mmp一定要讲,绕了一上午,晕死 Java程序中的中文乱码问题一直是一个困扰程序员的难题,自己也不例外,早在做项目时就遇到过很多编码方式的坑,当时想填来着, ...

  9. 编码 data:text/html;c,iOS 用TFHpple抓取GB-2312编码的html页面,页面返回编码错误

    HTMLParser方法可以参考https://github.com/zootreeves/Objective-C-HMTL-Parser TFHpple方法的使用可以看https://github. ...

最新文章

  1. 基于机器视觉的手机产品条码检测方案
  2. AI赋能,让无人系统更智能
  3. Silverlight Telerik控件学习:带CheckBox复选框的树形TreeView控件
  4. 017_Upload上传
  5. 主要几种通信协议的性能比较(转载)
  6. jmeter中生成UUID作为唯一标识符
  7. Centos6.9以下查看端口占用情况和开启端口命令
  8. ReentrantLock源码
  9. 真涨工资了:多所高校博士生资助标准大幅度提升
  10. 服务器收到消息加入数组,从聊天服务器发送到聊天客户端的数组更新
  11. 为什么说区块链是具有革命性意义的?
  12. 随机森林筛选特征Matlab,特征筛选(随机森林)
  13. 卷积神经网络处理猫和狗图片
  14. 【从零开始游戏开发】EmmyLua插件注解功能
  15. api sdk开发手册 模板
  16. U盘重装Win10系统视频教程
  17. Linux 30岁了,你知道吗?
  18. 计算机名加符号,最新带符号的网名
  19. 编程学习网站 收集于网络
  20. 中国电影|嘉宝盘点近几年国内票房突破30亿的影片

热门文章

  1. 利用微软Bing进行AI绘画
  2. 谷歌神经网络框架怎么用,谷歌神经网络框架下载
  3. java word jar_处理word的poi的jar包下载_处理word的poi的jar包官方下载-太平洋下载中心...
  4. 内存不够导致错误MySQL server has gone away
  5. php 面向对象之反射
  6. 华为手机的7种截屏方式
  7. 【图形学】31 Unity 的光源衰减和阴影
  8. linux忘记root密码修改root密码及免登录配置
  9. 基于鸟群优化的BP神经网络(分类应用) - 附代码
  10. 2023年最全的Google关键词布局策略(搜索分析)