要点:

  • python修改默认编码为utf-8;
  • 在读取csv或者 xls文件时 写入参数encoding="gbk";如果 gbk也不能 decode,使用收录字符更广的‘’gb18030‘’解码。
  • 使用中文列名时 decode('utf-8'), 或者 u'中文列名';一劳永逸>  from __future__ import unicode_literals
  • 使用codecs模块读取中文文本
# -*- coding: utf-8 -*-
import sys
reload(sys)
sys.setdefaultencoding('utf8')
import pandas as pd
path_1= 'brokerUserfeeList.xls'
x = pd.read_excel(path_, encoding="gbk")
print x.columns
print x["成交金额".decode('utf-8')]
#print x[u"成交金额"] #建议使用加u,或者import future,兼容python3

####output:

Index([u'序号', u'成交金额'], dtype='object')
0 11,053.00
1 43,935.40
2 467,327.83
3 32,811.07
4 17,651.10
5 4,629.80

=======================================================

Windows对于读取中文文本,可以使用读取后decode('gbk'),即解码成unicode

open(u'C:\\Users\\Administrator\\Desktop\\222.txt' ).read().decode('gbk')

写的时候就需要,用encode('gbk')把unicode编码成字节流再写入

ttt = u'看了看打扮卡了号地块编码,vas'with open(ur'c:\Users\Administrator\Desktop\222222.txt', 'w') as f:f.write(ttt.encode('gbk'))

推荐使用codecs 模块,codecs.open()  带encoding参数,直接搞定

with codecs.open(ur'c:\Users\Administrator\Desktop\2222.txt', 'w', encoding='gbk') as f:f.write(ttt)

转载于:https://www.cnblogs.com/willowj/p/6421891.html

pandas(python2) 读取中文数据,处理中文列名相关推荐

  1. java json utf-8_java读取json数据发生中文乱码的解决方法

    java读取json数据发生中文乱码的解决方法 发布时间:2020-06-21 15:58:48 来源:亿速云 阅读:268 作者:鸽子 java读取json数据出现乱码的代码://从json文件中读 ...

  2. python读取表格数据_Python读取Excel数据并根据列名取值

    一直想将自己接触到的东西梳理一遍,可就是迈不出第一步,希望从这篇总结开始不要再做行动的矮人了. 最近测试过程中需要用到python读取excel用例数据,于是去了解和学习了下xlrd库,这里只记录使用 ...

  3. python读取excel某一列内容-Python读取Excel数据并根据列名取值

    一直想将自己接触到的东西梳理一遍,可就是迈不出第一步,希望从这篇总结开始不要再做行动的矮人了. 最近测试过程中需要用到python读取excel用例数据,于是去了解和学习了下xlrd库,这里只记录使用 ...

  4. pandas 之 to_csv 保存数据出现中文乱码问题及解决办法

    1.  使用scrapy框架爬取了一些汽车评价保存在csv文件中,但是直接打开时乱码了. 2. 使用pandas读取再使用to_csv()方法重新保存 import pandas as pdfile_ ...

  5. 使用pandas库读取数据

    概况 现尝试自己用pandas读取所需数据,记录步骤和错误 pandas库本身的安装可以在settings的python编译器里搜索安装包进行安装,也可以找镜像源在终端通过pip管理工具安装,因为已经 ...

  6. 数据分析(六)之pandas学习【Series创建、切片、索引和读取外部数据】

    数据分析学习线路图 为什么要学习pandas? 那么问题来了:numpy已经能够帮助我们处理数据,能够结合matplotlib解决我们数据分析的问题,那么pandas学习的目的在什么地方呢? nump ...

  7. MYSQL三:数据操作(含中文数据错误问题)

    新增数据 两种方案: 方案1:给全表字段插入数据,不需要指定字段列表:要求数据的值出现的顺序必须与表中设计的字段出现的顺序一致:凡是非数值数据都需要使用引号(建议是单引号)包裹 insert into ...

  8. python调用什么函数实现对文件内容的读取_python读取文本文件数据

    本文要点刚要: (一)读文本文件格式的数据函数:read_csv,read_table 1.读不同分隔符的文本文件,用参数sep 2.读无字段名(表头)的文本文件 ,用参数names 3.为文本文件制 ...

  9. python取出hive_python 读取hive数据

    话不多说,直接上代码 from pyhive import hivedef pyhive(hql): conn = hive.Connection(host='HiveServer2 host', p ...

  10. php mysql 读取中文数据的函数_php读取mysql中文数据出现乱码的解决方法

    以下是对php读取mysql中文数据出现乱码问题的解决方法进行了介绍,需要的朋友可以过来参考下 1.PHP页面语言本身的编码类型不合适,这时候,你直接在脚本中写的中文肯定是乱码,不用说数据库了 解决方 ...

最新文章

  1. Apache优化配置——工作模式
  2. 用AjaxPro实现无刷新翻页效果及数据库分页技术介绍
  3. android屏幕关闭屏幕,如何在设备进入睡眠模式(屏幕关闭)时显示屏幕android?...
  4. 【深度学习】DL下的3D图像和Low-level Vision问题解析
  5. HttpClient超时重复提交问题
  6. leetcode182. 查找重复的电子邮箱(SQL)
  7. 5gh掌上云计算认证不通过_阿里云ACP认证考试攻略、考试心得、费用及常见问题...
  8. 容器编排技术 -- Kubernetes kubectl create secret tls 命令详解
  9. Google最热开源项目
  10. stopped状态的进程 top 命令_Linux 进程管理之四大名捕
  11. convertTO函数 简介
  12. OpenXML标签含义
  13. 正反转信号判别原理以及数字鉴相器原理
  14. 解决微信大字体下H5布局混乱
  15. 生物识别技术是什么,生物识别技术的比较介绍
  16. Java生成“年月日“+流水号
  17. 原装win10系统换win7系统需要改的参数
  18. 整流线性单元(Relu)及其变种(Leaky Relu、PRelu、ELU、SELU、CRelu、RRelu)
  19. Unexpected token u in JSON at position 0报错如何解决?
  20. ubuntu18.04交叉编译移植OpenCV4.70和QT5.12.12至ARM64位平台LKD3588(开发板为ubuntu22.04系统)(三)

热门文章

  1. 数字图像处理(七) 图像分割
  2. 算法与数据结构(二)-数组、链表(Array、Linked List)
  3. 我把朋友圈关掉了235天
  4. 卷积的物理意义是什么?
  5. form表单的get和post传值问题
  6. Oh-My-Zsh 下远程ssh的乱码问题
  7. 【mysql】【windows】MySQL 服务无法启动,服务没有报告任何错误,请键入 NET HELPMSG 3534 以获得更多的帮助。...
  8. 关于惠普hp服务器开机时F10菜单变成F10 Function Disabled的解决方法
  9. Android使用scrollview截取整个的屏幕并分享微信
  10. pptp,l2tp获取登录用户信息用pppd参数即可