pandas(python2) 读取中文数据,处理中文列名
要点:
- python修改默认编码为utf-8;
- 在读取csv或者 xls文件时 写入参数encoding="gbk";如果 gbk也不能 decode,使用收录字符更广的‘’gb18030‘’解码。
- 使用中文列名时 decode('utf-8'), 或者 u'中文列名';一劳永逸> from __future__ import unicode_literals
- 使用codecs模块读取中文文本
# -*- coding: utf-8 -*- import sys reload(sys) sys.setdefaultencoding('utf8') import pandas as pd
path_1= 'brokerUserfeeList.xls'
x = pd.read_excel(path_, encoding="gbk") print x.columns print x["成交金额".decode('utf-8')]
#print x[u"成交金额"] #建议使用加u,或者import future,兼容python3
####output:
Index([u'序号', u'成交金额'], dtype='object')
0 11,053.00
1 43,935.40
2 467,327.83
3 32,811.07
4 17,651.10
5 4,629.80
=======================================================
Windows对于读取中文文本,可以使用读取后decode('gbk'),即解码成unicode
open(u'C:\\Users\\Administrator\\Desktop\\222.txt' ).read().decode('gbk')
写的时候就需要,用encode('gbk')把unicode编码成字节流再写入
ttt = u'看了看打扮卡了号地块编码,vas'with open(ur'c:\Users\Administrator\Desktop\222222.txt', 'w') as f:f.write(ttt.encode('gbk'))
推荐使用codecs 模块,codecs.open() 带encoding参数,直接搞定
with codecs.open(ur'c:\Users\Administrator\Desktop\2222.txt', 'w', encoding='gbk') as f:f.write(ttt)
转载于:https://www.cnblogs.com/willowj/p/6421891.html
pandas(python2) 读取中文数据,处理中文列名相关推荐
- java json utf-8_java读取json数据发生中文乱码的解决方法
java读取json数据发生中文乱码的解决方法 发布时间:2020-06-21 15:58:48 来源:亿速云 阅读:268 作者:鸽子 java读取json数据出现乱码的代码://从json文件中读 ...
- python读取表格数据_Python读取Excel数据并根据列名取值
一直想将自己接触到的东西梳理一遍,可就是迈不出第一步,希望从这篇总结开始不要再做行动的矮人了. 最近测试过程中需要用到python读取excel用例数据,于是去了解和学习了下xlrd库,这里只记录使用 ...
- python读取excel某一列内容-Python读取Excel数据并根据列名取值
一直想将自己接触到的东西梳理一遍,可就是迈不出第一步,希望从这篇总结开始不要再做行动的矮人了. 最近测试过程中需要用到python读取excel用例数据,于是去了解和学习了下xlrd库,这里只记录使用 ...
- pandas 之 to_csv 保存数据出现中文乱码问题及解决办法
1. 使用scrapy框架爬取了一些汽车评价保存在csv文件中,但是直接打开时乱码了. 2. 使用pandas读取再使用to_csv()方法重新保存 import pandas as pdfile_ ...
- 使用pandas库读取数据
概况 现尝试自己用pandas读取所需数据,记录步骤和错误 pandas库本身的安装可以在settings的python编译器里搜索安装包进行安装,也可以找镜像源在终端通过pip管理工具安装,因为已经 ...
- 数据分析(六)之pandas学习【Series创建、切片、索引和读取外部数据】
数据分析学习线路图 为什么要学习pandas? 那么问题来了:numpy已经能够帮助我们处理数据,能够结合matplotlib解决我们数据分析的问题,那么pandas学习的目的在什么地方呢? nump ...
- MYSQL三:数据操作(含中文数据错误问题)
新增数据 两种方案: 方案1:给全表字段插入数据,不需要指定字段列表:要求数据的值出现的顺序必须与表中设计的字段出现的顺序一致:凡是非数值数据都需要使用引号(建议是单引号)包裹 insert into ...
- python调用什么函数实现对文件内容的读取_python读取文本文件数据
本文要点刚要: (一)读文本文件格式的数据函数:read_csv,read_table 1.读不同分隔符的文本文件,用参数sep 2.读无字段名(表头)的文本文件 ,用参数names 3.为文本文件制 ...
- python取出hive_python 读取hive数据
话不多说,直接上代码 from pyhive import hivedef pyhive(hql): conn = hive.Connection(host='HiveServer2 host', p ...
- php mysql 读取中文数据的函数_php读取mysql中文数据出现乱码的解决方法
以下是对php读取mysql中文数据出现乱码问题的解决方法进行了介绍,需要的朋友可以过来参考下 1.PHP页面语言本身的编码类型不合适,这时候,你直接在脚本中写的中文肯定是乱码,不用说数据库了 解决方 ...
最新文章
- Apache优化配置——工作模式
- 用AjaxPro实现无刷新翻页效果及数据库分页技术介绍
- android屏幕关闭屏幕,如何在设备进入睡眠模式(屏幕关闭)时显示屏幕android?...
- 【深度学习】DL下的3D图像和Low-level Vision问题解析
- HttpClient超时重复提交问题
- leetcode182. 查找重复的电子邮箱(SQL)
- 5gh掌上云计算认证不通过_阿里云ACP认证考试攻略、考试心得、费用及常见问题...
- 容器编排技术 -- Kubernetes kubectl create secret tls 命令详解
- Google最热开源项目
- stopped状态的进程 top 命令_Linux 进程管理之四大名捕
- convertTO函数 简介
- OpenXML标签含义
- 正反转信号判别原理以及数字鉴相器原理
- 解决微信大字体下H5布局混乱
- 生物识别技术是什么,生物识别技术的比较介绍
- Java生成“年月日“+流水号
- 原装win10系统换win7系统需要改的参数
- 整流线性单元(Relu)及其变种(Leaky Relu、PRelu、ELU、SELU、CRelu、RRelu)
- Unexpected token u in JSON at position 0报错如何解决?
- ubuntu18.04交叉编译移植OpenCV4.70和QT5.12.12至ARM64位平台LKD3588(开发板为ubuntu22.04系统)(三)
热门文章
- 数字图像处理(七) 图像分割
- 算法与数据结构(二)-数组、链表(Array、Linked List)
- 我把朋友圈关掉了235天
- 卷积的物理意义是什么?
- form表单的get和post传值问题
- Oh-My-Zsh 下远程ssh的乱码问题
- 【mysql】【windows】MySQL 服务无法启动,服务没有报告任何错误,请键入 NET HELPMSG 3534 以获得更多的帮助。...
- 关于惠普hp服务器开机时F10菜单变成F10 Function Disabled的解决方法
- Android使用scrollview截取整个的屏幕并分享微信
- pptp,l2tp获取登录用户信息用pppd参数即可