Python使用pandas读取Excel文件数据和预处理小案例
假设有Excel文件data.xlsx,其中内容为
现在需要将这个Excel文件中的数据读入pandas,并且在后续的处理中不关心ID列,还需要把sex列的female替换为1,把sex列的male替换为0。本文演示有关的几个操作。
(1)导入pandas模块
>>> import pandas as pd
(2)把Excel文件中的数据读入pandas
>>> df = pd.read_excel('data.xlsx')
>>> df
ID age height sex weight
张三 1 39 181 female 85
李四 2 40 180 male 80
王五 3 38 178 female 78
赵六 4 59 170 male 66
(3)删除ID列
可以得到新的DataFrame:
>>> df.drop('ID', axis=1)
age height sex weight
张三 39 181 female 85
李四 40 180 male 80
王五 38 178 female 78
赵六 59 170 male 66
也可以直接在原DataFrame上原地删除:
>>> df.drop('ID', axis=1, inplace=True)
>>> df
age height sex weight
张三 39 181 female 85
李四 40 180 male 80
王五 38 178 female 78
赵六 59 170 male 66
(4)替换sex列
方法一:使用replace()方法替换sex列,得到新的DataFrame,如果指定参数inplace=True,则可以原地替换。
>>> df.replace({'female':1, 'male':0})
age height sex weight
张三 39 181 1 85
李四 40 180 0 80
王五 38 178 1 78
赵六 59 170 0 66
方法二:使用map()方法+lambda表达式,原地替换。
>>> df1 = df[:]
>>> df1['sex'] = df1['sex'].map(lambda x:1 if x=='female' else 0)
>>> df1
age height sex weight
张三 39 181 1 85
李四 40 180 0 80
王五 38 178 1 78
赵六 59 170 0 66
方法三:使用map()方法+字典,原地替换。
>>> df1 = df[:]
>>> df1['sex'] = df1['sex'].map({'female':1, 'male':0})
>>> df1
age height sex weight
张三 39 181 1 85
李四 40 180 0 80
王五 38 178 1 78
赵六 59 170 0 66
方法四:使用loc类,原地替换。
>>> df1 = df[:]
>>> df1.loc[df['sex']=='female', 'sex'] = 1
>>> df1.loc[df['sex']=='male', 'sex'] = 0
>>> df1
age height sex weight
张三 39 181 1 85
李四 40 180 0 80
王五 38 178 1 78
赵六 59 170 0 66
---------相关阅读------------
明天火车回老家帮忙掰玉米,顺便陪老人过个中秋节,老家没有网络,预计3天不更新,大家可以阅读下面的有关文章,或者进入公众号菜单“最新资源”==>“历史文章分类速查表”文章。提前祝朋友们中秋节快乐!
使用Python内置集合对象和内置函数filter()过滤无效书评
Python数据分析扩展库pandas的DataFrame排序方法小结
Pandas创建DataFrame对象的几种常用方法
Python基于用户协同过滤算法的电影推荐代码demo
Python+pandas读取Excel文件并统计演员参演电影数量
Python统计共同参演电影最多的演员组合
Python读取Excel文件统计演员参演电影
----------喜大普奔----------
1、继《Python程序设计基础》(2017年9月第5次印刷)、《Python程序设计(第2版)》(2017年9月第4次印刷)、《Python可以这样学》(2017年7月第3次印刷)系列图书之后,董付国老师新书《Python程序设计开发宝典》已于2017年8月1日在清华大学出版社出版,并于2017年9月进行了第2次印刷。为庆祝新书《Python程序设计开发宝典》全面上架,清华大学出版社联合“赣江图书专营”淘宝店推出特价优惠活动,《Python程序设计开发宝典》原价69元,新书上架期间超低价39.8元,可以复制下面的链接使用浏览器打开查看图书详情和购买:
https://detail.tmall.com/item.htm?spm=a1z10.3-b-s.w4011-14464369246.84.46f16db0roWfX4&id=557107249812&rn=339cbc9df2bac424664103917dedfbd2&abbucket=8&tbpm=3
2、10月13日——15日,重庆,全国高校程序设计系列课程高级研究班,详见:全国高校程序设计系列课程高级研修班(Python)通知
Python使用pandas读取Excel文件数据和预处理小案例相关推荐
- python用pandas读取excel_Python使用pandas读取Excel文件数据和预处理小案例
假设有Excel文件data.xlsx,其中内容为 现在需要将这个Excel文件中的数据读入pandas,并且在后续的处理中不关心ID列,还需要把sex列的female替换为1,把sex列的male替 ...
- 利用pandas读取Excel文件数据
说明 pandas能帮助我们在Python 代码中直接读取Excel 文件数据. 但只有pandas是不行的,会报错: ImportError: Missing optional dependency ...
- Python使用pandas读取Excel文件多个WorkSheet的数据并绘制柱状图和热力图
问题描述:在当前文件夹中有一个存放同一门课程两个班级同学成绩的Excel文件"学生成绩.xlsx",每个工作表中存放一个班级的成绩.编写程序,使用pandas读取其中的数据,然后绘 ...
- Python+Pandas读取Excel文件分析关系最好的两个演员
董老师又双叒叕送书啦,6本<Python程序设计基础与应用(第2版)> 推荐图书: <Python程序设计(第3版)>,(ISBN:978-7-302-55083-9),董付国 ...
- Python+pandas读取Excel文件统计最受欢迎的前3位演员
推荐教材:<Python程序设计基础与应用>(ISBN:9787111606178),董付国,机械工业出版社,2018.8出版,2021.3第11次印刷 图书详情: 配套资源: 用书教师可 ...
- python pandas读取excel文件
python pandas读取excel文件 data=pd.read_excel('C:\Users\86188\python\dummy.xlsx') 会报错:SyntaxError: (unic ...
- pandas 读取excel文件
pandas 读取excel文件 一 read_excel() 的基本用法 二 read_excel() 的常用的参数: 三 示例 1. IO:路径 2. sheet_name:指定工作表名 3. h ...
- Python3使用pandas读取excel文件并用列表输出
Python3使用pandas读取excel文件并用列表输出 # !user/bin/env python3.9 # -*- utf-8 -*- # Author 郑浩import numpy as ...
- Python: 用xlrd读取Excel文件(*.xlsx) 实践才是检验真理的唯一标准!!!
Python: 用xlrd读取Excel文件(*.xlsx) 网上有不少例子但是不知道都检验没,我就新测遇到这个问题 import os import xlrd, sys# # todo 打开excl ...
最新文章
- EcologyEvolution|微生物功能多样性从概念到应用
- android 获取 service 信息
- 开发日记-20190914 关键词 汇编语言王爽版 第三章
- 【Linux】一步一步学Linux——usernetctl命令(175)
- android 设置点击ProgressDialog外的区域不消失
- alexnet 结构_AlexNet的体系结构和实现
- ComboBox 强制转换为大写的方法
- leetcode 115. 不同的子序列(dp)
- [网络]------TCP UDP HTTP Socket 区别
- Java笔记-使用jjwt生成jwt
- 后台定时统计任务太耗时如何优化一下
- 【电脑帮助】解决Wind10系统修改电脑默认用户名Administrator的问题
- Project Euler Problem 27 Quadratic primes
- tensorflow学习笔记(2)张量与计算图
- Java-JVM第一篇认识JVM
- 计算机精品学习资料大放送
- 一句一句的读ArrayList源码(代码基于JDK11)
- UltraISO 9.7.0.3476中文完美破解安装版
- 空间点到直线的距离c语言,空间两直线间距离公式(文档篇).doc
- php微信转发无法显示标题图片,完美解决:微信分享为什么不显示图片呢? - 老牛博客...
热门文章
- 斗拱展开面积表_144996_河南省仿古建筑工程计价综合单价2009
- java中解释命令_闲来无事可来了解下Java中Javadoc命令的用法
- mysql中触发器中分隔符_php – 在触发器中使用分隔符的Mysql错误
- python手机自动化框架_python自动化框架(一)
- FusionCharts破解版导出图片步骤
- android sudio提示快捷键冲突解决
- centos7 yum安装mysql5_Centos7 yum安装mysql5.7
- 535 Login Fail. Please enter your authorization code to login. More information in http://service.ma
- 剑指Offer的学习笔记(C#篇)-- 用两个栈实现队列
- python接口测试之新手篇