python骨灰技巧_Pandas技巧,某骨灰级Pythoner经验总结,呕心沥血!
原标题:Pandas技巧,某骨灰级Pythoner经验总结,呕心沥血!
Python已迅速发展为数据科学家必备的编程语言。
python作为一种编程语言提供了更加优秀、宽阔的生体系统与深度的科学计算库。
在科学计算库中,Pandas对数据科学最为有效。Pandas、Scikit-learn几乎供给了数据科学家所有工具。本文旨在分享Python中数据处理的方法。别的,还会分享一些让你工作可以变得更便捷的技巧。
在学习前,提醒一下,如果你有过阅读Python数据挖掘(data exploration)的代码。有利于大家更好的理解文章内容。为了更好地理解,我使用了一个数据集来执行这些数据操作和处理。
数据集:我使用了贷款预测(Loan Prediction)问题的数据集。请先下载数据集,然后就可以开始了。
第一步
导入模块、加载数据集、搭建Python环境:
布尔索引
假如说,想由另一列的条件来筛选某一列的值,我们要怎么做?比如,我们想获取一份完整的没有毕业并获得贷款的女性名单。能够利用布尔索引实现。
Python代码:
Apply函数
Apply是一个我们经常会使用到的函数,作用是创建新变量、处理数据。当我们在利用某些函数传递一个数据帧的每一行或列的时候,Apply函数会返回相应的值。不管这个函数是系统自带的,还是用户定义的。
例如,它可以作用于找到任一列、行的缺失值。
利用这个,得到了我们想要的结果。
注:因为结果中包含很多行,所以第二个输出中使用了head()函数。
填补缺失值
‘fillna()’只要一次就能够解决:以整列的平均数、众数、中位数来替换缺失值。基于其各自的众数填补出“性别”、“婚姻”、“自由职业”列的缺失值。
第一步:导入函数来判断众数
成效前往众数和其出现频次。请注意,众数可所以一个数组,由于高频的值可能有多个。我们通常默认使用第一个:
结果返回众数与它出现的频率。众数也可以是一个数组,因为高频的值存在有多个的可能性。那么我们通常默认使用第一个:
now,我们可以填补缺失值并用Apply函数里提到的方法来检验,填补缺失值并再次检查缺失值,是否已经确认。
透视表
Pandas能够用来创建MS Excel风格的透视表。比如说,在本例中一个关键列是“贷款数额”有缺失值,能够根据“性别”,“婚姻状况”和“自由职业”分组后的平均金额来进行替换。 那么“贷款数额”的各组均值怎么确定呢?
多索引
如果你看到了“填补缺失值”的输出结果,它有一个特殊的特征。每一个索引都是由3个值组合构成的。这个就是多索引。可以帮我们快速执交运算。
从“填补缺失值”的例子中开始,我们有每个组的均值,但还没有被填补。
这可以使用到如今为止学习到的各类技巧来处理,只在缺失贷款值的行中来迭代并再次检验确认。
关键:
1. 多索引必须在loc里讲明的定义分组的索引元组。此元组能够在函数中利用到。
2. values[0]这个后缀是必须的,默认情况下元素返回的索引和原数据框的索引不匹配,直接赋值会报错。
交叉表
这个函数作用于获取数据的一个第一“感受”(视图)。在这里,可以验证一些基本设想。比如说,在这个例子中,“信用记录”被认为是最明显影响贷款状况。这可以使用交叉表验证,如下图所示:
这些数据都是取的绝对值,用百分比更直观。可以利用apply 函数实现:
说到了Pandas的不同函数,一些能够让我们在探索Python数据和功能设计上更加舒适的函数。而且,我们定义了一些通用函数,可以循环利用,在不同的数据集上达到差不多的结果。
喜欢的话关注收藏评论转发比心么么哒!Python学习交流企-鹅-裙-588+090+942,裙内有大量的项目开发和新手教学视频PDF书籍的千人大群等着你来加入返回搜狐,查看更多
责任编辑:
python骨灰技巧_Pandas技巧,某骨灰级Pythoner经验总结,呕心沥血!相关推荐
- python骨灰教学_10招!看骨灰级Pythoner玩转Python的方法
10招!看骨灰级Pythoner玩转Python的方法 来源:中文源码网 浏览: 次 日期:2019年11月5日 [下载文档: 10招!看骨灰级Pythoner玩转Python的方法.t ...
- python中df head_10招!看骨灰级Pythoner如何玩转Python
原标题:10招!看骨灰级Pythoner如何玩转Python pandas是基于numpy构建的,使数据分析工作变得更快更简单的高级数据结构和操作工具.本文为大家带来10个玩转Python的小技巧,学 ...
- Python中相见恨晚的技巧(记得收藏)
话不多说,直接开干,攒了很久! 1. 交换变量值 这个应该比较简单,但是日常用很容易忽略. a, b = 5``, 10 print``(a, b) /``/``5``, 10 a, b = b, a ...
- Python的一些小技巧小知识
Chapter 12. HOW-TO 本章内容记录Python的一些小技巧小知识.来源是网上摘录或自己学习所得. 如何判断操作系统类型 import sys print sys.platform pr ...
- 2021-01-20 Python编程特殊小技巧汇集
Python编程特殊小技巧汇集 Python作为一种高级编辑语言,有很多使用的小技巧,分享一期. 1.变量值互换 a = 0b = 1a,b = b, a 2.连续赋值 a, b = 2, 1 3.自 ...
- Python编程语言学习:for循环中常用方法经验技巧(利用enumerate函数对列表实现自带索引等)之详细攻略
Python编程语言学习:for循环中常用方法经验技巧(利用enumerate函数对列表实现自带索引等)之详细攻略 目录 for循环中常用方法经验技巧 1.利用enumerate函数对列表实现for循 ...
- Excel:python结合Excel使用技巧经验总结之(将python输出的等间隔列数据直接粘贴复制存到物理表格内等)图文教程之详细攻略
Excel:python结合Excel使用技巧经验总结之(将python输出的等间隔列数据直接粘贴复制存到物理表格内等)图文教程之详细攻略 目录 Excel使用技巧经验总结 将pandas.DataF ...
- python进阶17炫技巧
原创博客链接:python进阶17炫技巧 原则:可读性第一(效率固然重要,除非非常明显的效率差异,否则可读性优先) 学习炫技巧,更多为了读懂他人代码,自己开发过程中,相似代码量(可读性),建议使用通俗 ...
- python代码性能优化技巧
python代码性能优化技巧 代码优化能够让程序运行更快,可以提高程序的执行效率等,对于一名软件开发人员来说,如何优化代码,从哪里入手进行优化?这些都是他们十分关心的问题.本文着重讲了如何优化Pyth ...
最新文章
- python 中的下划线
- 怎么通过ip连接oracle,Oracle 无法通过IP连接问题
- 上海将打造“泛在化、融合化、智敏化”智慧城市
- python写web难受-用Python编写web API的教程
- C#面向对象9 字符串
- php is_null(,PHP empty() isset() is_null() 区别与性能比较
- LeetCode 1953. 你可以工作的最大周数
- (大整数类Biginteger)大斐波数
- mac合上盖子不锁屏_macbook合上盖子不断网的设置
- redis单机单实例一键安装脚本
- python线程池和多线程
- 学生网页设计作业源码 HTML+CSS 网上书店网站设计与实现
- js 获取屏幕高宽_Js获取屏幕宽度、高度
- Windows 平台下 LiteIDE 的安装和使用
- 极客时间java高级(第二次课程)
- 【基础知识】9、加州房价预测
- MarkMan – 马克鳗 IU好伙伴啊
- matplotlib入门基础(五)轴坐标范围 轴刻度比例 轴刻度
- foreign key() references 字段名(字段名)详细用法
- zynq7000 从github拉取linux源码进行编译,运行. 快速进行外设验证。全流程教程
热门文章
- 对于不是特别擅长Photoshop的人来说,熟悉和运用Photoshop工具提供的各类便捷的快捷键,是有帮助的。...
- Oracle中临时表的深入研究
- 数据结构与算法——搜索
- 【剑指offer】面试题53 - 1:在排序数组中查找数字 I(java)
- Leetcode--172. 阶乘后的零
- php根据分类生成网址,PHP实现无限极分类生成分类树的方法
- 计算机应用基础王秀娟,计算机应用基础课教学内容设计分析.doc
- char怎么比较_为什么阿里巴巴Java开发手册中强制要求整型包装类对象值用 equals 方法比较?...
- 英语计算机房和操场怎么读,计算机房对我们学习帮助很大. the , in studies , computer , room , helps , lot , a , our , us...
- 如何获取投票提交地址_简单实用 | 2019全国医院擂台赛投票攻略(县域版)