原标题:Pandas技巧,某骨灰级Pythoner经验总结,呕心沥血!

Python已迅速发展为数据科学家必备的编程语言。

python作为一种编程语言提供了更加优秀、宽阔的生体系统与深度的科学计算库。

在科学计算库中,Pandas对数据科学最为有效。Pandas、Scikit-learn几乎供给了数据科学家所有工具。本文旨在分享Python中数据处理的方法。别的,还会分享一些让你工作可以变得更便捷的技巧。

在学习前,提醒一下,如果你有过阅读Python数据挖掘(data exploration)的代码。有利于大家更好的理解文章内容。为了更好地理解,我使用了一个数据集来执行这些数据操作和处理。

数据集:我使用了贷款预测(Loan Prediction)问题的数据集。请先下载数据集,然后就可以开始了。

第一步

导入模块、加载数据集、搭建Python环境:

布尔索引

假如说,想由另一列的条件来筛选某一列的值,我们要怎么做?比如,我们想获取一份完整的没有毕业并获得贷款的女性名单。能够利用布尔索引实现。

Python代码:

Apply函数

Apply是一个我们经常会使用到的函数,作用是创建新变量、处理数据。当我们在利用某些函数传递一个数据帧的每一行或列的时候,Apply函数会返回相应的值。不管这个函数是系统自带的,还是用户定义的。

例如,它可以作用于找到任一列、行的缺失值。

利用这个,得到了我们想要的结果。

注:因为结果中包含很多行,所以第二个输出中使用了head()函数。

填补缺失值

‘fillna()’只要一次就能够解决:以整列的平均数、众数、中位数来替换缺失值。基于其各自的众数填补出“性别”、“婚姻”、“自由职业”列的缺失值。

第一步:导入函数来判断众数

成效前往众数和其出现频次。请注意,众数可所以一个数组,由于高频的值可能有多个。我们通常默认使用第一个:

结果返回众数与它出现的频率。众数也可以是一个数组,因为高频的值存在有多个的可能性。那么我们通常默认使用第一个:

now,我们可以填补缺失值并用Apply函数里提到的方法来检验,填补缺失值并再次检查缺失值,是否已经确认。

透视表

Pandas能够用来创建MS Excel风格的透视表。比如说,在本例中一个关键列是“贷款数额”有缺失值,能够根据“性别”,“婚姻状况”和“自由职业”分组后的平均金额来进行替换。 那么“贷款数额”的各组均值怎么确定呢?

多索引

如果你看到了“填补缺失值”的输出结果,它有一个特殊的特征。每一个索引都是由3个值组合构成的。这个就是多索引。可以帮我们快速执交运算。

从“填补缺失值”的例子中开始,我们有每个组的均值,但还没有被填补。

这可以使用到如今为止学习到的各类技巧来处理,只在缺失贷款值的行中来迭代并再次检验确认。

关键:

1. 多索引必须在loc里讲明的定义分组的索引元组。此元组能够在函数中利用到。

2. values[0]这个后缀是必须的,默认情况下元素返回的索引和原数据框的索引不匹配,直接赋值会报错。

交叉表

这个函数作用于获取数据的一个第一“感受”(视图)。在这里,可以验证一些基本设想。比如说,在这个例子中,“信用记录”被认为是最明显影响贷款状况。这可以使用交叉表验证,如下图所示:

这些数据都是取的绝对值,用百分比更直观。可以利用apply 函数实现:

说到了Pandas的不同函数,一些能够让我们在探索Python数据和功能设计上更加舒适的函数。而且,我们定义了一些通用函数,可以循环利用,在不同的数据集上达到差不多的结果。

喜欢的话关注收藏评论转发比心么么哒!Python学习交流企-鹅-裙-588+090+942,裙内有大量的项目开发和新手教学视频PDF书籍的千人大群等着你来加入返回搜狐,查看更多

责任编辑:

python骨灰技巧_Pandas技巧,某骨灰级Pythoner经验总结,呕心沥血!相关推荐

  1. python骨灰教学_10招!看骨灰级Pythoner玩转Python的方法

    10招!看骨灰级Pythoner玩转Python的方法 来源:中文源码网    浏览: 次    日期:2019年11月5日 [下载文档:  10招!看骨灰级Pythoner玩转Python的方法.t ...

  2. python中df head_10招!看骨灰级Pythoner如何玩转Python

    原标题:10招!看骨灰级Pythoner如何玩转Python pandas是基于numpy构建的,使数据分析工作变得更快更简单的高级数据结构和操作工具.本文为大家带来10个玩转Python的小技巧,学 ...

  3. Python中相见恨晚的技巧(记得收藏)

    话不多说,直接开干,攒了很久! 1. 交换变量值 这个应该比较简单,但是日常用很容易忽略. a, b = 5``, 10 print``(a, b) /``/``5``, 10 a, b = b, a ...

  4. Python的一些小技巧小知识

    Chapter 12. HOW-TO 本章内容记录Python的一些小技巧小知识.来源是网上摘录或自己学习所得. 如何判断操作系统类型 import sys print sys.platform pr ...

  5. 2021-01-20 Python编程特殊小技巧汇集

    Python编程特殊小技巧汇集 Python作为一种高级编辑语言,有很多使用的小技巧,分享一期. 1.变量值互换 a = 0b = 1a,b = b, a 2.连续赋值 a, b = 2, 1 3.自 ...

  6. Python编程语言学习:for循环中常用方法经验技巧(利用enumerate函数对列表实现自带索引等)之详细攻略

    Python编程语言学习:for循环中常用方法经验技巧(利用enumerate函数对列表实现自带索引等)之详细攻略 目录 for循环中常用方法经验技巧 1.利用enumerate函数对列表实现for循 ...

  7. Excel:python结合Excel使用技巧经验总结之(将python输出的等间隔列数据直接粘贴复制存到物理表格内等)图文教程之详细攻略

    Excel:python结合Excel使用技巧经验总结之(将python输出的等间隔列数据直接粘贴复制存到物理表格内等)图文教程之详细攻略 目录 Excel使用技巧经验总结 将pandas.DataF ...

  8. python进阶17炫技巧

    原创博客链接:python进阶17炫技巧 原则:可读性第一(效率固然重要,除非非常明显的效率差异,否则可读性优先) 学习炫技巧,更多为了读懂他人代码,自己开发过程中,相似代码量(可读性),建议使用通俗 ...

  9. python代码性能优化技巧

    python代码性能优化技巧 代码优化能够让程序运行更快,可以提高程序的执行效率等,对于一名软件开发人员来说,如何优化代码,从哪里入手进行优化?这些都是他们十分关心的问题.本文着重讲了如何优化Pyth ...

最新文章

  1. python 中的下划线
  2. 怎么通过ip连接oracle,Oracle 无法通过IP连接问题
  3. 上海将打造“泛在化、融合化、智敏化”智慧城市
  4. python写web难受-用Python编写web API的教程
  5. C#面向对象9 字符串
  6. php is_null(,PHP empty() isset() is_null() 区别与性能比较
  7. LeetCode 1953. 你可以工作的最大周数
  8. (大整数类Biginteger)大斐波数
  9. mac合上盖子不锁屏_macbook合上盖子不断网的设置
  10. redis单机单实例一键安装脚本
  11. python线程池和多线程
  12. 学生网页设计作业源码 HTML+CSS 网上书店网站设计与实现
  13. js 获取屏幕高宽_Js获取屏幕宽度、高度
  14. Windows 平台下 LiteIDE 的安装和使用
  15. 极客时间java高级(第二次课程)
  16. 【基础知识】9、加州房价预测
  17. MarkMan – 马克鳗 IU好伙伴啊
  18. matplotlib入门基础(五)轴坐标范围 轴刻度比例 轴刻度
  19. foreign key() references 字段名(字段名)详细用法
  20. zynq7000 从github拉取linux源码进行编译,运行. 快速进行外设验证。全流程教程

热门文章

  1. 对于不是特别擅长Photoshop的人来说,熟悉和运用Photoshop工具提供的各类便捷的快捷键,是有帮助的。...
  2. Oracle中临时表的深入研究
  3. 数据结构与算法——搜索
  4. 【剑指offer】面试题53 - 1:在排序数组中查找数字 I(java)
  5. Leetcode--172. 阶乘后的零
  6. php根据分类生成网址,PHP实现无限极分类生成分类树的方法
  7. 计算机应用基础王秀娟,计算机应用基础课教学内容设计分析.doc
  8. char怎么比较_为什么阿里巴巴Java开发手册中强制要求整型包装类对象值用 equals 方法比较?...
  9. 英语计算机房和操场怎么读,计算机房对我们学习帮助很大. the , in studies , computer , room , helps , lot , a , our , us...
  10. 如何获取投票提交地址_简单实用 | 2019全国医院擂台赛投票攻略(县域版)