点击蓝色文字

关注我们

奉献更多优质内容

在数据分析的过程中,相信大家用的最多的就是Pandas库,无论是统计分析还是可视化等等,Pandas都给我们提供了诸多便利。今天小编就来和大家说说在Pandas库中那些不为人所熟知但是却十分好用的函数,希望大家看了之后也能够受益匪浅

01

PART

idxmax()和idxmin()

从函数名称中我们就能直观的理解这几个函数的作用--返回最大值或者是最小值的索引,这里我们用到的数据集是“泰坦尼克号”乘客信息的数据集(是的,就是那个家喻户晓的kaggle入门级别的项目的数据集),假设我们要找到年龄最小或者最大的乘客的姓名,我们可以这么做,

但是酱紫稍显繁琐,要是我们运用上述提到的函数就可以,

输出的结果都是一致,但是显得更加的简洁与高效

02

PART

cut()

简而言之,cut()函数能够将数值划分成等额的数份,比如还是“泰坦尼克号”数据集中有代表乘客年龄的数据,我们将乘客的年龄等额的划分成5份,

第一位乘客的年龄在16与32岁之间,第二位乘客的年龄则在32到48岁之间等等。或者你想用数字来代替图中的区间,则可以用

03

PART

nsmallest和nlargest

从函数名中,我们就能轻松的领悟到函数的作用了,比方说我们想找到在泰坦尼克号乘船中,年龄最大的3位乘客的姓名是什么,我们则可以

04

PART

pivot_table

也许大多数人都有在Excel中使用数据透视表的经历,其实Pandas也提供了类似的功能,名为pivot_table,比方说我们想查找出数据集当中,三等舱男性的平均生存率,我们可以通过层层筛选来得出结论,

但假如我们想查找船舱中不同性别不同等级的客舱的平均生还率时,pivot_table就是一个非常好的工具,我们可以将性别设置成为索引,每一列代表客舱的等级,计算的方式则是采用取平均,也就是mean,如下图所示,

在Pandas库当中能够帮我们显著提效的函数还有很多,但是数据分析说到底也只是一种工具,来帮助我们发现与分析问题,但是要落实到解决问题,靠的依然是对业务的理解与思考。所以很多时候,做一个深度思考者比使用工具来的更加的重要,五一快乐!

往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习在线手册AI基础下载(pdf更新到25集)本站qq群1003271085,加入微信群请回复“加群”获取一折本站知识星球优惠券,复制链接直接打开:https://t.zsxq.com/yFQV7am喜欢文章,点个在看

四个好用却可能不为人所熟知的Pandas函数,建议收藏!!!相关推荐

  1. “约见”面试官系列之常见面试题第四十三篇之页面输入url之后发生了什么?(建议收藏)

    本文主旨:帮助自己理清页面输入url地址之后的一个整体流程 首先,用户第一次向服务器发送对应url地址请求,此时,客户端没有缓存 1.用户输入url通过DNS解析为对应的IP地址. 2.应用层:HTT ...

  2. 2021年大数据HBase(四):HBase的相关操作-客户端命令式!【建议收藏】

    全网最详细的大数据HBase文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 前言 HBase的相关操作-客户端命令式 1.进入HBase ...

  3. 【考研英语5500词】 —思维导图,建议收藏(四六级党也可入手)!!!

    [考研英语5500词] -思维导图,建议收藏(四六级党也可入手)!!! 考研英语5500词总共36个单元, 思维导图是根据母词编写的, 母词记忆 事半功倍 ,记住一个词就能搞定一群词,弄清词汇之间的逻 ...

  4. 服务器存储满了进不去系统,解决PC常见问题 篇四十五:建议收藏!手贱升级进不去系统?两步简单恢复黑群晖!...

    解决PC常见问题 篇四十五:建议收藏!手贱升级进不去系统?两步简单恢复黑群晖! 2021-07-19 16:40:32 47点赞 302收藏 15评论 创作立场声明:本文属于原创文章,无任何利益关系, ...

  5. Mysql窗口函数 (知识点梳理+题目解析+面试实战)(四万字长文,一文读懂,建议收藏后食用)

    前言: 本文章是原创50篇时开启的纪念作,之前的文章基本5000字,而本篇约4.5万字,真一篇顶九篇. 窗口函数作为Mysql 8的新特性以及面试笔试的重点,掌握并且进行来练习是非常有必要的.本文章详 ...

  6. 【C++ 基础篇:21】:friend 友元四连问:什么是友元?友元类?友元函数?什么时候用友元?

    本系列 C++ 相关文章 仅为笔者学习笔记记录,用自己的理解记录学习!C++ 学习系列将分为三个阶段:基础篇.STL 篇.高阶数据结构与算法篇,相关重点内容如下: 基础篇:类与对象(涉及C++的三大特 ...

  7. TCP是什么?为什么要三次握手四次挥手? (本文近9千字,建议收藏)

    编者前言: 本文近9千文字,预计阅读时间15分钟,文章内容整理于网络,仅供分享,更多好文请关注公众号:一航代码 公众号阅读链接:TCP是什么?为什么要三次握手四次挥手? (本文近9千字,建议收藏) 一 ...

  8. Mysql进阶优化篇01——四万字详解数据库性能分析工具(深入、全面、详细,收藏备用)

    前 言 ?? 作者简介:,长跑型选手,立志坚持写10年博客,专注于java后端 ?? 专栏简介:mysql进阶,主要讲解mysql数据库进阶知识,包括索引.数据库调优.分库分表等 ?? 文章简介:本文 ...

  9. mysql longtext可以存储多少文字_MySQL 四万字精华总结 + 面试100 问,和面试官扯皮绰绰有余(收藏系列)

    作者:派大新 链接:https://juejin.im/post/5f0d4fadf265da22f3250eaa 写在之前:不建议那种上来就是各种面试题罗列,然后背书式的去记忆,对技术的提升帮助很小 ...

最新文章

  1. JAVA数据结构 线性表的链式存储及其实现
  2. linux上logbok实时日志_日志lombok插件安装及配置
  3. python3 如何让字典保持有序
  4. 520 钻石争霸赛 题解
  5. ASP.NET Core MVC 之区域(Area)
  6. Cookie案例-显示用户的上次访问时间代码实现
  7. JS-function-BOM(window,history,location,navigator,screen)
  8. UITableView优化之按需加载
  9. 根据error_log发现图片木马,被上传到图片文件夹
  10. Win11系统虽香但不是想升就能升?这三款精品win11升级检测工具告诉您的爱机是否达标!!!
  11. ResNet网络结构详解(Tensorflow2.6.0实现网络结构)
  12. 中控H10考勤机管理员密码破解
  13. c语言召唤窗口,如何设计出高点击率的行为召唤按钮?
  14. input隐藏边框和选中样式
  15. python参数估计(一个总体均值)
  16. 合成游戏中的数学原理
  17. Python做一个Kindle电子书下载助手,真香!
  18. 【leetcode】字符串(KMP、滑动窗口)
  19. 【转】纯JS省市区三级联动(行政区划代码更新至2015-9-30)
  20. 现场工程师出手-PCAPHub与云SSH隧道稳妥实现异地LAN IIoT联测

热门文章

  1. Windows访问Ubuntu8.10分区
  2. DataTable某一列的值转化成集合
  3. 全选checkbox只能执行一次的问题
  4. Spotlight监控工具使用
  5. tiptop 编译运行_tiptop客制规范总结
  6. 机器人学习--室内定位方法综述
  7. ISE 14.7安装教程
  8. HashSet和HashMap的区别
  9. Matlab | Matlab从入门到放弃(3)——函数与画图
  10. LeetCode每日训练1——爬楼梯问题(2020.7.1)