Peter Nistrup | 作者夏夜 | 译者lnfoQ | 来源


Pandas 是 Python 中处理数据的首选库,它使用起来很容易,非常灵活,能够处理不同类型和大小的数据,而且它有大量的函数,这让操作数据简直是小菜一碟。

在30 秒内,完成你全部的标准数据分析,这就是用pandas进行数据分析产生的“奇迹”。

1

Pandas 基础之旅

用 Python 处理过数据的人大概对 pandas 不陌生。

如果想处理行或列排序的格式化数据,大多数情况下,你可以使用 pandas 处理。如果没安装 pandas,可以用你喜欢的命令终端安装,一定要用 pip 命令:

pip install pandas

现在,让我们看看默认的 pandas 实现都可以做什么:

非常简洁,但也很平淡无奇,“method”这列去哪儿?

我们解释一下上面代码和输出的含义:

Pandas 的任何“数据帧”都有一个 describe() 方法,这个方法会返回上面的输出。但请注意,这个方法的以上输出数据中,关于类别的变量漏掉了。在上面的例子中,输出信息里,“method”这一列被完全移除。

让我们看看是否能做得更好。

2

Pandas 剖析

如果我告诉你,我仅用 3 行 Python 代码即可生成以下统计数据,你会感觉如何(如果不算 imports 语句的话,实际上只需要 1 行代码即可):

  • 核心信息:类型、唯一值、缺失值

  • 分位数统计:如最小值、Q1、中位数、Q3、最大值、范围、四分位数范围等

  • 描述性统计:如平均值、众数、标准差、求和、中位数绝对偏差、扰动系数、峰度、偏度等

  • 高频使用的数值

  • 直方图

  • 相关性:会突出显示高相关度变量、Spearman、Pearson 和 Kendall 矩阵

  • 缺失值:矩阵、计数、热力图和缺失值树状图

(以上特征列表直接摘自 Pandas Profiling GitHub 页面)

使用 Pandas Profiling 包,我们仅用 1 行代码就可以得到以上数据!在命令行终端只需使用 pip 即可安装 Pandas Profiling 包:

pip install pandas_profiling

乍一看,经验丰富的数据分析师可能会嘲笑这是华而不实的,但是,它可以帮助你快速获得你拥有的数据概况:

看到了吗,正如我所说,1 行代码搞定!

你看到的第一部分内容是“概览”(请看上图),这部分内容会呈现给你一些非常高级的数据和变量统计,以及像变量高相关性和高偏态性等这类警告。

但是它提供的信息远远不止这些。往下滑动,我们会发现这份输出报告包含多个部分。仅用图片显示这个 1 行代码的输出都是不大合适的,所以我制作了一张 GIF 图:

我强烈建议你自己来探索这个软件包里的特色——毕竟,这只有 1 行代码,而且你会在以后的数据分析中发现这个软件包真的很好用。

import pandas as pdimport pandas_profilingpd.read_csv('https://raw.githubusercontent.com/mwaskom/seaborn-data/master/planets.csv').profile_report()

END -

本文为转载分享&推荐阅读,若侵权请联系后台删除

爱数据·8月数据职场专题直播

直播主题:数据分析面试·如何应对业务问题?

内容剧透:

  • 数据分析师业务问题分类

  • 常见业务面问题都有哪些?

  • 回答业务面的要点以及策略

  • 题目1:网站销售额下降专题分析

  • 题目2:用户流失专题分析

直播时间:8月6日 本周四20:30

点击下方立即预约本次直播!

pandas显示全部数据内容_1行Python代码就能挖掘数据!这个库太神奇啦!相关推荐

  1. 130行Python代码模仿“蚂蚁呀嘿”特效,太魔性了!

    130行Python代码模仿"蚂蚁呀嘿"特效,太魔性了! 最近在抖音上看到很多「蚂蚁呀嘿」的魔性视频,各方大佬齐齐上阵. 刚好看到百度的开源项目,基于PaddleGAN实现表情迁移 ...

  2. 4行Python代码实时获取股市数据

    最近股市特别火,正在学/学会Python的读者想尝试一下股市交易或者练练项目,获取数据便必不可少.这不,小猴紫给大家介绍一个专门获取股市数据的方法,有了数据之后数据分析.机器学习还不赶紧跑起来?毕竟这 ...

  3. python获取交易软件数据_几行Python代码,轻松获取美股阿里巴巴的交易数据

    原创: 野马 菜鸟学Python 学Python可以干很多事情,比如爬虫,数据分析,机器学习,但是有一个非常小众的分支,不仅结合了两大高薪行业,而且还薪水非常诱人,就是量化金融岗位.目前Python已 ...

  4. 3行python代码翻译70种语言,这个OCR神奇太赞了

    前言 今天给大家介绍一个超级简单且强大的OCR文本识别工具:easyocr. 这个模块支持70多种语言的即用型OCR,包括中文,日文,韩文和泰文等.完全满足了大家对于语言的要求,不管你说的是中文.外文 ...

  5. 10行python代码做出哪些酷炫的事情?

    大家好,我是辰哥~ Python凭借其简洁的代码,赢得了许多开发者的喜爱.因此也就促使了更多开发者用Python开发新的模块,从而形成良性循环,Python可以凭借更加简短的代码实现许多有趣的操作.下 ...

  6. 10行 python 代码做出哪些酷炫的事情?

    来源 | Python小二 Python凭借其简洁的代码,赢得了许多开发者的喜爱.因此也就促使了更多开发者用Python开发新的模块,从而形成良性循环,Python可以凭借更加简短的代码实现许多有趣的 ...

  7. 10 行 Python 代码能实现哪些有趣功能?

    大家好,我是菜鸟哥 Python凭借其简洁的代码,赢得了许多开发者的喜爱.因此也就促使了更多开发者用Python开发新的模块,从而形成良性循环,Python可以凭借更加简短的代码实现许多有趣的操作.下 ...

  8. 10行python代码可以做哪些酷炫的事情

    前言 今天玩啥?10行代码够玩吗? Python凭借其简洁的代码,赢得了许多开发者的喜爱.因此也就促使了更多开发者用Python开发新的模块,从而形成良性循环, Python可以凭借更加简短的代码实现 ...

  9. 10行python代码做出哪些酷炫的事情? 小白教程

    Python凭借其简洁的代码,赢得了许多开发者的喜爱.因此也就促使了更多开发者用Python开发新的模块,从而形成良性循环,Python可以凭借更加简短的代码实现许多有趣的操作.下面我们来看看,我们用 ...

最新文章

  1. Vue在Element UI下使用富文本框插件quill-editor(我个人不推荐用这个复杂的富文本插件)
  2. 别吵吵内卷了,看看人家虚拟人:连续直播70天都没工资
  3. 多视图几何总结——从本质矩阵恢复摄像机矩阵
  4. vivado路径最大时钟约束_Vivado使用误区与进阶系列(五)XDC约束技巧之I/O篇(下)...
  5. a5d2 mac 驱动分析
  6. springboot启动时的一个bug
  7. 李彦宏说互联网思维已过时,AI可以根本上变革交通、城市、农业和医疗
  8. Xavier Initialization 的理解与推导(及实现)
  9. PGM:概率论基础知识
  10. android-support-v7-appcompat下载
  11. 道路施工安全智能预警
  12. Idea修改主题,字体等常规操作
  13. oracle里面查找重复项,Oracle数据库查询重复数据及删除重复数据方法
  14. Kotlin的协程:挂起函数
  15. 最新亲测仿悬赏猫牛帮任务平台源码完美运营+支持封装APP
  16. CSI笔记【8】:基于MUSIC Algorithm的DoA/AoA估计以及MATLAB实现
  17. 如何调整糟糕的生活状态
  18. java 天数转毫秒_Java 毫秒转换为日期类型、日期转换为毫秒
  19. C++ opencv视频文件摄像头使用
  20. android studio : Invalid revision: 3.18.1-g262b901-dirty

热门文章

  1. unrecognised EXT_CSD revision 6解决办法
  2. php is_post,PHP发送get、post请求的6种方法简明总结
  3. ssm 异常捕获 统一处理_统一异常处理介绍及实战,看这篇就对了
  4. 报告!钉钉宜搭的8月总结,请查收~
  5. 云原生,开发者的黄金时代
  6. Dubbo 跨语言调用神兽:dubbo-go-pixiu
  7. “我想要用我余生,换夜空繁星闪耀”
  8. 未来,仅凭几个前端工程师,就能 hold 住一家企业吗?
  9. 调度算法为何被阿里如此重视?
  10. InnoDB锁机制之Gap Lock、Next-Key Lock、Record Lock解析