公众号:尤而小屋
作者:Peter
编辑:Peter

本文主要是介绍的自己在平时使用Pandas处理数据过程中接触到的高频技巧。以前的Pandas文章有对不同知识点的拆解,欢迎阅读。

Pandas连载文章

图解Pandas数据合并:concat、join、append

创建DataFrame:10种方式任你选

赞!五花八门的Pandas筛选数据

数据处理基石:数据探索

高频技巧

使用的技巧主要是下图涉及到的:

import pandas as pd
import numpy as np

导入文件

Pandas能够读取很多文件:Excel、CSV、数据库、TXT,甚至是在线的文件都是OK的

创建DataFrame

在以前的文章中介绍过10种DataFrame的方法

查看头尾数据

头尾都是默认5行数据,可以指定行数

# df2.head()  默认头部5行
df2.head(3)  # 指定3行# df2.tail()  默认尾部5行
df2.tail(2)  # 指定尾部2行

显示全部列名

显示索引

查看列的数据类型

查看行列数

查看数据大小

查看缺失值

修改列名

两种方式:使用rename函数和直接使用columns属性

统计元素

统计每个元素的个数

转成列表数据

提取列中数据

提取文本数据

数值范围数据提取

提取整列数据

缺失值填充

  • 指定填充的值

  • 用计算值

  • 用其他值

数据去重

计算统计值

计算统计值,比如最值和均值等

计算中位数

提取最值所在的行

Pandas切片

df2.iloc[22]  # 提取某个行的数据
df2.iloc[:,1:6]  # 行和列上的切片

大小排序

分组聚合

使用groupby分组之后,对不同的字段可以使用不同的聚合函数

索引重排

注意和上面例子的比较。使用的是reset_index函数

去掉原索引

使用索引重排之后我们需要去掉原来的索引;比较上下两个结果的区别。通过drop=True来实现


apply函数

两个列相加

DataFrame合并

1、先看看两个原始数据

2、默认情况:求的两个DF的交集

3、保留左边全部数据

4、保留右边全部数据

how="inner"其实就是默认情况:

导出数据

导出数据的时候通常是不需要索引的

往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载黄海广老师《机器学习课程》视频课黄海广老师《机器学习课程》711页完整版课件

本站qq群851320808,加入微信群请扫码:

【Python】30个Pandas高频使用技巧相关推荐

  1. 人生苦短,Python值得 这些Pandas隐藏小技巧你知道吗?

    全文共2501字,预计学习时长7分钟 图源:unsplash 作为一名数据分析师或数据科学家,不了解Python中的Pandas库是无论如何说不过去的,它已经成为Python中用来整理.清理数据的标准 ...

  2. 干货!整理了50个 Pandas 高频使用技巧,强烈建议收藏!

    作者 | 俊欣 来源 | 关于数据分析与可视化 今天小编来分享在pandas当中经常会被用到的方法,篇幅可能有点长但是提供的都是干货,读者朋友们看完之后也可以点赞收藏,相信会对大家有所帮助,大致本文会 ...

  3. pandas fillna_【Python基础】快速提升效率的6个pandas使用小技巧

    文章来源:towardsdatascience 作者:B.Chen 翻译\编辑:Python大数据分析 pandas是python中常用的数据分析库,出现频率非常高,而且pandas功能之多让人咋舌, ...

  4. 【Python基础】快速提升效率的6个pandas使用小技巧

    文章来源:towardsdatascience 作者:B.Chen  翻译\编辑:Python大数据分析 pandas是python中常用的数据分析库,出现频率非常高,而且pandas功能之多让人咋舌 ...

  5. 人生苦短,Python值得!这些Pandas隐藏小技巧你知道吗?

    全文共2501字,预计学习时长7分钟 作为一名数据分析师或数据科学家,不了解Python中的Pandas库是无论如何说不过去的,它已经成为Python中用来整理.清理数据的标准工具了. 然而,关于Pa ...

  6. python自学教程推荐-学习python中的pandas有没有好的教程推荐?

    上来就丢教程和资料,其实是把路带偏了!找到学习Pandas的方法比找教程重要的多!现在无论是学习Python还是Pandas,最大的问题不是没有资料,而恰恰是太多资料和教程,让人抓不住头绪. 很多凭着 ...

  7. python对excel某一列去重-「总结篇」Python中所有的Excel操作技巧

    原标题:「总结篇」Python中所有的Excel操作技巧 Python对于Excel的操作是多种多样的,掌握了相关用法就可以随心所欲的操作数据了! 操作xls文件 xlrd(读操作): import ...

  8. (转载)Python数据分析之pandas学习

    转载地址:http://www.cnblogs.com/nxld/p/6058591.html Python中的pandas模块进行数据分析. 接下来pandas介绍中将学习到如下8块内容: 1.数据 ...

  9. 快速提高Python数据分析速度的八个技巧

    今天整理了几个在使用python进行数据分析的常用小技巧.命令.记得搭配Pandas+Jupyter Notebook使用哦. 01 使用Pandas  Profiling预览数据 这个神器我们在之前 ...

最新文章

  1. 容器间通信_Vue组件间通信的6种方式,前端工程师人人都会,网友:太简单了...
  2. 痞子衡嵌入式:常用的数据差错控制技术(2)- 奇偶校验(Parity Check)
  3. PS常用快捷键就这些了,记住绘图事半功倍
  4. 四. 常见H.264视频编解码器(X264和JM)及参考软件JM的下载与编解码
  5. Fluid 0.5 版本发布:开启数据集缓存在线弹性扩缩容之路
  6. [导入]相片: 23853741.jpg
  7. Oracle入门(四)之查询基本信息
  8. Android日志[进阶篇]一-使用 Logcat 写入和查看日志
  9. 127.Word Ladder
  10. 计算机二级等级考试模拟试题,2016年计算机二级考试office模拟试题
  11. 2021高通人工智能应用创新大赛--创新赛道-决赛阶段小结
  12. c++中,可以用delete释放一个数组的空间吗?
  13. 把url地址复制到粘贴板上_写个简单的python爬虫爬取堆糖上漂亮的小姐姐
  14. iPhone平台下的游戏开发
  15. 【图像融合】基于matlab CBF算法图像融合【含Matlab源码 083期】
  16. (网络编程)SOCKET应用实例
  17. matlab菲涅尔衍射光强分布,矩孔菲涅耳衍射的光强分布.pdf
  18. IDEA设置类文件模板@Auther@Date等注释信息——idea笔记
  19. JS [Web浏览器] “Uncaught RangeError: Maximum call stack size exceeded“ (32)
  20. Centos7安装并使用Oracle11g数据库

热门文章

  1. unity3d优化总结篇
  2. A Network in a Laptop: Rapid Prototyping for Software-Defined Networks
  3. 《京东618实践:一元抢宝系统的数据库架构优化》阅读笔记
  4. android 数据存储----android短信发送器之文件的读写(手机+SD卡)
  5. 珍惜相聚,亦珍惜离别
  6. 添加github ssh 公钥
  7. sqlserver计算时间差DATEDIFF 函数
  8. DB2查询结果显示n行
  9. 打算写的文章,先写个标题
  10. MVC核心功能组件和简介