本文总结了pandas的常用操作,并做成练习题,练习题附答案,并且有完整数据集,建议读者把练习题完成。作者认为,做完练习题,pandas的基本操作没有问题了,以后碰到问题也可以查这些习题。(文末提供下载)

Pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。

网上可以搜到大量的pandas教程和官方文档,但没有简单的方法来练习。教程是很好的资源,但要付诸实践。只有实践,才能更好的加深学习。

本站从github搜索到了一些pandas的练习题,含完整数据集,并进行整理:

原代码作者:Guilherme Samora

本练习代码可以在github下载:

https://github.com/fengdu78/machine_learning_beginner/tree/master/pandas/Pandas_Exercises

Pandas练习题目录

1.Getting and knowing

  • Chipotle

  • Occupation

  • World Food Facts

2.Filtering and Sorting

  • Chipotle

  • Euro12

  • Fictional Army

3.Grouping

  • Alcohol Consumption

  • Occupation

  • Regiment

4.Apply

  • Students

  • Alcohol Consumption

  • US_Crime_Rates

5.Merge

  • Auto_MPG

  • Fictitious Names

  • House Market

6.Stats

  • US_Baby_Names

  • Wind_Stats

7.Visualization

  • Chipotle

  • Titanic Disaster

  • Scores

  • Online Retail

  • Tips

8.Creating Series and DataFrames

  • Pokemon

9.Time Series

  • Apple_Stock

  • Getting_Financial_Data

  • Investor_Flow_of_Funds_US

10.Deleting

  • Iris

  • Wine

使用方法

每个练习文件夹有三个不同类型的文件:

1. Exercises.ipynb

没有答案代码的文件,这个是你做的练习

2.Solutions.ipynb

运行代码后的结果(不要改动)

3.Exercise_with_Solutions.ipynb

有答案代码和注释的文件

你可以在Exercises.ipynb里输入代码,看看运行结果是否和Solutions.ipynb里面的内容一致,如果真的完成不了再看下Exercise_with_Solutions.ipynb的答案。

典型的例题如图所示:

练习题截图


总结

本文把pandas的常用操作做成练习题,练习题附答案,并且有完整数据集。希望初学者能认真完成练习题,以便提高数据分析技能。

本练习代码可以在github下载:https://github.com/fengdu78/machine_learning_beginner/tree/master/pandas/Pandas_Exercises

若下载不了,可以用百度云:

链接:https://pan.baidu.com/s/1qzIZAsirJSZLyVm5okcicA 提取码:umgg

往期精彩回顾适合初学者入门人工智能的路线及资料下载(图文+视频)机器学习入门系列下载中国大学慕课《机器学习》(黄海广主讲)机器学习及深度学习笔记等资料打印《统计学习方法》的代码复现专辑
AI基础下载机器学习交流qq群955171419,加入微信群请扫码:

【机器学习】Pandas练习题-提高你的数据分析技能相关推荐

  1. Pandas练习题-提高你的数据分析技能

    本文总结了pandas的常用操作,并做成练习题,练习题附答案,并且有完整数据集,建议读者把练习题完成.作者认为,做完练习题,pandas的基本操作没有问题了,以后碰到问题也可以查这些习题.(文末提供下 ...

  2. Numpy练习题100题-提高你的数据分析技能

    本文总结了Numpy的常用操作,并做成练习题,练习题附答案建议读者把练习题完成.作者认为,做完练习题,Numpy的基本操作没有问题了,以后碰到问题也可以查这些习题.(文末提供下载) NumPy(Num ...

  3. 独家 | 2021,什么数据分析技能最重要?

    作者:Emmett Boudreau 翻译:朱启轩 校对:和中华 本文约2800字,建议阅读8分钟. 本文主要介绍数据科学的发展趋势以及当今工作岗位所需要的数据分析技能.  Image by auth ...

  4. Amazon:大数据分析技能,你满足几条?

    从各大招聘网站中可以看到,今年招聘信息少了很多,但数据分析相关岗位有一定增加,而数据分析能力几乎已成为每个岗位的必备技能.是什么原因让企业如此重视"数据人才"? 伴随滴滴出行.智慧 ...

  5. ML之DataScience:基于机器学习处理数据科学(DataScience)任务(数据分析、特征工程、科学预测等)的简介、流程、案例应用执行详细攻略

    ML之DataScience:基于机器学习处理数据科学(DataScience)任务(数据分析.特征工程.科学预测等)的简介.流程.案例应用执行详细攻略 目录 数据科学的任务(数据分析.特征工程.科学 ...

  6. 【Python基础】101道Numpy、Pandas练习题,提升你的Python水平

    无论是数据分析还是机器学习,数据的预处理必不可少.其中最常用.最基础的Python库非numpy和pandas莫属,很多初学者可能看了很多教程,但是很快就把用法忘光了. 光看不练假把式,今天向大家推荐 ...

  7. 使用python数据分析_如何使用Python提升您的数据分析技能

    使用python数据分析 If you're learning Python, you've likely heard about sci-kit-learn, NumPy and Pandas. A ...

  8. 2022泰迪杯数据分析技能赛B题方案及赛后总结:银行客户忠诚度分析

    第五届"泰迪杯"数据分析技能赛(B题)『一等奖』,@队友:东可在编程.好同志歪歪 B题题目为"银行客户忠诚度分析",题目给出了短期客户产品购买数据"s ...

  9. 如何掌握好python数据分析技能_从负基础起步,掌握数据分析技能

    笔者向我们说明了学会数据分析对于运营人的重要性,并介绍了如何掌握数据分析技能. 作为一个在大学与统计.数学.计算机这些学科完全绝缘的语言学专业的毕业僧,同时又是一个从医疗销售半路出家转行到互联网的产品 ...

最新文章

  1. 文献记录(part19)--Cross modal similarity learning with active queries
  2. .NET Core with 微服务 - 什么是微服务
  3. (转)非极大抑制(Non-Maximum Suppression)
  4. Php中跳转语句goto,phpgoto语句
  5. 【苹果cms10 Maccmsv10 站群深度定制版 开发日志】 新增日志模块
  6. linux的opt大小不够了,在redhat下安装QT,提示opt 空间不足。
  7. 饿了么超时20分钟_饿了么:5分钟;美团:8分钟......消费者:???
  8. sccket服务器信息获取,websocket断线后重新new了地址,ws.onmessage没有数据
  9. 性能测试场景设计之用户启停设置
  10. java提取省市县乡镇村
  11. meta分析-stata软件使用
  12. Mac上WineSkin游戏无法正常运行
  13. 【Linux 内核 内存管理】内存映射原理 ② ( 内存映射概念 | 文件映射 | 匿名映射 | 内存映射原理 | 分配虚拟内存页 | 产生缺页异常 | 分配物理内存页 | 共享内存 | 进程内存 )
  14. 计算机网络技术——VLAN划分
  15. 一个简单的log2(x)的快速计算方法
  16. MySQL实战宝典 高可用架构篇 17 高可用设计三大高可用设计架构方案
  17. 计算机处理器性能排名,2019电脑cpu处理器性能排名:AMD 32核撕裂者遥遥领先(2)...
  18. 打开计算机窗口的控制菜单,打开控制面板的几种方法
  19. 2021年江苏省高考数据统计:江苏省普通类报名人数30.9万人,本土167所高校(2所985大学)
  20. 吞食天地2蜀汉英雄传1.5版图文攻略

热门文章

  1. uva 156 Ananagrams
  2. Swift之String的简单实用
  3. 自定义控件-侧边菜单SlidingMenu(滑动菜单)
  4. RFS的web自动化验收测试——第12讲 List Variables-List变量及其用法
  5. [转]使用CSS3 Grid布局实现内容优先
  6. P1351 联合权值
  7. 项目发布后 Tomcat中只有web-INF文件夹
  8. 函数的返回是返回给实参,然后由实参输出,返回值的作用是给输出的全部变为变量然后用.=连接好把变量存进数据库而不是输出完屏幕就拉倒了...
  9. dede:arclist 不能调用文章的副栏目或多个副栏目的解决方法
  10. C++虚函数表解析(转) ——写的真不错