数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(3)
文章目录
- 1.读取本的数据集
- 2.查看数据的前5行
- 3.将salary列的数据转换为最大值和最小值的平均值
- 4.将数据根据学历进行分组计算平均值
- 5.将createTime列转换为月日
- 6.查看所索引,数据类型和内存信息
- 7.查看数值型列的汇总统计
- 8.新增一列根据salary将数据分为三组
- 9.按照salary列队数据降序排序
- 10.取出第33行的数据
1.读取本的数据集
# 读取本地的数据集
# 数据集可以私信我我发给你们,同样也可以
df = pd.read_excel('data1.xlsx')
df
2.查看数据的前5行
使用head()函数查看数据的前几行,可以传入具体的数,默认是5
# 查看数据的前5行
df.head()
3.将salary列的数据转换为最大值和最小值的平均值
map和apply函数接受的参数都是一个行数,而且都不会直接改变原数据,都是返回一个新的DataFrame对象
# 将salary列数据转换为最大值和最小值的平均值
# 方式一 使用map函数
def fun(x):a,b = x.split('-')a = int(a.strip('k'))*1000b = int(b.strip('k'))*1000return int((a+b)/2)
df['salary'].map(fun)# 方式二使用apply函数
df['salary'] = df['salary'].apply(fun)
df
4.将数据根据学历进行分组计算平均值
使用groupby()函数进行分组
# 将数据根据学历进行分组并计算平均值
df.groupby('education').mean()
5.将createTime列转换为月日
# 将create Time列转换为月日for i in range(len(df)):df.iloc[i,0] = df.iloc[i,0].to_pydatetime().strftime('%m-%d')df.head()
6.查看所索引,数据类型和内存信息
info()函数
# 查看索引,数据类型,和内存信息
df.info()
7.查看数值型列的汇总统计
describe() 返回的数据包括,数量,数据的平均值,标准差,最小值,最大值,25%、50% 75 % 的分位数
# 查看数值型列的汇总统计
df.describe()
8.新增一列根据salary将数据分为三组
# 新增一列根据salary将数据分为三组,并且设置等级
bins = [0,5000,20000,50000]
group_names = ['底','中','高']df['categories'] = pd.cut(df['salary'],bins,labels=group_names)
df
9.按照salary列队数据降序排序
sort_values 默认是升序
# 按照salary列对数据降序排列
# ascending=False降序
# ascending=True升序df.sort_values('salary',ascending=False)
10.取出第33行的数据
根据索引选出第33行,索引从0开始
# 取出第33行的数据
df.loc[32]
今天的10道题涉及的东西多了一些,
groupby
、describe
、cut
、sort_values
、info
等,如果想要全部的了解这些,仅靠这10道题是远远不够的,希望大家能够额外找些试题练习,也可以根据跟着博主的文章一块刷题✨✨✨
推荐使用牛客网进行练习 直达牛客,快人一步
欢迎您的关注
数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(3)相关推荐
- 数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(2)
文章目录 前期准备 1.通过DataFrame保存为EXCEL 2.查看数据行列数 3.提取popularity列中值大于3小于7的行 4.交换两列的位置 5.提取popularity列最大的行所在行 ...
- 数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(8)
文章目录 前期准备 1. 将收盘价5日均线,20日均线与原始数据绘制在同一个图上 2. 按周为采样规则,取一周收盘价的最大值 3. 绘重制采样数据与原始数据 4. 将数据往后移动5天. 5. 将数据向 ...
- pands 画图 调整大小_保安10年苦练画图终成大神,用电脑自带的画图软件创作出惊人作品...
画不好图因为没有用PS?保安用电脑自带的画图软件创作出惊人作品 Pat Hines原是一位在医院值夜班的普通保安,漫长的黑夜,无聊枯燥,因此他常常需要找一些事情以此打发整晚无聊的时间.于是,他便利用这 ...
- C语言——连续做10道题,通过计算机随机产生两个1~10之间的加数给学生出一道加法运算题, 如果输入答案正确,则显示“Right!”,否则显示“Not correct!”,不给机会重做, 10道题做完
/连续做10道题,通过计算机随机产生两个1~10之间的加数给学生出一道加法运算题, 如果输入答案正确,则显示"Right!",否则显示"Not correct!" ...
- Python 基础循环10道题,新人必看,领会必悟
# 1.计算集合中所有偶数的和 set1 = range(1, 10) num = 0 set2 = {i for i in set1 if i % 2 == 0} for e in set2:num ...
- 质谱解析——几道例题让你从质谱图小白变大神!
当然,对于复杂的有机化合物的定性,还要借助于红外光谱.紫外光谱.核磁共振等分析方法. 质谱解析是一种非常困难的事情.自从有了计算机联机检索之后,特别是数据库越来越大的今天,尽管靠人工解析El质谱已经越 ...
- 计算机图片组合快捷键,10个实用的Win10组合快捷键技巧,学完你就是大神啦
快捷键一直都是白领们用来提升工作效率的法宝,不过大部分人对于快捷键的使用还多集中在Excel.Word等办公软件上.其实我们每天都要打交道的电脑操作系统中也隐藏着不少快捷键组合,下面小编就为大家分享一 ...
- win 10无法成功更新计算机策略,大神搞定win10系统通过修改组策略达到关闭自动更新的修复步骤...
喜欢使用电脑的小伙伴们一般都会遇到win10系统通过修改组策略达到关闭自动更新的问题,有时突然遇到win10系统通过修改组策略达到关闭自动更新的问题就不知道该怎么办了,我就把总结整理的win10系统通 ...
- 阿里、腾讯内部10G大神PPT,10分钟从PPT菜鸟到大神百度网盘下载
21世纪信息时代PPT已成为一件表达利器 以前有句话说"其字如其人"现在大家都会说"其P如其人"一份优秀的PPT可以让你过关斩将!脱颖而出!你是否还在为部门活动 ...
最新文章
- html 图片自动切换插件,jquery图片切换插件
- 【C 语言】文件操作 ( 配置文件读写 | 业务逻辑 | 接口设计 )
- ae制作数据可视化_我如何精心制作真正可怕的数据可视化
- JAVA中多线程基础知识
- checkValidity()验证输入信息合法性,自定义错误提示信息方法及误区
- webots自学笔记(五)使用物理插件ODE建立铰链
- 统计与分布之伯努利分布与二项分布
- Vue Cli3 模拟后台json接口
- 【安装教程】——widows_pycharm远程连接Linux服务器
- 中公教育python教师_中公教育的教师水平怎么样?
- 微信小程序|做一个底部评论视图
- 【学习笔记】正则语言的可检验性(性质检验)
- 2017年中兴捧月神算师算法精英挑战赛之阿尔法勒克斯特派(AlphaNext派)-----进来加群咯
- 【思维】Hzy's Rabbit Stick
- VIL-SLAM论文翻译:Stereo Visual Inertial LiDAR Simultaneous Localization and Mapping
- 地方门户网站如何快速发展盈利
- Nginx基础配置和相关知识
- 不会这 9 种常用的软件工具!你敢说你会网络安全?
- 为南通市2017中考数学试卷画的图
- 与门 或门 非门 与非 或非 异或 同或