【Python数据分析与可视化】Pandas统计分析-实训
【Python数据分析与可视化】Pandas统计分析-实训
文章目录
- 【Python数据分析与可视化】Pandas统计分析-实训
- 导包
- 读取数据
- 分析数据
- 1、查看数据的描述和统计信息;
- 2、修改列名为汉字,并显示前5行数据;
- 3、计算人均消费;
- 4、查询吸烟男性中人均消费大于15的数据;
- 5、分析小费金额和消费金额的关系;
- 6、分析男性顾客和女性顾客谁更慷慨;
- 7、分析星期和小费数额的关系;
- 8、性别+吸烟的组合对慷慨度的影响;
- 9、分析聚餐时间与小费数额的关系;
导包
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei']#显示中文标签
plt.rcParams['axes.unicode_minus']=False #显示负号
%matplotlib inline
读取数据
f1=pd.read_excel('tips.xls')
f1.head()
total_bill | tip | sex | smoker | day | time | size | |
---|---|---|---|---|---|---|---|
0 | 16.99 | 1.01 | Female | No | Sun | Dinner | 2 |
1 | 10.34 | 1.66 | Male | No | Sun | Dinner | 3 |
2 | 21.01 | 3.50 | Male | No | Sun | Dinner | 3 |
3 | 23.68 | 3.31 | Male | No | Sun | Dinner | 2 |
4 | 24.59 | 3.61 | Female | No | Sun | Dinner | 4 |
分析数据
1、查看数据的描述和统计信息;
f1.describe()
total_bill | tip | size | |
---|---|---|---|
count | 244.000000 | 244.000000 | 244.000000 |
mean | 19.785943 | 2.998279 | 2.569672 |
std | 8.902412 | 1.383638 | 0.951100 |
min | 3.070000 | 1.000000 | 1.000000 |
25% | 13.347500 | 2.000000 | 2.000000 |
50% | 17.795000 | 2.900000 | 2.000000 |
75% | 24.127500 | 3.562500 | 3.000000 |
max | 50.810000 | 10.000000 | 6.000000 |
2、修改列名为汉字,并显示前5行数据;
f1.columns =['总金额','小费金额','性别','吸烟','星期','时间','人数']
f1.head()
总金额 | 小费金额 | 性别 | 吸烟 | 星期 | 时间 | 人数 | |
---|---|---|---|---|---|---|---|
0 | 16.99 | 1.01 | Female | No | Sun | Dinner | 2 |
1 | 10.34 | 1.66 | Male | No | Sun | Dinner | 3 |
2 | 21.01 | 3.50 | Male | No | Sun | Dinner | 3 |
3 | 23.68 | 3.31 | Male | No | Sun | Dinner | 2 |
4 | 24.59 | 3.61 | Female | No | Sun | Dinner | 4 |
3、计算人均消费;
f1['人均消费']=round(f1['总金额']/f1['人数'],2)
f1.head()
总金额 | 小费金额 | 性别 | 吸烟 | 星期 | 时间 | 人数 | 人均消费 | |
---|---|---|---|---|---|---|---|---|
0 | 16.99 | 1.01 | Female | No | Sun | Dinner | 2 | 8.49 |
1 | 10.34 | 1.66 | Male | No | Sun | Dinner | 3 | 3.45 |
2 | 21.01 | 3.50 | Male | No | Sun | Dinner | 3 | 7.00 |
3 | 23.68 | 3.31 | Male | No | Sun | Dinner | 2 | 11.84 |
4 | 24.59 | 3.61 | Female | No | Sun | Dinner | 4 | 6.15 |
4、查询吸烟男性中人均消费大于15的数据;
# f1[ (f1['吸烟']=='Yes') & (f1['性别']=='Male') & (f1['总金额']> 15) ]
f1.query( '吸烟=="Yes" & 性别=="Male" & 总金额>15').head()
总金额 | 小费金额 | 性别 | 吸烟 | 星期 | 时间 | 人数 | 人均消费 | 慷慨度 | |
---|---|---|---|---|---|---|---|---|---|
56 | 38.01 | 3.00 | Male | Yes | Sat | Dinner | 4 | 9.50 | 0.073153 |
60 | 20.29 | 3.21 | Male | Yes | Sat | Dinner | 2 | 10.14 | 0.136596 |
63 | 18.29 | 3.76 | Male | Yes | Sat | Dinner | 4 | 4.57 | 0.170522 |
69 | 15.01 | 2.09 | Male | Yes | Sat | Dinner | 2 | 7.50 | 0.122222 |
76 | 17.92 | 3.08 | Male | Yes | Sat | Dinner | 2 | 8.96 | 0.146667 |
5、分析小费金额和消费金额的关系;
f1.plot.scatter(x='总金额', y='小费金额', color='DarkBlue', label='小费金额与总金额的关系')
6、分析男性顾客和女性顾客谁更慷慨;
average_tip = f1.groupby('性别')['小费金额'].mean()
average_tip.plot.bar()
7、分析星期和小费数额的关系;
average_tip = f1.groupby('星期')['小费金额'].mean()
average_tip.plot.bar()
8、性别+吸烟的组合对慷慨度的影响;
# 构建慷慨度指标
f1['慷慨度']=f1['小费金额']/(f1['总金额']+f1['小费金额'])
r=f1.groupby(['性别','吸烟'])['慷慨度'].mean()
r.plot(kind='bar',x=['性别','吸烟'],y='慷慨度')
9、分析聚餐时间与小费数额的关系;
time = f1.groupby('时间')['小费金额'].mean()
time.plot.bar()
【Python数据分析与可视化】Pandas统计分析-实训相关推荐
- python数据分析与可视化【一】python基础实例
用python做数据分析与可视化(一) python编程基础 这一块前面我写过博客,奉上链接:python基础 这篇就来看看几个小实例 后面有python很基础的知识点和例子 后面数据分析能用上 下一 ...
- [转载] Python数据分析与可视化学习笔记(一)数据分析与可视化概述
参考链接: Python | 数据分析的数学运算 数据分析与可视化(一) 1.1 数据分析1.1.1 数据.信息与数据分析1.1.2数据分析与数据挖掘的区别1.1.3数据分析的流程 1.2 数据可视化 ...
- 【Python数据分析与可视化】期末复习笔记整理(不挂科)
[Python数据分析与可视化]期末复习笔记 1. 数据分析与可视化概述 对比 概念 常用工具 Python常用类库 Jupyter notebook中的常用快捷方式 2. Python编程基础 co ...
- Python数据分析与可视化学习笔记(一)数据分析与可视化概述
数据分析与可视化(一) 1.1 数据分析 1.1.1 数据.信息与数据分析 1.1.2数据分析与数据挖掘的区别 1.1.3数据分析的流程 1.2 数据可视化 1.3 数据分析与可视化常用工具 1.4 ...
- python数据分析与可视化清华大学_Python数据分析与可视化
讲解Python数据分析与可视化中的九大模块,内容全面详实: 提供11个课程实训和2个完整的项目案例,理论结合实践 : 赠送420分钟的教学视频及丰富的配套资源,便于教师教学. 超值赠送: 教学大纲. ...
- Python 数据分析三剑客之 Pandas(一):认识 Pandas 及其 Series、DataFrame 对象
CSDN 课程推荐:<迈向数据科学家:带你玩转Python数据分析>,讲师齐伟,苏州研途教育科技有限公司CTO,苏州大学应用统计专业硕士生指导委员会委员:已出版<跟老齐学Python ...
- python数据分析的钥匙——pandas库
目录 系列文章目录 一. 关于pandas库: 二. pandas库的安装 三. pandas的两种基本数据结构--Series 与 DataFrame(附代码) 四. pandas库的应用(附代码) ...
- python数据分析可视化实例-Python数据分析与可视化从入门到精通
(1)没有高深理论,每章都以实例为主,读者参考书中源码运行,就能得到与书中一样的结果.(2)专注于Python数据分析与可视化操作中实际用到的技术.相比大而全的书籍资料,本书能让读者尽快上手,开始项目 ...
- python可视化数据分析-Python数据分析与可视化从入门到精通
(1)没有高深理论,每章都以实例为主,读者参考书中源码运行,就能得到与书中一样的结果.(2)专注于Python数据分析与可视化操作中实际用到的技术.相比大而全的书籍资料,本书能让读者尽快上手,开始项目 ...
最新文章
- MyBatis启动:MapperStatement创建
- 服务器装系统无显示屏,服务器系统安装后没有桌面
- 解析xml的问题未解决
- 工具_好(zhuang)用(bi)的chrome插件
- divmod数字处理函数
- YbtOJ#20068-[NOIP2020模拟赛B组Day5]连通子图【构造】
- 手机屏幕宽高像素计算_2020年的智能手机拍照新设计,就全看下半年了
- php用cdn打不开,开启 CDN 后 wordpress 后台打不开的解决办法
- 特斯拉:燃油车起火的概率远远高于特斯拉
- new 失败的处理方式
- pyecharts查看版本_pyecharts的版本问题
- malloc.h头文件和malloc函数详解
- 类型多样的3Dmax软件插件素材,速来收藏
- 并联串联混合的电压和电流_如何正确地把锂电池串联和并联起来
- Java接入支付宝提现
- android毛玻璃壁纸效果,【手机教程大赛】制作 毛玻璃效果 壁纸
- 无需root对oppo内置软件卸载方法
- 80后年轻老板创业心经
- Win10自带录屏怎么用?一键开启,超级简单!
- GooglePhoto设置壁纸----壁纸裁剪界面配置
热门文章
- Java核心编程随笔
- eNSP解决OSPF不规则区域几个方法和vlink-peer
- uafxcwd.lib(dllmodul.obj) : error LNK2005: _DllMain@12 already defined in main.obj
- 非线性最小二乘法 python_[数值计算] 数据拟合——非线性最小二乘法
- 经典的期货量化交易策略大全(含源代码)
- 非线性规划MATLAB求解原理,专题六--非线性规划介绍及其Matlab求解方法.ppt
- C语言实现飞翔的小鸟小游戏
- 分形造型的常用模型,C构造简单的IFS图形
- GooglePay默认支付(payment)应用 之一
- R 软件的下载与安装