【Python数据分析与可视化】Pandas统计分析-实训

文章目录

  • 【Python数据分析与可视化】Pandas统计分析-实训
    • 导包
    • 读取数据
    • 分析数据
      • 1、查看数据的描述和统计信息;
      • 2、修改列名为汉字,并显示前5行数据;
      • 3、计算人均消费;
      • 4、查询吸烟男性中人均消费大于15的数据;
      • 5、分析小费金额和消费金额的关系;
      • 6、分析男性顾客和女性顾客谁更慷慨;
      • 7、分析星期和小费数额的关系;
      • 8、性别+吸烟的组合对慷慨度的影响;
      • 9、分析聚餐时间与小费数额的关系;

导包

import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei']#显示中文标签
plt.rcParams['axes.unicode_minus']=False #显示负号
%matplotlib inline

读取数据

f1=pd.read_excel('tips.xls')
f1.head()
total_bill tip sex smoker day time size
0 16.99 1.01 Female No Sun Dinner 2
1 10.34 1.66 Male No Sun Dinner 3
2 21.01 3.50 Male No Sun Dinner 3
3 23.68 3.31 Male No Sun Dinner 2
4 24.59 3.61 Female No Sun Dinner 4

分析数据

1、查看数据的描述和统计信息;

f1.describe()
total_bill tip size
count 244.000000 244.000000 244.000000
mean 19.785943 2.998279 2.569672
std 8.902412 1.383638 0.951100
min 3.070000 1.000000 1.000000
25% 13.347500 2.000000 2.000000
50% 17.795000 2.900000 2.000000
75% 24.127500 3.562500 3.000000
max 50.810000 10.000000 6.000000

2、修改列名为汉字,并显示前5行数据;

f1.columns =['总金额','小费金额','性别','吸烟','星期','时间','人数']
f1.head()
总金额 小费金额 性别 吸烟 星期 时间 人数
0 16.99 1.01 Female No Sun Dinner 2
1 10.34 1.66 Male No Sun Dinner 3
2 21.01 3.50 Male No Sun Dinner 3
3 23.68 3.31 Male No Sun Dinner 2
4 24.59 3.61 Female No Sun Dinner 4

3、计算人均消费;

f1['人均消费']=round(f1['总金额']/f1['人数'],2)
f1.head()
总金额 小费金额 性别 吸烟 星期 时间 人数 人均消费
0 16.99 1.01 Female No Sun Dinner 2 8.49
1 10.34 1.66 Male No Sun Dinner 3 3.45
2 21.01 3.50 Male No Sun Dinner 3 7.00
3 23.68 3.31 Male No Sun Dinner 2 11.84
4 24.59 3.61 Female No Sun Dinner 4 6.15

4、查询吸烟男性中人均消费大于15的数据;

# f1[ (f1['吸烟']=='Yes') & (f1['性别']=='Male') & (f1['总金额']> 15) ]
f1.query( '吸烟=="Yes" & 性别=="Male" & 总金额>15').head()
总金额 小费金额 性别 吸烟 星期 时间 人数 人均消费 慷慨度
56 38.01 3.00 Male Yes Sat Dinner 4 9.50 0.073153
60 20.29 3.21 Male Yes Sat Dinner 2 10.14 0.136596
63 18.29 3.76 Male Yes Sat Dinner 4 4.57 0.170522
69 15.01 2.09 Male Yes Sat Dinner 2 7.50 0.122222
76 17.92 3.08 Male Yes Sat Dinner 2 8.96 0.146667

5、分析小费金额和消费金额的关系;

f1.plot.scatter(x='总金额', y='小费金额', color='DarkBlue', label='小费金额与总金额的关系')

6、分析男性顾客和女性顾客谁更慷慨;

average_tip  = f1.groupby('性别')['小费金额'].mean()
average_tip.plot.bar()

7、分析星期和小费数额的关系;

average_tip  = f1.groupby('星期')['小费金额'].mean()
average_tip.plot.bar()

8、性别+吸烟的组合对慷慨度的影响;

# 构建慷慨度指标
f1['慷慨度']=f1['小费金额']/(f1['总金额']+f1['小费金额'])
r=f1.groupby(['性别','吸烟'])['慷慨度'].mean()
r.plot(kind='bar',x=['性别','吸烟'],y='慷慨度')

9、分析聚餐时间与小费数额的关系;

time = f1.groupby('时间')['小费金额'].mean()
time.plot.bar()

【Python数据分析与可视化】Pandas统计分析-实训相关推荐

  1. python数据分析与可视化【一】python基础实例

    用python做数据分析与可视化(一) python编程基础 这一块前面我写过博客,奉上链接:python基础 这篇就来看看几个小实例 后面有python很基础的知识点和例子 后面数据分析能用上 下一 ...

  2. [转载] Python数据分析与可视化学习笔记(一)数据分析与可视化概述

    参考链接: Python | 数据分析的数学运算 数据分析与可视化(一) 1.1 数据分析1.1.1 数据.信息与数据分析1.1.2数据分析与数据挖掘的区别1.1.3数据分析的流程 1.2 数据可视化 ...

  3. 【Python数据分析与可视化】期末复习笔记整理(不挂科)

    [Python数据分析与可视化]期末复习笔记 1. 数据分析与可视化概述 对比 概念 常用工具 Python常用类库 Jupyter notebook中的常用快捷方式 2. Python编程基础 co ...

  4. Python数据分析与可视化学习笔记(一)数据分析与可视化概述

    数据分析与可视化(一) 1.1 数据分析 1.1.1 数据.信息与数据分析 1.1.2数据分析与数据挖掘的区别 1.1.3数据分析的流程 1.2 数据可视化 1.3 数据分析与可视化常用工具 1.4 ...

  5. python数据分析与可视化清华大学_Python数据分析与可视化

    讲解Python数据分析与可视化中的九大模块,内容全面详实: 提供11个课程实训和2个完整的项目案例,理论结合实践 : 赠送420分钟的教学视频及丰富的配套资源,便于教师教学. 超值赠送: 教学大纲. ...

  6. Python 数据分析三剑客之 Pandas(一):认识 Pandas 及其 Series、DataFrame 对象

    CSDN 课程推荐:<迈向数据科学家:带你玩转Python数据分析>,讲师齐伟,苏州研途教育科技有限公司CTO,苏州大学应用统计专业硕士生指导委员会委员:已出版<跟老齐学Python ...

  7. python数据分析的钥匙——pandas库

    目录 系列文章目录 一. 关于pandas库: 二. pandas库的安装 三. pandas的两种基本数据结构--Series 与 DataFrame(附代码) 四. pandas库的应用(附代码) ...

  8. python数据分析可视化实例-Python数据分析与可视化从入门到精通

    (1)没有高深理论,每章都以实例为主,读者参考书中源码运行,就能得到与书中一样的结果.(2)专注于Python数据分析与可视化操作中实际用到的技术.相比大而全的书籍资料,本书能让读者尽快上手,开始项目 ...

  9. python可视化数据分析-Python数据分析与可视化从入门到精通

    (1)没有高深理论,每章都以实例为主,读者参考书中源码运行,就能得到与书中一样的结果.(2)专注于Python数据分析与可视化操作中实际用到的技术.相比大而全的书籍资料,本书能让读者尽快上手,开始项目 ...

最新文章

  1. MyBatis启动:MapperStatement创建
  2. 服务器装系统无显示屏,服务器系统安装后没有桌面
  3. 解析xml的问题未解决
  4. 工具_好(zhuang)用(bi)的chrome插件
  5. divmod数字处理函数
  6. YbtOJ#20068-[NOIP2020模拟赛B组Day5]连通子图【构造】
  7. 手机屏幕宽高像素计算_2020年的智能手机拍照新设计,就全看下半年了
  8. php用cdn打不开,开启 CDN 后 wordpress 后台打不开的解决办法
  9. 特斯拉:燃油车起火的概率远远高于特斯拉
  10. new 失败的处理方式
  11. pyecharts查看版本_pyecharts的版本问题
  12. malloc.h头文件和malloc函数详解
  13. 类型多样的3Dmax软件插件素材,速来收藏
  14. 并联串联混合的电压和电流_如何正确地把锂电池串联和并联起来
  15. Java接入支付宝提现
  16. android毛玻璃壁纸效果,【手机教程大赛】制作 毛玻璃效果 壁纸
  17. 无需root对oppo内置软件卸载方法
  18. 80后年轻老板创业心经
  19. Win10自带录屏怎么用?一键开启,超级简单!
  20. GooglePhoto设置壁纸----壁纸裁剪界面配置

热门文章

  1. Java核心编程随笔
  2. eNSP解决OSPF不规则区域几个方法和vlink-peer
  3. uafxcwd.lib(dllmodul.obj) : error LNK2005: _DllMain@12 already defined in main.obj
  4. 非线性最小二乘法 python_[数值计算] 数据拟合——非线性最小二乘法
  5. 经典的期货量化交易策略大全(含源代码)
  6. 非线性规划MATLAB求解原理,专题六--非线性规划介绍及其Matlab求解方法.ppt
  7. C语言实现飞翔的小鸟小游戏
  8. 分形造型的常用模型,C构造简单的IFS图形
  9. GooglePay默认支付(payment)应用 之一
  10. R 软件的下载与安装