先完成作业,再看老师解答,若有不同的地方或出错之处再来修改。

作业要求:

使用auto_ins作如下分析

1、首先对loss重新编码为1/0,有数值为1,命名为loss_flag

2、对loss_flag分布情况进行描述分析

3、分析是否出险和年龄、驾龄、性别、婚姻状态等变量之间的关系(提示:使用分类盒须图,堆叠柱形图)

在spyder中完成第三讲作业HW4:

# In[1]:

#导入模块

from stack2dim import *

####################################################################

# # 1.首先对loss重新编码为1/0,有数值为1,命名为loss_flag

auto_ins['loss_flag'] = auto_ins['Loss'].apply(lambda x: 0 if x==0 else 1)

print(auto_ins,'\n')

# In[2]:

####################################################################

# # 2.对loss_flag分布情况进行描述分析

import matplotlib.pyplot as plt

auto_ins['loss_flag'].value_counts().plot(kind = 'bar')

plt.title('loss_flag的分布')

plt.ylabel('频数')

plt.xlabel('loss_flag')

plt.show()

# In[3]:

###################################################################

# # 3.分析是否出险和年龄、驾龄、性别、婚姻状态等变量之间的关系

#     (提示:使用分类盒须图,堆叠柱形图)

# # 3.1 是否出险与年龄的关系

#--------------------------------------错误绘图方式---------------------------------------------

auto_ins.groupby('loss_flag').Age.mean().plot(kind = 'bar')

plt.title('Age vs loss_flag')

plt.ylabel('Age')

plt.xlabel('loss_flag')

plt.show()

'''

据图可看出,出险与年龄无关

'''

# In[4]:

# # 3.2 是否出险与驾龄的关系

auto_ins.groupby('loss_flag').vAge.mean().plot(kind = 'bar')

plt.title('vAge vs loss_flag')

plt.ylabel('vAge')

plt.xlabel('loss_flag')

plt.show()

'''

据图可看出,出险与驾龄有关

'''

#-------------------------------------------------------------------------------------------------

#%%

#------------------------------------------ 正确解答 --------------------------------------------

'''

老师讲解后修改

'''

'''

年龄Age和驾龄exp为连续变量,loss_flag为分类变量,

分类变量与连续变量的描述统计关系图用分类盒须图

'''

fig = plt.figure()

ax1 = fig.add_subplot(1,2,1)

ax2 = fig.add_subplot(1,2,2)

#是否出险与年龄

import seaborn

seaborn.boxplot(x='loss_flag',y='Age',data=auto_ins,ax=ax1)

#是否出险与驾龄

seaborn.boxplot(x='loss_flag',y='exp',data=auto_ins,ax=ax2)

'''

据分类盒须图可看出,年龄中位数几乎相等,驾龄中位数相差明显

所以,出险与年龄无关,和驾龄有关

'''

#------------------------------------------------------------------------------------------------

# In[5]:

# # 3.3 是否出险与性别的关系

stack2dim(auto_ins, 'loss_flag','Gender')

'''

据图可看出,出险与性别有关

'''

# In[6]:

# # 3.4 是否出险与婚姻状态的关系

stack2dim(auto_ins,'Marital','loss_flag')

'''

据图可看出,出险与婚姻状态有关

'''

# In[7]:

# # 3.5 是否出险与汽车出产国的关系

stack2dim(auto_ins, 'loss_flag', 'import')

'''

据图可看出,出险与汽车出产国无关

'''

#%%

###################################################################

'''

根据上面的分析,可得出:出险与驾龄、性别、婚姻状态有关

'''

python数据科学实战_Python数据科学实战第三讲作业HW4相关推荐

  1. python编程理论篇_Python爬虫入门实战之猫眼电影数据抓取(理论篇)

    前言 本文可能篇幅较长,但是绝对干货满满,提供了大量的学习资源和途径.达到让读者独立自主的编写基础网络爬虫的目标,这也是本文的主旨,输出有价值能够真正帮助到读者的知识,即授人以鱼不如授人以渔,让我们直 ...

  2. python数据科学库_Python数据科学库

    python数据科学库 什么是数据科学? (What is Data Science?) We live in an information age, where the challenge is t ...

  3. python做前端可视化_Python数据可视化的四种简易方法

    摘要: 本文讲述了热图.二维密度图.蜘蛛图.树形图这四种Python数据可视化方法. 数据可视化是任何数据科学或机器学习项目的一个重要组成部分.人们常常会从探索数据分析(EDA)开始,来深入了解数据, ...

  4. python sns绘制回归线_Python数分实战:员工流失情况预测

    在很久之前,我有写一个Excel数据分析的实战项目,不晓得大家还记不记得,感兴趣的童鞋可以回看: A九姑娘:Excel数分实战:员工流失率分析​zhuanlan.zhihu.com 本次的项目数据依旧 ...

  5. python爬虫和定位_Python网络爬虫实战,照片定位与B站弹幕!

    之前两篇已经说完了如何爬取网页以及如何解析其中的数据,那么今天我们就可以开始第一次实战了. Python资源共享群:626017123 这篇实战包含两个内容. * 利用爬虫调用Api来解析照片的拍摄位 ...

  6. python 财务分析可视化方法_Python数据可视化的四种简易方法

    Python数据可视化的四种简易方法 作者:PHPYuan 时间:2018-11-28 03:40:43 摘要: 本文讲述了热图.二维密度图.蜘蛛图.树形图这四种Python数据可视化方法. 数据可视 ...

  7. python图形绘制星空图_Python数据可视化教程:基于Plotly的动态可视化绘图

    1. plotly 介绍 Plotly是一个非常著名且强大的开源数据可视化框架,它通过构建基于浏览器显示的web形式的可交互图表来展示信息,可创建多达数十种精美的图表和地图, 下面我们以jupyter ...

  8. python 访问网页 重定向_Python数据网络采集5--处理Javascript和重定向

    Python数据网络采集5--处理Javascript和重定向 到目前为止,我们和网站服务器通信的唯一方式,就是发出HTTP请求获取页面.有些网页,我们不需要单独请求,就可以和网络服务器交互(收发信息 ...

  9. python数据统计代码_Python 数据的累加与统计的示例代码

    问题 你需要处理一个很大的数据集并需要计算数据总和或其他统计量. 解决方案 对于任何涉及到统计.时间序列以及其他相关技术的数据分析问题,都可以考虑使用 Pandas库 . 为了让你先体验下,下面是一个 ...

  10. python科学数据分析_python数据分析-科学计数法

    用python进行数据分析时,查看数据,经常发生数据被自动显示成科学记数法的模式,或者多行多列数据只显示前后几行几列,中间都是省略号的情形. numpy import numpy as npnp.se ...

最新文章

  1. SAP Kyma组件一览
  2. set、get方法解析
  3. linux的arp指令
  4. php 查找所有函数,PHP(方法 函数 循环 和 数组 查找)
  5. 估算服务器处理数据性能,服务器性能计算方法-20210720074826.docx-原创力文档
  6. 【js】js传递对象
  7. C++编程问题--注意指针参数的传递
  8. 多台或者集群环境下如何保证spring定时器只执行一个
  9. Dotnet3.5 New一个对象就可以直接跟上大括号对类中的公开成员变量以及属性赋值...
  10. 中文查重原理 及算法实例(python)
  11. 如何查询idea当前项目所有打断点的位置
  12. 1065 浙江中医药大学ACM OJ
  13. iPhone 6/6Plus UI界面设计和适配尺寸规范
  14. 远程桌面连接的工具及使用方法
  15. Estun机器人远程模式使能_工业机器人入门使用教程ESTUN机器人.ppt
  16. 安卓开发实现获取扫码枪扫码二维码、条形码后的内容
  17. 算法设计与分析第一章递推算法
  18. python网络爬虫案例_Python网络爬虫案例实战
  19. 「Cpolar」看我如何实现公网远程控制Mac OS【使用mac自带VNC】
  20. 最简单的ssm框架整合搭建

热门文章

  1. 使用nodejs创建Marketing Cloud的contact数据
  2. Fiori应用里如何给客户主数据维护图片
  3. FioriLaunchpad.html的三个round-trip
  4. UDO report generate DDIC table
  5. SAP IBASE logic of pt_equiindx
  6. 推荐一款功能强大的Tomcat 管理监控工具,可替代Tomcat Manager
  7. 截屏当前界面_华为手机居然有这3种神奇的截屏方法,用过后,我就再也离不开了...
  8. CentOS 6 rpm方式安装mysql
  9. python学习-注释、语法、整数、浮点数初步接触
  10. java开发学不会_JAVA学不会,快期末了,怎么办?