dhu 数据科学与技术 第7次作业
一. 简答题(共1题,100分)
- (简答题, 100分)
文件bankpep.csv存放着银行储户的基本信息,数据格式如表4-7所示。
通过绘图对这些客户数据进行可视化分析。
(1)客户年龄分布的直方图和密度图(见图4-25)。
(2)客户年龄和收入关系的散点图(见图4-26)。
图4-25 客户年龄分布
图4-26 按客户年龄和收入关系绘制的散点图
(3)绘制散点图观察客户(年龄、收入、孩子数)之间的关系,用对角线显示直方图(见图4-27)。
(4)按区域展示平均收入的柱状图,并显示标准差(见图4-28)。
图4-27 按客户年龄、收入、孩子数关系绘制的散点矩阵
图4-28 各区域客户的平均收入
(5)多子图绘制:客户中性别占比饼图,有车客户的性别占比饼图,按孩子数的客户占比饼图(见图4-29)。
(6)各性别、收入绘制的箱形图(见图4-30)。
图4-29 按性别、有车客户的性别、孩子数占比绘制的饼图
图4-30 按性别、收入绘制的箱形图
bankpep.csv
解题
import matplotlib.pyplot as plt
import pandas as pd
from pandas import DataFrame
import numpy as np
import matplotlibdata = pd.read_csv('C:\\python\\bankpep.csv')# 1)
plt.hist(data['age'],bins=10,density=True)
data['age'].plot(kind='kde')
plt.title('Customer Age')
plt.xlabel('Age')
plt.ylabel('Density')
plt.show()# 2)
plt.scatter(data['age'],data['income'],label = '(age,income)',marker=',',s=7)
plt.grid(True)
plt.xlim(0,80)
plt.title('Customer Income')
plt.legend()
plt.xlabel('Age')
plt.ylabel('Income')
plt.show()# 3)
pd.plotting.scatter_matrix(data[['age','income','children']])
plt.show()# 4)
mean = data.groupby(['region']).agg({'income':np.mean})
std = data.groupby(['region']).agg({'income':np.std})
plt.bar(mean.index,mean.income,yerr=std.income,width=0.6)
plt.xlabel('Recion')
plt.title('Customer Income')
plt.xticks(rotation=45)
plt.show()# 5)
fig=plt.figure(figsize=(6,6))ax1=fig.add_subplot(2,2,1)
list1=data.groupby(['sex'])['sex'].count()
plt.pie(list1,labels=['FEMALE','MALE'],startangle = 45,autopct='%0.1f%%')
plt.ylabel('sex')
plt.title('Customer Sex')ax2=fig.add_subplot(2,2,2)
list1=data[data['car'] =='YES'].groupby(['sex'])['sex'].count()
plt.pie(list1,labels=['FEMALE','MALE'],startangle = 45,autopct='%0.1f%%')
plt.ylabel('sex')
plt.title('Customer Car Sex')ax3=fig.add_subplot(223)
list1=data.groupby(['children'])['children'].count()
plt.pie(list1,labels=[0,1,2,3],startangle = 45,autopct='%0.1f%%')
plt.ylabel('Children')
plt.title('Customer Children')plt.show()# 6)
MALE = data[data['sex']=='MALE']['income']
FEMALE = data[data['sex']=='FEMALE']['income']
plt.boxplot([FEMALE,MALE],labels=['FEMALE','MALE'])
plt.xlabel('[sex]')
plt.title('Boxplot grouped by sex income')
plt.grid(True)
plt.show()
dhu 数据科学与技术 第7次作业相关推荐
- dhu 数据科学与技术 第2次作业
一. 简答题(共2题,100分) (简答题, 50分) "大润发"."沃尔玛"."联华"和"农工商"四个超市都卖苹果.香 ...
- dhu 数据科学与技术 第1次作业
一. 简答题(共2题,100分) (简答题, 50分)编写Python程序实现以下功能:从键盘输入若干同学的姓名,保存在字符串列表中:输入某个同学的名字,检索是否已保存在列表中. list=[] ...
- 作者:程学旗(1972-),男,中国科学院计算技术研究所研究员、博士生导师、副所长,中国科学院网络数据科学与技术重点实验室主任。...
程学旗(1972-),男,中国科学院计算技术研究所研究员.博士生导师.副所长,中国科学院网络数据科学与技术重点实验室主任.中国计算机学会理事.大数据专家委员会秘书长,中国中文信息学会常务理事.信息检索 ...
- 作者:王海洋(1980-),男,中国科学院计算技术研究所网络数据科学与技术重点实验室、烟台中科网络技术研究所工程师。...
王海洋(1980-),男,中国科学院计算技术研究所网络数据科学与技术重点实验室.烟台中科网络技术研究所工程师,主要研究方向为数据采集.存储.检索.大数据存储管理等.
- 作者:程学旗,男,中国科学院计算技术研究所研究员、博士生导师,中国科学院“网络数据科学与技术”重点实验室主任。...
程学旗,男,中国科学院计算技术研究所研究员.博士生导师,中国科学院"网络数据科学与技术"重点实验室主任,目前主要从事网络数据科学和社会计算等研究领域的工作,主持和参与多项国家&qu ...
- 爬动漫网站数据_通过这三种动漫爱上数据科学和技术
爬动漫网站数据 Yes, it might seem weird to mention anime, data science, and technology in the same breath. ...
- 2020 年中科院计算所“计算未来”全国大学生暑期班 网络数据科学与技术重点实验室 机试试题
2020 年中科院计算所"计算未来"全国大学生暑期班网络数据科学与技术重点实验室 机试试题 前言 这是2021级计算所网数的推免机试,双机位.时间是两个半小时吧(不记得了) 我觉得 ...
- AI:人工智能领域主要方向(技术和应用)、与机器学习/深度学习的关系、数据科学关键技术与知识发现/数据挖掘/统计学/模式识别/神经计算学/数据库的关系(几张图理清之间的暧昧关系)
AI:人工智能领域主要方向(技术和应用).与机器学习/深度学习的关系.数据科学关键技术与知识发现/数据挖掘/统计学/模式识别/神经计算学/数据库的关系(几张图理清之间的暧昧关系) 目录 人工智能主要领 ...
- python数据科学常国珍_python数据科学:技术详解与商业实践
前言 章数据科学家的武器库 1.1数据科学的基本概念 1.2数理统计技术 1.2.1描述性统计分析 1.2.2统计推断与统计建模 1.3数据挖掘的技术与方法 1.4描述性数据挖掘算法示例 1.4.1聚 ...
最新文章
- 《经济学人》也谈 Python:它会是我们的未来吗?
- 如何使用PHP自动备份数据库
- python实例 79,80
- Linux下使用ps命令来查看Oracle相关的进程
- MySQL数据库基本用法-查询
- Oracle报错01756,oracle导入数据报错处理
- Atitit osi tcp ip 对应attilax总结
- Windows 10 RTM 官方正式版
- 什么是搜索引擎?搜索引擎有哪些?
- 【火星传媒深度】Coinbase:加密世界的“谷歌”
- ios开发eaaccessory案例_iOS App 连接外设的几种方式
- 70年代时尚偶像Bianca Jagger
- abaqus的python安装文件在哪_python - 在ABAQUS 6.14 python环境中安装熊猫 - 堆栈内存溢出...
- freemarker模板注入
- 解决Echarts柱形图正负数在同一侧,并设置正负值不同颜色
- 家里宽带628连不上_win7系统宽带连接提示错误628的解决方法
- 用计算机绘图的注意事项,计算机绘图实践心得.doc
- 微信小程post问题
- Alist简单使用指南
- jmeter获取token并请求失败Internal authentication failed 400
热门文章
- 新加坡首富张勇的烦恼
- php里 没temp文档 如何创建temp文档 win7,Win7更改Temp文件夹存储位置的操作方法
- matlab 局部放大
- 数据湖产品国内重点厂商介绍
- JS中操作<select>标签选的值
- 本量利分析计算机,2017年自学考试(管理会计(一))知识点复习:成本性态分析和变动成本法--本量利分析的应用[经营杠杆在利润预测中的应用]...
- 著名数据恢复工具有哪些是好用的
- 天道酬勤系列之C++ 循环介绍
- socket通过http上传下载
- PS工作区拖动乱了如何复位?