一. 简答题(共1题,100分)

  1. (简答题, 100分)
    文件bankpep.csv存放着银行储户的基本信息,数据格式如表4-7所示。

    通过绘图对这些客户数据进行可视化分析。
    (1)客户年龄分布的直方图和密度图(见图4-25)。
    (2)客户年龄和收入关系的散点图(见图4-26)。

    图4-25 客户年龄分布

    图4-26 按客户年龄和收入关系绘制的散点图

(3)绘制散点图观察客户(年龄、收入、孩子数)之间的关系,用对角线显示直方图(见图4-27)。
(4)按区域展示平均收入的柱状图,并显示标准差(见图4-28)。

图4-27 按客户年龄、收入、孩子数关系绘制的散点矩阵

图4-28 各区域客户的平均收入

(5)多子图绘制:客户中性别占比饼图,有车客户的性别占比饼图,按孩子数的客户占比饼图(见图4-29)。
(6)各性别、收入绘制的箱形图(见图4-30)。

图4-29 按性别、有车客户的性别、孩子数占比绘制的饼图

图4-30 按性别、收入绘制的箱形图
bankpep.csv

解题

import matplotlib.pyplot as plt
import pandas as pd
from pandas import DataFrame
import numpy as np
import matplotlibdata = pd.read_csv('C:\\python\\bankpep.csv')# 1)
plt.hist(data['age'],bins=10,density=True)
data['age'].plot(kind='kde')
plt.title('Customer Age')
plt.xlabel('Age')
plt.ylabel('Density')
plt.show()# 2)
plt.scatter(data['age'],data['income'],label = '(age,income)',marker=',',s=7)
plt.grid(True)
plt.xlim(0,80)
plt.title('Customer Income')
plt.legend()
plt.xlabel('Age')
plt.ylabel('Income')
plt.show()# 3)
pd.plotting.scatter_matrix(data[['age','income','children']])
plt.show()# 4)
mean = data.groupby(['region']).agg({'income':np.mean})
std = data.groupby(['region']).agg({'income':np.std})
plt.bar(mean.index,mean.income,yerr=std.income,width=0.6)
plt.xlabel('Recion')
plt.title('Customer Income')
plt.xticks(rotation=45)
plt.show()# 5)
fig=plt.figure(figsize=(6,6))ax1=fig.add_subplot(2,2,1)
list1=data.groupby(['sex'])['sex'].count()
plt.pie(list1,labels=['FEMALE','MALE'],startangle = 45,autopct='%0.1f%%')
plt.ylabel('sex')
plt.title('Customer Sex')ax2=fig.add_subplot(2,2,2)
list1=data[data['car'] =='YES'].groupby(['sex'])['sex'].count()
plt.pie(list1,labels=['FEMALE','MALE'],startangle = 45,autopct='%0.1f%%')
plt.ylabel('sex')
plt.title('Customer Car Sex')ax3=fig.add_subplot(223)
list1=data.groupby(['children'])['children'].count()
plt.pie(list1,labels=[0,1,2,3],startangle = 45,autopct='%0.1f%%')
plt.ylabel('Children')
plt.title('Customer Children')plt.show()# 6)
MALE = data[data['sex']=='MALE']['income']
FEMALE = data[data['sex']=='FEMALE']['income']
plt.boxplot([FEMALE,MALE],labels=['FEMALE','MALE'])
plt.xlabel('[sex]')
plt.title('Boxplot grouped by sex income')
plt.grid(True)
plt.show()

dhu 数据科学与技术 第7次作业相关推荐

  1. dhu 数据科学与技术 第2次作业

    一. 简答题(共2题,100分) (简答题, 50分) "大润发"."沃尔玛"."联华"和"农工商"四个超市都卖苹果.香 ...

  2. dhu 数据科学与技术 第1次作业

    ​ 一. 简答题(共2题,100分) (简答题, 50分)编写Python程序实现以下功能:从键盘输入若干同学的姓名,保存在字符串列表中:输入某个同学的名字,检索是否已保存在列表中. list=[] ...

  3. 作者:程学旗(1972-),男,中国科学院计算技术研究所研究员、博士生导师、副所长,中国科学院网络数据科学与技术重点实验室主任。...

    程学旗(1972-),男,中国科学院计算技术研究所研究员.博士生导师.副所长,中国科学院网络数据科学与技术重点实验室主任.中国计算机学会理事.大数据专家委员会秘书长,中国中文信息学会常务理事.信息检索 ...

  4. 作者:王海洋(1980-),男,中国科学院计算技术研究所网络数据科学与技术重点实验室、烟台中科网络技术研究所工程师。...

    王海洋(1980-),男,中国科学院计算技术研究所网络数据科学与技术重点实验室.烟台中科网络技术研究所工程师,主要研究方向为数据采集.存储.检索.大数据存储管理等.

  5. 作者:程学旗,男,中国科学院计算技术研究所研究员、博士生导师,中国科学院“网络数据科学与技术”重点实验室主任。...

    程学旗,男,中国科学院计算技术研究所研究员.博士生导师,中国科学院"网络数据科学与技术"重点实验室主任,目前主要从事网络数据科学和社会计算等研究领域的工作,主持和参与多项国家&qu ...

  6. 爬动漫网站数据_通过这三种动漫爱上数据科学和技术

    爬动漫网站数据 Yes, it might seem weird to mention anime, data science, and technology in the same breath. ...

  7. 2020 年中科院计算所“计算未来”全国大学生暑期班 网络数据科学与技术重点实验室 机试试题

    2020 年中科院计算所"计算未来"全国大学生暑期班网络数据科学与技术重点实验室 机试试题 前言 这是2021级计算所网数的推免机试,双机位.时间是两个半小时吧(不记得了) 我觉得 ...

  8. AI:人工智能领域主要方向(技术和应用)、与机器学习/深度学习的关系、数据科学关键技术与知识发现/数据挖掘/统计学/模式识别/神经计算学/数据库的关系(几张图理清之间的暧昧关系)

    AI:人工智能领域主要方向(技术和应用).与机器学习/深度学习的关系.数据科学关键技术与知识发现/数据挖掘/统计学/模式识别/神经计算学/数据库的关系(几张图理清之间的暧昧关系) 目录 人工智能主要领 ...

  9. python数据科学常国珍_python数据科学:技术详解与商业实践

    前言 章数据科学家的武器库 1.1数据科学的基本概念 1.2数理统计技术 1.2.1描述性统计分析 1.2.2统计推断与统计建模 1.3数据挖掘的技术与方法 1.4描述性数据挖掘算法示例 1.4.1聚 ...

最新文章

  1. 《经济学人》也谈 Python:它会是我们的未来吗?
  2. 如何使用PHP自动备份数据库
  3. python实例 79,80
  4. Linux下使用ps命令来查看Oracle相关的进程
  5. MySQL数据库基本用法-查询
  6. Oracle报错01756,oracle导入数据报错处理
  7. Atitit osi tcp ip 对应attilax总结
  8. Windows 10 RTM 官方正式版
  9. 什么是搜索引擎?搜索引擎有哪些?
  10. 【火星传媒深度】Coinbase:加密世界的“谷歌”
  11. ios开发eaaccessory案例_iOS App 连接外设的几种方式
  12. 70年代时尚偶像Bianca Jagger
  13. abaqus的python安装文件在哪_python - 在ABAQUS 6.14 python环境中安装熊猫 - 堆栈内存溢出...
  14. freemarker模板注入
  15. 解决Echarts柱形图正负数在同一侧,并设置正负值不同颜色
  16. 家里宽带628连不上_win7系统宽带连接提示错误628的解决方法
  17. 用计算机绘图的注意事项,计算机绘图实践心得.doc
  18. 微信小程post问题
  19. Alist简单使用指南
  20. jmeter获取token并请求失败Internal authentication failed 400

热门文章

  1. 新加坡首富张勇的烦恼
  2. php里 没temp文档 如何创建temp文档 win7,Win7更改Temp文件夹存储位置的操作方法
  3. matlab 局部放大
  4. 数据湖产品国内重点厂商介绍
  5. JS中操作<select>标签选的值
  6. 本量利分析计算机,2017年自学考试(管理会计(一))知识点复习:成本性态分析和变动成本法--本量利分析的应用[经营杠杆在利润预测中的应用]...
  7. 著名数据恢复工具有哪些是好用的
  8. 天道酬勤系列之C++ 循环介绍
  9. socket通过http上传下载
  10. PS工作区拖动乱了如何复位?