1 初心

本系列笔记用于记录自己第一次参加Datawhale的组队学习。自己马上开启研究生学习生涯,因此熟练掌握数据分析这一重要技能对未来的学习能够提供很大的帮助,Datawhale团队在项目初衷里说数据分析是一个要从一堆数字中看到真相的过程。学会操作数据只是数据分析的一半功力,剩下的另一半要用我们的大脑,多多思考,多多总结,更要多动手,实打实的的敲代码。所以也希望在学习这门课时,多去推理,多去问问为什么;多多练习,确保理论实践结合起来,在课程结束的时候一定会有大收获。

因此希望自己再接下来的11天里面能够实事求是、脚踏实地完成各项任务,提高自己的硬实力。

特别喜欢一句话:也许不负光阴就是最好的努力,而努力就是最好的自己。

学习内容: 回顾学习完第一章,我们对泰坦尼克号数据有了基本的了解,也学到了一些基本的统计方法,第二章中我们学习了数据的清理和重构,使得数据更加的易于理解;今天我们要学习的是第二章第三节:数据可视化,主要给大家介绍一下Python数据可视化库Matplotlib,在本章学习中,你也许会觉得数据很有趣。在打比赛的过程中,数据可视化可以让我们更好的看到每一个关键步骤的结果如何,可以用来优化方案,是一个很有用的技巧。

2 数据可视化

开始之前导入numpy、pandas包和数据

%matplotlib inline
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

导入result.csv这个文件

text = pd.read_csv(r'result.csv')
text.head()

可视化展示泰坦尼克号数据集中男女中生存人数分布情况(用柱状图试试)。

sex = text.groupby('Sex')['Survived'].sum()
sex.plot.bar()
plt.title('survived_count')
plt.show()


可视化展示泰坦尼克号数据集中男女中生存人与死亡人数的比例图(用柱状图试试)

text.groupby(['Sex','Survived'])['Survived'].count().unstack().plot(kind='bar',stacked='True')
plt.title('survived_count')
plt.ylabel('count')


可视化展示泰坦尼克号数据集中不同票价的人生存和死亡人数分布情况。(用折线图试试)(横轴是不同票价,纵轴是存活人数)

fare_sur = text.groupby(['Fare'])['Survived'].value_counts().sort_values(ascending=False)
fare_sur


排序后绘折线图

fig = plt.figure(figsize=(20, 18))
fare_sur.plot(grid=True)
plt.legend()
plt.show()


排序前绘折线图

fare_sur1 = text.groupby(['Fare'])['Survived'].value_counts()
fare_sur1

fig = plt.figure(figsize=(20, 18))
fare_sur1.plot(grid=True)
plt.legend()
plt.show()


可视化展示泰坦尼克号数据集中不同仓位等级的人生存和死亡人员的分布情况。(用柱状图试试)

pclass_sur = text.groupby(['Pclass'])['Survived'].value_counts()
pclass_sur

import seaborn as sns
sns.countplot(x="Pclass", hue="Survived", data=text)


可视化展示泰坦尼克号数据集中不同年龄的人生存与死亡人数分布情况。(不限表达方式)

facet = sns.FacetGrid(text, hue="Survived",aspect=3)
facet.map(sns.kdeplot,'Age',shade= True)
facet.set(xlim=(0, text['Age'].max()))
facet.add_legend()


可视化展示泰坦尼克号数据集中不同仓位等级的人年龄分布情况。(用折线图试试)

text.Age[text.Pclass == 1].plot(kind='kde')
text.Age[text.Pclass == 2].plot(kind='kde')
text.Age[text.Pclass == 3].plot(kind='kde')
plt.xlabel("age")
plt.legend((1,2,3),loc="best")

动手学数据分析(四)- 数据可视化相关推荐

  1. 动手学数据分析——Task01_数据加载

    前言 这是一门诞生于datawhale的课程,学习它的时候搭配datawhale所配备其他资源会更好,项目地址:https://github.com/datawhalechina/hands-on-d ...

  2. 动手学数据分析task01 数据加载及探索性数据分析(笔记)

    一.数据载入及初步观察 1. 载入数据 1.1 打开JupyterLab 导入numpy.pandas 1.2 使用绝对路径.相对路径载入数据 首先,使用path1=os.path.abspath(' ...

  3. 动手学数据分析:数据载入与初步观察

    数据载入及初步观察 1 第一章:数据载入及初步观察 1.1 载入数据 1.1.1 任务一:导入numpy和pandas 1.1.2 任务二:载入数据 1.1.3 任务三:每1000行为一个数据模块,逐 ...

  4. 动手学数据分析-数据可视化

    动手学数据分析-数据可视化 全部参考 datawhale-动手学数据分析 开始前导入numpy和pandas import numpy as np import pandas as pd import ...

  5. 动手学数据分析(一)- 数据加载及探索性数据分析

    1 初心 本系列笔记用于记录自己第一次参加Datawhale的组队学习.自己马上开启研究生学习生涯,因此熟练掌握数据分析这一重要技能对未来的学习能够提供很大的帮助,Datawhale团队在项目初衷里说 ...

  6. 【组队学习】【32期】动手学数据分析

    动手学数据分析 航路开辟者:陈安东.金娟娟.杨佳达.老表.李玲.张文涛.高立业 领航员:范淑卷 航海士:武者小路.曾心怡 基本信息 内容属性:精品入门课系列 开源内容:https://github.c ...

  7. 【组队学习】【31期】动手学数据分析

    动手学数据分析 航路开辟者:陈安东.金娟娟.杨佳达.老表.李玲.张文涛.高立业 领航员:陈玉立 航海士:陈安东.武帅.肖涵哲.叶前坤.沈豪 基本信息 开源内容:https://github.com/d ...

  8. 【Datawhale】动手学数据分析

    动手学数据分析 第一章:数据载入及初步观察 载入数据 任务一:导入numpy和pandas import numpy as np import pandas as pd 任务二:载入数据 train_ ...

  9. Datawhale动手学数据分析打卡

    1.1 第一章:数据载入及初步观察 1.1.1 任务一:导入numpy和pandas import numpy as np import pandas as pd 1.1.2 任务二:载入数据 (1) ...

  10. Datawhale分组学习—动手学数据分析(五)

    Datawhale分组学习-动手学数据分析(五)主要是做数据建模以及模型评估.模型搭建部分:1)切分数据集为训练集和测试集:2)搭建逻辑回归模型或随机森林模型完成分类任务,通过不断调参来优化模型.模型 ...

最新文章

  1. 300米远程深度估计:港科大重磅开源自动驾驶深度感知新技术,远超现有雷达|CVPR2020...
  2. FPGA之道(79)静态时序分析(五)外部接口的相关时序分析
  3. python3爬虫初探(七)使用MySQL
  4. 小学数学动画 android,小学数学动画教学下载-小学数学动画 安卓版v5.0-pc6手机下载...
  5. Linux Enterprise Cluster选译
  6. HIVE--数据倾斜解决办法
  7. 超级计算机能算数学题吗,圆周率到底能不能算尽?人类拿超级计算机算了一下,结果不敢相信...
  8. Linux卸载Anaconda
  9. ffmpeg常用操作 - 录屏 - 转码
  10. 微信小程序支付 退款 订单查询 退款查询
  11. 微信小程序实现表情包编辑
  12. wim文件怎么安装系统 wim文件安装系统教程
  13. 疫情数据爬取,可视化及其预测
  14. 雷电2接口_“雷电3”接口知识大科普
  15. linux下制作windows启动盘,行家里手:Linux使用WoeUSB制作Windows启动盘
  16. Failure to find xxx in http://maven.aliyun.com/nexus/content/groups/public
  17. 学以致用、知行合一:实践论与工具论的统一
  18. python新式类c3算法_Python新式类的方法解析顺序MRO与Super
  19. java-php-python-ssm图书馆座位预约管理系统服务端计算机毕业设计
  20. 网络系统安全综合解决方案

热门文章

  1. No active profile set, falling back to default profiles: default问题
  2. 计算机如何安装cpu风扇,从零开始学装机 教你如何安装CPU风扇
  3. k8s 1.23 及keda 2.7.1 安装测试
  4. AWS RDS services
  5. 使用iTunes制作iPhone6s plus铃声
  6. android跳转到应用市场并进入指定包名的应用详情
  7. 怎样用阿里云搭建个人博客
  8. java操作数据库步骤_java数据库操作基本流程
  9. 前端进行身份证验证(详细)
  10. s3cmd配置bucket生命周期