文章目录数据获取、结构分析如何获取seaborn提供数据源

特征列分析

缺失值与数据清洗年龄缺失值处理

填充embarked

删除不必要的列

幸存者分析分析性别对存活率的影响

分析年龄对存活率影响

分析舱位等级与存活率影响

数据获取、结构分析

如何获取seaborn提供数据源

在python中基本所有的核心库都提供了自己的数据源,例如:seaborn、sklearn、tensorflow… 而且这些数据源基本都托管在github中,如果想了解获取数据原理,单击load_dataset源码就可以看到数据的下载地址。

通过github下载数据如下, 如果数据量比较大可以保存到本地的csv格式

特征列分析在此套课程中我们仅仅讲解关于特征列的清洗、数据分析、列的缺失、异常值处理等… 后续在机器学习课程中还会讲解到特征工程、PCA主特征分析等重要概念。Survived: 生存情况,0代表不幸遇难,1代表存活;

Pclass: 仓位等级,1为一等舱,2为二等舱,3为三等舱;

Name: 乘客姓名;

Sex: 性别;

Age: 年龄;

SibSp: 乘客在船上的兄妹姐妹数/配偶数(即同代直系亲属数)

Parch: 乘客在船上的父母数/子女数(即不同代直系亲属数);

Ticket: 船票编号;

Fare: 船票价格;

Embarked: 登船港口 (S: Southampton; C: Cherbourg Q: Queenstown)

alive:活着

alone:单身

缺失值与数据清洗

年龄缺失值处理

填充embarked

删除不必要的列一般我们会把不重要的列,缺失值比较多的列删除掉。

幸存者分析

分析性别对存活率的影响虽然男士体力较好,但是在这次海难中体现了绅士风度,把生存的机会留给了女士,所以性别对存活率影响比较大

分析年龄对存活率影响由于年龄是连续型的数据, 连续型数据不方便分组,因此建议编写一个函数让连续型数据转化为离散型数据

分析舱位等级与存活率影响

泰坦尼克号python数据分析统计服_数据分析可视化——泰坦尼克号幸存者分析(上)...相关推荐

  1. python excel 数据分析统计服_数据分析从入门到进阶(透彻讲解EXCEL.SQL.TABLEAU、PYTHON四项数据分析必会工具.免费提供1GB数据集...

    透彻讲解Excel.SQL.Tableau.Python四项数据分析必会工具,数据分析工作者的案头推荐工具书.系统介绍数据分析的策略.方法(数据分析之道):实例讲解引导.快速掌握数据分析工具(数据分析 ...

  2. 转行学python 数据分析统计服_转行数据分析,你准备好了吗?

    前言 笔者从去年5月份下定决心离开汽车制造行业,6月份开始学习Udacity的DAND(Data Analysis Nano Degree, 数据分析纳米学位)课程至今.历经10个月挑灯苦读和1个月四 ...

  3. python与金融数据分析统计服_作为一名量化金融分析师,你知道在量化金融中有多少个Python数据分析库嘛?...

    作为一名量化金融分析师,好用的工具非Python莫属了.为什么呢?Python也算得上是比较常用的编程语言,其效率和代码可读性是不容小觑的.作为一个科学数据的编程语言,Python介于R和java之间 ...

  4. python r语言 数据分析统计服_【分享】Python和R语言的数据分析/挖掘工具互查

    数极客,拥有16种数据分析模型的新一代用户行为分析平台! 写在前面 在此总结一些在数据分析/挖掘中可能用到的功能,方便大家索引或者从一种语言迁移到另一种.当然,这篇博客还会随时更新(不会另起一篇,为了 ...

  5. 基于python的气象数据分析统计服_基于Python的风向风速数据分析的设计与实现

    基于 Python 的风向风速数据分析的设计与实现 李文倩 ; 刘婕 [期刊名称] < <信息通信> > [年 ( 卷 ), 期] 2019(000)009 [摘要] Pyth ...

  6. python篮球比赛预测数据分析统计服_用python基于2015-2016年的NBA常规赛及季后赛的统计数据分析...

    nba球队的Elo score计算 特征向量 逻辑回归 python2.7 Xfce终端 python2.7 Xfce终端 本次课程我们将按照下面的流程实现NBA比赛数据分析的任务: 获取比赛统计数据 ...

  7. 泰坦尼克号python数据分析统计服_Titanic数据分析报告(Python)

    研究目的:使用机器学习来创建一个模型,该模型可以预测哪些乘客在泰坦尼克号沉船事故中幸存下来. 研究结论: 分析过程: 本次分析使用Jupter Notebook进行分析 该notebook 服务的版本 ...

  8. 泰坦尼克号python数据分析统计服_泰坦尼克号乘客数据分析

    本文是优达学城数据分析师 P2 项目的结课报告,主要探寻泰坦尼克号上的生还率和各因素(客舱等级.年龄.性别.上船港口等)的关系. # Imports import numpy as np import ...

  9. 泰坦尼克号python数据分析统计服_Python-数据可视化案例分析之泰坦尼克号(二)...

    在第一节"Python-数据清洗与分析案例之泰坦尼克号(一)"网址:https://www.lixdx.cn/archives/93 中进行了数据清洗与缺失值填充,接下来进行数据可 ...

最新文章

  1. Android之玩转MPAndroidChart让(折线图、柱形图、饼状图、散列图、雷达图)优雅的舞...
  2. Ventoy 制作可启动 U 盘的开源工具
  3. C++:迭代器(STL迭代器)iterator详解
  4. 【星球知识卡片】移动端高效率的分组网络都发展到什么程度了?
  5. silverlight ListBox 多列图片效果
  6. GHOST装双系统图文教程
  7. 选择您的Java EE 6应用服务器
  8. linux 下搭建yolov3错误,Ubuntu20.04+cuda11.1+yolo3 目标检测 深度学习系统 真正从0搭建 包含各类可能遇到的错误...
  9. 2011 - 12 - 12记录2011 - 12 - 11
  10. linux设备驱动 注册 命令6,Linux设备驱动调试
  11. 在ubuntu下安装openjdk
  12. WebBrowser怎么指定ie内核
  13. Android自定义view 滑动开关 支持左右滑动 适用于listview
  14. vb.net 实现图片圆形渐变模糊
  15. 精准医学:NGS和MFC方法在多发性骨髓瘤MRD评估中的比较|预后监测
  16. helm3 使用国内原安装Weave Scope
  17. BrowserslistError:E\ysg_front contains both .browserslistrc and browserslist
  18. LVS模式一:DR模式(ipvsadm)
  19. 使用海康摄像头实现实时监控
  20. 基于matlab的史密斯圆图演示仿真图

热门文章

  1. Android 5.0系统特性全解析
  2. python显示代码运行时间_python测量代码运行时间方法
  3. TOOD: Task-aligned One-stage Object Detection
  4. c语言第五次上机作业,大连理工c语言第五次上机作业参考答案(5页)-原创力文档...
  5. 国内主流云服务器价格概览
  6. Excel插件:按范围查找,按格式查找,标示相同值
  7. 《繁荣的真相》读书笔记
  8. 浙大版《C语言程序设计(第3版)》题目集习题4-11 兔子繁衍问题 (15 分)
  9. 史上最全BigDecimal的5种进位方式:ROUND_UP,ROUND_DOWN,ROUND_CEILING,ROUND_FLOOR,ROUND_HALF_UP,ROUND_HALF_DOWN的比较
  10. LA 6657 GCD XOR