一、数据来源

数据集来自于Kaggle。Kaggle是一个数据分析建模的应用竞赛平台。当然也可以从其它地方下。

二、相关工具

2.1 Python 3.5.2

2.2 Anaconda 3

三、牛刀小试

3.1 导入训练数据集

import pandas as pd

import numpy as np

from pandas import Series,DataFrame

f = open(r'E:\Python\数据分析\data\train.csv')

data_train = pd.read_csv(f)

对数据进行初步分析

data_train.describe()

运行结果如下:

进一步分析

data_train.info()

运行结果:

3.2 数据图像化分析

数据中的各个属性

import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif']=['SimHei']

fig = plt.figure()

fig.set(alpha=0.2)

plt.subplot2grid((2,3),(0,0))

data_train.Survived.value_counts().plot(kind='bar')

plt.title(u'获救情况(1为获就)')

plt.ylabel(u"人数")

plt.subplot2grid((2,3),(0,1))

data_train.Pclass.value_counts().plot(kind='bar')

plt.title(u"乘客等级分布")

plt.ylabel(u"人数")

plt.subplot2grid((2,3),(0,2))

plt.scatter(data_train.Survived,data_train.Age)

plt.ylabel(u"年龄")

plt.grid(b=True,which='major',axis='y')

plt.title(u"按年龄看获救分布(1为获救)")

plt.subplot2grid((2,3),(1,0),colspan=2)

data_train.Age[data_train.Pclass==1].plot(kind='kde')

data_train.Age[data_train.Pclass==2].plot(kind='kde')

data_train.Age[data_train.Pclass==3].plot(kind='kde')

plt.xlabel(u"年龄")

plt.ylabel(u"密度")

plt.title(u"各等级的乘客年龄分布")

plt.legend((u'头等舱', u'2等舱',u'3等舱'),loc='best')

plt.subplot2grid((2,3),(1,2))

data_train.Embarked.value_counts().plot(kind='bar')

plt.title(u"各登船口岸上船人数")

plt.ylabel(u"人数")

plt.show()

运行结果:

python泰坦尼克号案例分析_利用python对泰坦尼克号数据集进行分析相关推荐

  1. python做股票分析_利用Python进行股票投资组合分析(调试)

    pythonsp500-robo-advisor-edition Python for Financial Analyses 需要的镜像文件和数据--Robo Advisor edition. 小结 ...

  2. python实现情感分析_利用python实现简单情感分析

    最近选修的大数据挖掘课上需要做关于情感分析的pre,自己也做了一些准备工作,就像把准备的内容稍微整理一下写出来,下次再做类似项目的时候也有个参考. 情感分析是什么? 文本情感分析是指用自然语言处理(N ...

  3. python多元线性回归实例_利用Python进行数据分析之多元线性回归案例

    线性回归模型属于经典的统计学模型,该模型的应用场景是根据已知的变量(自变量)来预测某个连续的数值变量(因变量).例如,餐厅根据每天的营业数据(包括菜谱价格.就餐人数.预定人数.特价菜折扣等)预测就餐规 ...

  4. python做一个星座分析_利用python输出星座的方法

    利用python输出星座的方法 发布时间:2020-09-23 12:12:36 来源:亿速云 阅读:84 作者:小新 这篇文章将为大家详细讲解有关利用python输出星座的方法,小编觉得挺实用的,因 ...

  5. python制作电脑软件_利用PYTHON制作桌面版爬虫软件(一)

    抱歉,对长沙房地产数据的挖掘与分析[三],想了蛮久,觉得对自己的分析结果不是很理想.等我完善好了,我再发出来吧.今天继续开启新的一专题.主要讲解如何用PYTHON实现简单的桌面软件的制作. 题外话,我 ...

  6. python itchat 无法登录_利用python实现在微信群刷屏的方法

    hello,我是小小炽,这是我写的第一篇博客,写博客一直都想在写,但是苦于能力尚浅,在各位大牛面前那既然是关公面前耍大刀了,但是其实想来每一个大牛不也是从一个小白慢慢进步学习从而达到一定的高度的吗,而 ...

  7. python post请求 上传图片_利用python模拟实现POST请求提交图片的方法

    本文主要给大家介绍的是关于利用python模拟实现POST请求提交图片的方法,分享出来供大家参考学习,下面来一看看详细的介绍: 使用requests来模拟HTTP请求本来是一件非常轻松的事情,比如上传 ...

  8. python csdn博客_利用Python抓取CSDN博客

    这两天发现了一篇好文章,陈皓写的makefile的教程,具体地址在这里<跟我一起写makefile> 这篇文章一共分成了14个部分,我看东西又习惯在kindle上面看,感觉一篇一篇地复制成 ...

  9. python实现邮件客户端_利用python实现简单的邮件发送客户端示例

    脚本过于简单,供学习和参考.主要了解一下smtplib库的使用和超时机制的实现.使用signal.alarm实现超时机制. #!/usr/bin/env python # -*- coding: ut ...

  10. python制作图片墙_利用python生成照片墙的示例代码

    PIL(Python Image Library)是python的第三方图像处理库,但是由于其强大的功能与众多的使用人数,几乎已经被认为是python官方图像处理库了.其官方主页为:PIL. PIL历 ...

最新文章

  1. Android怎么自定义listview布局,android – 如何将listView标头添加为自定义布局
  2. 把一些11年老博客上的文章转移过来了
  3. SpringMVC框架 学习DAY_03:@RequestMapping注解/拦截器与过滤器
  4. Spark Streaming 执行流程
  5. 前滴滴出行产品经理刘飞:写给产品经理的说明书(上)
  6. 架构杂谈《八》Docker 架构
  7. 链表之删除链表a/b处的节点
  8. 后端视角下的前端框架之Vue.js初探
  9. 【软件开发底层知识修炼】十八 快速学习GDB调试五 使用GDB进行调试的一些小技巧
  10. [转]Java常用概念解答
  11. php 5.3.9 漏洞,PHP-5.3.9远程执行任意代码漏洞(CVE-2012-0830) 详解
  12. Ruby 和 Python 分析器是如何工作的?
  13. 数据归一化的作用--在svm 训练的时候特别有用
  14. android怎么查看方法被谁调用,Android中查看布局文件中的控件(view,id)在哪里被调用(使用)...
  15. java 运行注释_Java中的可执行注释
  16. 工具类网站推荐:实用工具汇总共30000个,速收藏
  17. 八皇后(韩顺平java)
  18. 微服务网关——设计篇
  19. 开源API查询IP地址归属信息
  20. linux下磁盘坏道修复,linux磁盘坏道修复记录

热门文章

  1. 后盾网-CI框架实例教程-马振宇 - 学习笔记(1~2)
  2. Guns二次开发目录
  3. 2009 中国协同软件机遇年?
  4. 五年饮冰,难凉热血”,一名专科生的求学历程
  5. ch4_3_5利用radon函数和iradon函数构造一个简单图像的投影并重建图像.m
  6. 计算机炫酷功能,【实用】上班族必备!10个实用电脑炫酷小技巧~
  7. 改变Ubuntu18.04初始键盘布局
  8. IMAP4 读取收件箱的问题
  9. JavaScript学习之面向对象编程-04
  10. pmp效益管理计划和做题技巧