12.

章节

12 -

结论和步骤

7:

优化和战略

如何使用本教程

:

请阅读本内核中提供的解释和相关链接。我们的目标不只是知道

是什么

,还要知道

为什么

如果您不理解代码中的某些内容,那么

print()

函数是您最好的朋友。在编码中,尝试、失败、再尝试都是必要的

过程。如果你遇到了问题,谷歌是你的第二个好朋友,因为

99.99%

的情况下,其他人都有相同的问题,并且已经

向编码社区询问过了。如果您已经尝试了所有资源而无果,

Kaggle

社区通过论坛和评论也可以提供帮助。

第一章

数据科学家如何战胜困难

泰坦尼克是一个经典问题,预测一个二元事件的结果。通俗地说,这意味着它要么发生了,要么没有发生。例

如,你赢了或没赢,你通过了测试或没通过测试,你被接受或没被接受。常见的业务应用是预测客户流失或客户

保留,另一个应用较广泛的是医疗事件的死亡率或生存分析。二进制事件会产生一种有趣的事情,就是根据统

计,随机猜测的准确率应该达到

50%

,而不需要创建一个单独的算法或编写一行代码,然而,有时我们建立的算

法可能准确率还达不到

50%

。在这个内核中,我使用

Kaggle

的入门竞赛

——

泰坦尼克

:

从灾难中机器学习,带领读

者一步一步使用数据科学框架来解决问题。

第二章

数据科学框架

1.

定义问题:

如果说类似数据科学、大数据、机器学习、预测分析、商业智能等流行词是解决方案,那问题是

什么

?

科学的框架是不能本末倒置的。问题先于需求,需求先于解决方案,解决方案先于设计,设计先于技

术。我们不能在决定我们要解决的实际问题之前,就急于采用新的高级的技术、工具或算法。

Learning

from

Disaster

)

经典教程

泰坦尼克号:从灾难中机器学习(

Titanic:

Machine

教程提供了清晰的解释、干净的代码和大量的资源链接。

入门。通过学习这个框架,你不仅能够提交你的第一个竞赛,还能够解决任何抛给你的问题。本

供一个框架,教你如何像数据科学家一样思考,而不是思考什么或编写什么代码,从而让你更快

在这个领域中迷失了方向,因为他们陷入了黑盒方法,使用他们不理解的库和算法。本教程将提

这是一个经典案例,来源于

Kaggle

,一个在线学习、共享和竞争的数据科学社区,很多数初学者

python泰坦尼克号案例分析_泰坦尼克Python经典案例相关推荐

  1. 决策树分析_泰坦尼克数据

    决策树分析: 用泰坦尼克数据中的pclass,sex,age作为决策属性,Survived作类别属性,30%的数据作为测试集,70%作为训练集.用程序得到该数据集的决策树模型,并给出测试数据的准确度. ...

  2. 消费者洞察案例分析_情绪搜索洞察定时器案例研究

    消费者洞察案例分析 We're in the midst of a worldwide pandemic and could all use a few moments of peace. Enter ...

  3. 如何用python进行相关性分析_如何利用python进行时间序列分析

    题记:毕业一年多天天coding,好久没写paper了.在这动荡的日子里,也希望写点东西让自己静一静.恰好前段时间用python做了一点时间序列方面的东西,有一丁点心得体会想和大家分享下.在此也要特别 ...

  4. python古诗词风格分析_如何用Python 制做词云-对1000首古诗作词云分析

    今天来介绍一下如何使用 Python 制做词云.python 词云又叫文字云,它能够统计文本中频率较高的词,并将这些词可视化,让咱们能够直观的了解文本中的重点词汇.git 词的频率越高,词显示的大小也 ...

  5. python酒店评论分析_手把手用Python网络爬虫带你爬取全国著名高校附近酒店评论...

    点击蓝色"Python空间"关注我丫 加个"星标",每天一起快乐的学习 今 日 鸡 汤 我站在鼓楼下边,一切繁华与我无关. /1 前言/ 简介:本文介绍如何用p ...

  6. python彩票结果分析_即将放弃Python 2.7的不止有Numpy,还有pandas和这些工具

    原标题:即将放弃Python 2.7的不止有Numpy,还有pandas和这些工具 机器之心报道 参与:黄小天.路雪.李泽南 最近,Numpy 团队的一份声明引发了数据科学社区的关注:这一科学计算库即 ...

  7. python彩票结果分析_天啦噜!Python多线程居然是骗人的?

    Python解释执行原理 我是一个Python线程,我的工作就是解释执行程序员编写的Python代码. 之所以说是解释执行,是因为Python是高级语言,CPU那家伙不认识Python代码,需要运行的 ...

  8. 如何用python进行相关性分析_如何在python中检查连续变量和分类变量之间的相关性?...

    将分类变量转换为虚拟变量,并将变量放在numpy.array中.例如: data.csv:age,size,color_head 4,50,black 9,100,blonde 12,120,brow ...

  9. 大数据外部性案例分析_外部性案例分析

    外部性案例分析 [篇一:外部性案例分析] 各位同学: 牛年好! 以下是一篇讨论外部性(公共经济学的主要内 容) 的 精彩案例分析. 希望假期有空各位读读, 通过此案例 同学们可以发现现代公共经济 学的 ...

最新文章

  1. ubuntu java反编译,[原创]Ubuntu下简单配置反编译工具以及其开发环境
  2. Multithreading in Java
  3. Rsync 3.1.0 发布,文件同步工具
  4. 迎合人工智能时代 码教授开设Python课程
  5. 分析遇到非正态数据该怎么办?
  6. 蚂蚁金服疯了吗?大动作,非裁员,年底全员涨薪又涨假期!!!
  7. [18]Debian Linux Install GNU GCC Compiler and Development Environment
  8. android插件化之路
  9. BOM对象有哪些,列举window对象?
  10. 2015计算机二级office真题,2015年计算机二级office题库及答案
  11. win10下载CAD之后任务栏卡死
  12. 微服务调用Ribbon负载均衡、Feign的使用
  13. keras之分类问题和回归问题
  14. rocketmq 消息删除_清空rocketmq消息方法
  15. OpenCVSharp学习(十二):图片的逻辑运算
  16. quartz2.2.3 spring整合遇到的错误,及quartz配置文件说明
  17. repost 双非本科到腾讯的编程奋斗之路
  18. 基于51单片机密码锁-舵机开锁-CXM
  19. CVPR 2018 | 鸡尾酒网络DCTN:源分布结合律引导的迁移学习框架
  20. @RunWith(SpringJUnit4ClassRunner.class)报错

热门文章

  1. 1024分辨率《X战警:第一战》BD中英双字无水印
  2. pageoffice在Edge浏览器、谷歌浏览器42及以上版本和火狐浏览器52及以上版本兼容处理
  3. Linux系统学习笔记二
  4. 我回来了,“纵使日薄西山”
  5. week11——实验(月模拟题3:CSP201609 03)
  6. python井字棋_python实现简单井字棋游戏
  7. 【Monkey测试】手机app测试性能测试,Monkey测试详解(全)
  8. 音圈电机工作原理与直线电机的对比
  9. Jarvisoj_WP
  10. Android中监听Home键的4种方法总结