作为零基础非科班的学生,我从去年保研结束敲定下家后,决心系统地学习一下开始接触机器学习的知识,因此报名了uda家的网课。uda家的课最大的特点是设计精良和贵……值得一提的是某些公司的面试题就是uda家的项目原题……

设计精良主要有以下几点:

1。为了提高用户交互体验,刻意设计成了4,5分钟一个短片知识点或者一个小quiz,提醒用户这是在上课。

2。独特的part代码审阅+review机制

现在主要来谈谈每个章节的故事,首先我们P0拿到的是泰坦尼克生存预测项目,这在kaggle上是一个入门项目,在uda里主要使用python来完成。在这个项目中要求我们利用乘客数据预测乘客的生存率,数据格式如下:Survived:是否存活(0代表否,1代表是)

Pclass:社会阶级(1代表上层阶级,2代表中层阶级,3代表底层阶级)

Name:船上乘客的名字

Sex:船上乘客的性别

Age:船上乘客的年龄(可能存在 NaN)

SibSp:乘客在船上的兄弟姐妹和配偶的数量

Parch:乘客在船上的父母以及小孩的数量

Ticket:乘客船票的编号

Fare:乘客为船票支付的费用

Cabin:乘客所在船舱的编号(可能存在 NaN)

Embarked:乘客上船的港口(C 代表从 Cherbourg 登船,Q 代表从 Queenstown 登船,S 代表从 Southampton 登船)

当作为一个数据小白时,我们第一时间应该先观察数据,比如使用

# 加载数据集

in_file = 'titanic_data.csv'

full_data = pd.read_csv(in_file)

# 显示数据列表中的前几项乘客数据

display(full_data.head())

可以得到:

通过观察数据特征我们可以知道,这个表格记录的乘客信息是比较全面的,和我们常见的机票一样,同时也可以使用最简单的预测练练手:

最简单的预测

如果我们要预测泰坦尼克号上的乘客是否存活,但是我们又对他们一无所知,那么最好的预测就是船上的人无一幸免。

def predictions_0(data):

""" 不考虑任何特征,预测所有人都无法生还 """

predictions = []

for _, passenger in data.iterrows():

# 预测 'passenger' 的生还率

predictions.append(0)

# 返回预测结果

return pd.Series(predictions)

# 进行预测

predictions = predictions_0(data)

结果只有:61.62%,不是很高。然后项目又要求根据某一个特征进行预测,比如考虑性别的情况,先要求绘制了一个关于性别和最终遇难与否的图:

我们就可以发现男性大多数都遇难了,女性里大多数都存活了,因此我们假如做一个推断,男性全部都遇难,女性全部存活,那么正确率将可以达到:78.68%

然后项目又要求考虑两个特征进行预测:我们在这里加入年龄考虑,先绘制不同年龄的男性生存遇难情况:

survival_stats(data, outcomes, 'Age', ["Sex == 'male'"])

我们就可以发现小于10岁的男孩基本都存活了,因此我们可以额外增加一条逻辑,如果男性小于10岁,肯定是存活的。此时正确率已经攀升到79.35%.

最后项目要求自己额外选择特征,适用条件逻辑语句,让正确率达到80%以上:

你自己的预测模型

添加年龄(Age)特征与性别(Sex)的结合比单独使用性别(Sex)也提高了不少准确度。现在该你来做预测了:找到一系列的特征和条件来对数据进行划分,使得预测结果提高到80%以上。这可能需要多个特性和多个层次的条件语句才会成功。你可以在不同的条件下多次使用相同的特征。Pclass,Sex,Age,SibSp 和 Parch 是建议尝试使用的特征。

使用 survival_stats 函数来观测泰坦尼克号上乘客存活的数据统计。

最后在mentor的建议下,我达到了81.82%,思路与前文一样,大致来讲是这样的:

1.观察每个特征与存活的关系,发现年龄、性别,客舱等级,有无兄弟姐妹,有无父母子女的区分性较好 2.发现两两特征中,年龄,性别与有无兄弟姐妹和有无父母子女关联性较大,比较准确率后,选择有无兄弟姐妹 3.对每个客舱等级分析后,针对不同客舱等级比较讨论 4.选择不同的年龄区段和性别,找出特征值明显的区域

其中还挑了大于10岁的头等舱的男性作为可视化展示:

survival_stats(data, outcomes, 'Age',["Sex == 'male'","Pclass == 1","Age > 10"])

通篇来讲,这个项目给“0coding”基础的人来说,是很好的练习项目,项目本身从简单到复杂,主要锻炼了制作一些基本数据图和基本语句的能力,尤其是几个可视化图画得非常好。后续我来继续讲讲后面的项目实现

python人工智能入门纳米学位_项目心得-Udacity机器学习纳米学位项目(一)相关推荐

  1. python人工智能入门纳米学位_最近看到udacity的纳米学位很火,号称学完可以找到工作了,这是真的吗?...

    2018年二月更新: 刷完了Coursera的Deep Learning Specialization,Coursera吃了大约二十几门Coding.Data Science的硬课(包括传说中的PGM ...

  2. python人工智能入门零基础_【贾老坏】真·零基础入门人工智能+Python+数学

    [贾老坏]是一个系列公开课,从 Python 最基础的语法讲起,专为"从没接触过编程的小白"打造! 循序渐进,最短时间搞定数学.编程.算法等人工智能研发需要的所有基础! 搭载最新. ...

  3. python人工智能入门零基础_零基础如何入门人工智能?

    别入了吧. 人工智能这么火,每年都有各种专业的转过来,还有各种培训机构放出来的21天速成妖魔鬼怪. 要不是我亲眼见到自称着掌握AI所有技术,实际连线性代数都不会的大佬,都不敢相信. 这些人会什么呢? ...

  4. 哈佛大学(2020)《CS50 Python人工智能入门》课程资料下载

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! [导读]本课程探讨现代人工智能基础上的概念和算法,深入探讨游戏引擎.手写识别和机器 ...

  5. 人工智能入门第一课:手写字体识别及可视化项目(手写画板)(mnist)

    人工智能入门第一课:手写字体识别及可视化项目(手写画板)(mnist),使用技术(Django+js+tensorflow+html+bootstrap+inspinia框架) 直接上图,项目效果 1 ...

  6. python人工智能入门纳米学位_学习笔记(一) - 机器学习纳米学位

    不久前我在Udacity报名了数据分析和机器学习两门纳米课程.之所以对这个感兴趣是因为关注人工智能方面的资讯有一段时间了,觉得这是未来的趋势,希望今后能够在这方面有所成绩.选择纳米课程是因为我觉得它与 ...

  7. python人工智能方向面试准备_人工智能入门学习路线及就业面试

    [主讲老师]菜鸟窝人工智能&大数据讲师@chris 阿里算法专家,7年+算法从业经验,曾领导搭建某上市游戏平台算法团队,在智能数据.机器学习.深度学习算法落地等方向有丰富的实践经验,全面覆盖涵 ...

  8. 优达学城 python 人工智能入门_有人报过优达学城的人工智能入门小班吗,真的有用吗?...

    先自报家门,文科生,研究生学的管理,已过而立之年,0基础. 按要求回答你的问题: 1.人工智能就业前景.说实话,我刚人工智能基础毕业,现在在学深度学习,所以还没转型,暂时还不知道.但是我知道,现在经济 ...

  9. python人工智能方向怎么学_如何学习人工智能

    人工智能(Artificial Intelligence),英文缩写为AI它是研究.开发用于模拟.延伸和扩展人的智能的理论.方法.技术及应用系统的一门新的技术科学.现在随着时代的发展,AI的应用也越来 ...

最新文章

  1. MYsql 查询 查询当前月份的数据
  2. shell下的进度条和最大最小平均值
  3. 对飞行前请求的响应未通过访问控制检查:它没有http ok状态。_对不起,看完这篇HTTP,真的可以吊打面试官...
  4. Arcgis Server开发使用query报错
  5. Atitit Major island groups and archipelagos 主要的岛群和群岛目录资料目录1. 岛群 波利尼西亚(Polynesia, 美拉尼西亚(Melanesia,
  6. 火狐浏览器添加restclient.xpi 添加插件时候遇见的 附件未经验证无法安装
  7. java解惑 - 最后的笑声
  8. Phaser帧动画没有效果
  9. 生鲜配送系统有哪些功能?搭建生鲜配送系统有哪些好处?
  10. GPON与XGPON优势和劣势
  11. Multiple users(Guest mode) 多用户或访客模式调试
  12. 正点原子第四期环境搭建
  13. 零基础学Python--------第4章 序列的应用
  14. Ubuntu18.04安装微信以及打开闪退问题
  15. Jquery3.x高版本支持IE8
  16. Apple Developer 注册,闭坑或潘多拉魔盒?
  17. 概率密度估计--参数估计与非参数估计
  18. yolov5_deepsort车流量跟踪计数
  19. 不要逼我……我想做乖孩子
  20. Stacked Autoencoders

热门文章

  1. 基于GPS和INS组合导航软硬件系统设计
  2. Linux 创建oracle数据库的详细过程
  3. 何水无鱼,何山无石,何树无枝,何子无父,何女无夫,何城无市
  4. sqluldr2导出
  5. Intellij idea 的tomcat原理讲解
  6. 马云是计算机专业的吗,大佬与高考:马云三次高考 马化腾弃天文选计算机
  7. Unity脚本生成图片
  8. 51单片机动态数码管显示时间+protues仿真
  9. xlsxwriter写行合并_XlsxWriter写入excel文件
  10. java pa——jsoup使用教程