机器学习工程师自学指南

本文将会介绍机器学习的方方面面,从简单的线性回归到最新的神经网络,你不仅仅能学会如何使用它们,并且还能从零进行构建。

以下内容以计算机视觉为导向,这是学习一般知识的最快方法,并且你从中获得的经验可以很容易地迁移到机器学习的其他领域。

本文我们将会使用TensorFlow作为机器学习框架。

学习是一个多维因素作用的结果,所以如果能基于学习资料,理论和实践并重,学习效果会好很多。另外,还有一个很好的实践方法是参与Kaggle竞赛,通过竞赛的形式解决实际生活中的问题,从而巩固此前所学。

(要求:关于Python,你无需达到专家级别,但要很好地掌握基础知识)

1.课程

1.1 实用机器学习(约翰霍普金斯大学)

www.coursera.org/learn/pract…

1.2 机器学习(斯坦福大学)

www.coursera.org/learn/machi…

以上两个课程会教你一些数据科学和机器学习的基础知识,也有助于你对更有难度知识的学习和掌握。

1.3 CS231n:面向视觉识别的卷积神经网络 2017 (2016)

cs231n.stanford.edu/

该课程是网上关于ML & CV最好的课程之一,不仅能让你了解这里边的水有多深,还能为你进一步的研究探索打下良好的基础。

1.4 深度学习(Udacity的课程)

www.udacity.com/course/deep…

1.5 CS224d:面向自然语言处理的深度学习

cs224d.stanford.edu/

1.6 深度学习相关的电子书(涵盖了ML的方方面面)

leonardoaraujosantos.gitbooks.io/artificial-…

2.实战

以下是课程和项目列表,有助于理解运行原理并找到提升办法。

2.1. Tensorflow 相关的简单练习课

www.kadenze.com/courses/cre…

2.2. Tensorflow cookbook

github.com/nfmcclure/t…

2.3. Tensorflow-101教程部分

github.com/lengstrom/f…

2.4. 如何使用神经网络实现图像风格迁移。

github.com/lengstrom/f…

2.5 图像分割

github.com/MarvinTeich…

2.6 使用SSD实现物体识别

github.com/balancap/SS…

2.7 面向物体识别和分割的快速掩膜RCNN

github.com/CharlesShan…

2.8 强化学习,对搭建一个机器人或者Dota AI非常有用。

github.com/dennybritz/…

2.9 Google Brain团队的Magenta项目

github.com/tensorflow/…

2.10 深度度双边学习实时图像增强

groups.csail.mit.edu/graphics/hd…

2.11 自动驾驶汽车项目

github.com/udacity/sel…

3. FAQ

学习过程中遇到困难怎么办?

首先,你必须明白机器学习不是100%精确的,大多数情况下只是一个很好的猜测并且需要大量的调整迭代。因此,在大多数情况下,想出一些独特的想法是非常困难的,因为你的时间和资源大多会花在训练模型上。所以不要试图独自找出解决方案,你可以搜索论文、项目以及找可以帮助你的人。可以说,在获得经验方面越快越好。

以下这些网站可以帮得到你:

  • www.gitxiv.com/

  • www.arxiv-sanity.com/

  • arxiv.org/, https://s…

为什么论文不能完全解决问题,或者在一些特定情况下为什么论文被验证是错的?

很遗憾的说,并不是所有的科技人员都愿意公开自己的研究成果,但他们需要通过发表论文来获得收益或者名望。所以他们中的一些人只公布了一部分材料,或者给出了错误的公式。所以我们最好搜索代码,而不是论文。论文只是解决了特定问题的证据或者事实。

从哪里查找最新的学习资料?

  • www.gitxiv.com/,不仅能找到最新论文,还能找到所需要的代码。

  • www.arxiv-sanity.com/

  • arxiv.org/

用云计算还是台式机/笔记本电脑?

在有大量计算需求的情况下,云计算是最好的选择。对于学习和测试,使用带有支持CUDA的显卡的PC/笔记本电脑要便宜得多。当然,如果你有免费云资源或多余资金,还是使用云比较好。

如何提高调超参数技能?

训练中的主要问题是时间,你不可能一直坐在那里盯着训练数据,因此建议你使用Grid Search。只需要创建一组超参数和模型架构,一个接一个的运行,并保存结果。这样你就能晚上训练,在接下来的一天对比结果,直至找到最有希望的那个。

你可以看看如何在sklearn库中完成这个操作:

scikit-learn.org/stable/modu…

资源 | 普通程序员如何自学机器学习相关推荐

  1. 方法 | 普通程序员如何转向机器学习

    相信看到这篇文章的朋友,几乎都想成为机器学习科学家. 事实上,绝大多数的付费课程,基本上都有完全免费的课程放在另一个地方.我们只是把这些信息整理好,告诉你在哪儿可以找到他们,以及通过什么样的顺序进行学 ...

  2. 集十三位资深程序员毕生功力回答:普通程序员如何自学才能进大厂?

    史上最强Java学习大全,多亏我足够无耻,才从公司十三位Java程序员口中问出方法来. 没错. 这篇文章总结于我们公司十三位使用Java作为开发语言的程序员前辈,方方面面近四千字. 作为十大编程语言榜 ...

  3. 自学机器学习_我用来自学机器学习的最佳资源

    自学机器学习 The field of machine learning is becoming more and more mainstream every year. With this grow ...

  4. @程序员,正在自学机器学习?这六点一定要牢记!

    "自学"对于程序员而言,从来不是个陌生的词.准确说来,何止是不陌生,甚至可以称作常规操作了.那么正在自学,或者曾经自学过某项内容的你,最终是"从入门到放弃",还 ...

  5. 自学机器学习、深度学习、人工智能的学习资源集合

    本人美国top50本科统计就读,想当初我的机器学习和深度学习就是靠自学入门的.现在行业中对于人工智能自学这一方法众说纷纭,也有很多人质疑那些通过自学获得的技术及实力.就我个人而言,我体验过各种各样的课 ...

  6. 自学机器学习、深度学习、人工智能学习资源推大聚合

    想要解决如何自学机器学习.深度学习和人工智能这一问题,首先要了解三个概念以及它们之间的关系. 人工智能:人工智能英文缩写为AI,它是研究.开发用于模拟.延伸和扩展人的智能的理论.方法.技术及应用系统的 ...

  7. 给力!一行代码躺赚普通程序员10年薪资!

    笔者这两天闲逛知乎,看到了这个帖子: 匿名答题,发表于2014年,此外没有留下任何多余信息. 2年躺赚200万,相当于普通程序员10年的工资.没想到Pyhon这么强大,怪不得有人说"除了不会 ...

  8. 普通程序员如何转向AI方向(转)

    普通程序员如何转向AI方向 眼下,人工智能已经成为越来越火的一个方向.普通程序员,如何转向人工智能方向,是知乎上的一个问题.本文是我对此问题的一个回答的归档版.相比原回答有所内容增加. 一. 目的 本 ...

  9. 普通程序员如何转向AI方向

    一. 目的 本文的目的是给出一个简单的,平滑的,易于实现的学习方法,帮助 "普通" 程序员踏入AI领域这个门.这里,我对普通程序员的定义是:拥有大学本科知识:平时工作较忙:自己能获 ...

最新文章

  1. linux环境下的连接器,Linux下连接器ld链接如何排序
  2. linux下查找某个目录下包含某个字符串的文件
  3. docker镜像导入、导出
  4. docker 端口映射 udp_Docker 制作一键安装的本地无污染 DNS 域名服务
  5. Spring Boot 分页插件PageHelper
  6. Vue属性绑定~非常详细
  7. https 单向认证和双向认证配置
  8. 数字图像处理:图像与编码
  9. Spotfire 表达式之文本函数
  10. SSH和SSM对比总结
  11. 使用阿里云Maven仓库
  12. 蓝桥杯 -罗马数字问题
  13. “但问耕耘,莫问收获”才有机会“碰运气”——新书《成功与运气:好运和精英社会的神话》解读
  14. Windows Server2012搭建邮件服务器
  15. java_求1到n英寸换算厘米 (右对齐,保留两位小数)
  16. MySql存储过程与函数
  17. 谷歌浏览器查找页面内容快捷键
  18. 浙大数据结构课后习题 练习一 7-1 Maximum Subsequence Sum (25 分)
  19. L1-040 最佳情侣身高差 (10分)
  20. 全网最详细地介绍mybatis-plus框架

热门文章

  1. Certificates, Identifiers Profiles创建总结
  2. 高性能MySQL——查询性能优化
  3. 使用命令批量修改文件的后缀名称
  4. Docker多步构建更小的Java镜像
  5. 《SAP HANA平台应用开发》—第2章2.3节熟悉SAP HANA工作台
  6. Extjs FormPanel/TabPanel/GridPanel混合
  7. [转帖]经典好文!看完后感到很震撼!
  8. python函数的作用复用代码_Python-函数和代码复用
  9. python去重语句_Python Dataframe 指定多列去重、求差集的方法
  10. nginx+keepalived搭建主从负载均衡并迅速切换