一、机器学习入门浅谈

机器学习领域,又或者更大而化之的说人工智能方向,因为“阿尔法狗”等一系列的热门爆点话题,被推到了人前,受到越来越多人的关注。

无论你是什么领域的工作者,都一定多多少少听说过它的名号。

而与此同时,随着机器学习领域理论的成熟,越来越多的相关技术被应用于生活实践的方方面面,从事机器学习岗也成了很多计算机行业从业者的重点考虑。

在这个 chat 里,我想简单的和大家探讨一些新手选择机器学习方向时总会考虑的问题。

其实,认真的说来,我们很难在网上找到一个教程,完全贴合每个新手入门机器学习时的需求。

原因很简单,每个人在涉足这个领域的时候,个人的知识积淀和教育背景不一样,同样,他们对于未来发展的心理预期不一样,这也导致了需求的多样化。

因此,在真正入行之前,我非常建议你们,能够对自己进行一个深度的剖析,发现自己的优缺点,从而能够查漏补缺,才能在这个行业走的更远,同时,也能从心底对自己的选择更有底气。

从我个人的角度出发,我选择机器学习领域,是理智选择后的结果。

我从高中起就觉得程序员这个职业特别 cool,但是阴差阳错本科选择了数学,研究生才转行成为半个“非专业码农”。

我的教育背景决定了和大部分程序员相比,我在数学理论上有比较大的优势,但同时,我的代码能力非常的弱(在本科时,我只简单接触过python、matlab和c++)。

我们很容易在学习中发现,机器学习方向对代码的要求,要远远小于传统的IT行业,比如前端、后台,甚至一些更底层层面的业务需求。

综上所述,我才最终决定选择了这个方向。

我个人觉得,我的这个考虑,更适用于还在上学的学生,或者刚刚毕业的毕业生们。

这类人的普遍特点是,脱离学校不久,理论知识底子还有,但是实际代码能力和项目经验不足。

但是,相同的问题对很多转行的程序员来说,可能侧重点完全相反。

我身边有很多工作了几年后,重新选择方向的程序员,他们拥有扎实的代码基础,丰富的业务经验。

但是对机器学习的很多理论知识非常苦手,甚至连机器学习的入门逻辑回归等涉及到的简单公式都有些吃力。

对于这一类的入门者,我建议他们可以先看一些基础课程。

作为一个经历了四年枯燥无味的数学理论知识摧残的幸存者,我认为,人们在初接触对自己而言艰涩无味的知识时,一个言之有物,循循善诱的老师,是十分有必要的。

和前面提到的两类不同,还有一类入门者是纯粹的小白,他们之前从未从事过相关职业,也从未学习过相关知识。

我有一个学长大概就是这样的情形,这类人大多转行的动力是对现在的工作和薪酬情况不满意,同时被现在越来越火的机器学习领域所吸引,渴望改变现状。

他们的工作量是非常巨大的,理论和基本代码能力两手抓,同时还需要补很多计算机的专业课程,属于三类人中困难度最高的。

在下面一部分中,我会简单总结一下我手头使用过或者比较了解的机器学习资料,并对他们进行点评和分类,以供不同侧重点的大家可以选择。

二、机器学习资料

写在前面的话:无论你是我刚才提到的哪一部分入门者,数学基础都是一定一定必要的!不认真打好基础的人,永远也不会爬得太高。

线性代数、高数和概率论与数理统计,是三本非常非常非常必要的课,如果忘记了请随时温习,直接搜最经典的版本教材就可以。

视频资料

我个人非常喜欢的方式,现在的网络这么发达,给我们了一个机会可以接触到全球各地的名师。

刚入门的时候,名师的讲解肯定比自己死啃书要好,所以推荐给所有时间不那么紧张的小伙伴。

1. Coursera 上 Ng 开设的机器学习

这门课十分经典,基本算是机器学习的入门课了。吴恩达在课堂上使用的是 Octave。

但是用什么语言实现其实都是可以的,课程的大作业,以及吴恩达写好的框架都对摸清行业基本工程框架十分有帮助的,基本可以算是理论与工程都兼顾。

相信大家都知道,Ng 现在离开百度自己出来创业,普及深度学习,又推出了更新的深度学习几门课程,现在国内的一些主流网课 app 都可以找到课程资源。

还是延续了老吴的一贯风格,更侧重理论一些,对代码的要求没那么高,对代码小白十分友好。

2. 斯坦福公开课 cs231n

这门课适合计算机视觉方向的刚入门,其他方向的有兴趣也可以去听一听,如果时间紧张就不是很推荐啦。

3. 斯坦福公开课 cs224d

这门课的方向是自然语言处理,开课老师是 NLP 领域的天才级大牛,讲了很多深度学习与自然语言处理的结合相关知识,对于刚入门的初学者,十分建议刷一刷!

文字资料

这部分很多都更侧向理论部分,毕竟任何方向要想走得足够远,就一定会涉及到晦涩的理论部分,这个时候,一本书和一本笔记,就是非常必要的了。

1. 南大周志华的《机器学习》

非常非常经典的西瓜书,基本上搞机器学习的人手一本。个人感觉属于典型的科班教科书,如果不是正在上学的学生,不是特别推荐,会有更多更好的替代读物,虽然名气大,但是不适合入门读,比较适合已经有基本概念的人来看。

2. 《deep learning》中文叫做《深度学习》

这本书具有极高的价值性和权威性,非常推荐,借用网上的评价大概是“这本书的价值在于让你低成本(高效率)的补上最近几年的主要理论成果”,非常适合面对数百篇论文无从下手的科研人士入门。

当然也有人反应它的核心章节讲主流学习模型 CNN 和 RNN 的时候逻辑有点混乱。

但是现在 CNN 和 RNN 发展到现在,不同的方向早就有了差异巨大的变种,所以,指望一本书能够全部搞明白也是不现实的。

3. 《Hands On MachineLearning with Scikit Learn and Tensorflow》

非常可爱的蜥蜴书,是某段时间相关主题的top1,和我接下来介绍的一本《机器学习实战》各有优劣,大家可以酌情选择。

这本书有很多深度学习在工程应用上的小窍门,解决了很多工程开发中的现实问题。

但是同时,它的代码量没有机器学习实战那么多,理论讲解体系也相对更完善。非常适合刚上完NG课程的新手来衔接使用。

4. Machine Learning in action 中文名为《机器学习实战》

也是非常经典的一本书了,小伙伴基本人手一本,我从他还没出版的适合就开始关注。

主要特点就是简单粗暴,特别适合和我一样理论还可以但是代码能力基本为零的程序员小白。

“这本书用尽量少的公式把机器学习的基本算法都过了一遍,而且还讲得很清楚,更为重要的是他将公式和代码结合了起来。

因此,你的机器学习并没有那么的抽象了,你知道算法里的公式如何的转化为代码。”(这段摘自知乎)

如果你的代码基础比较好,可以简单过一遍,缺乏代码量,对 python 等语言不熟悉的小伙伴,可以像我一样老老实实的全部敲一遍,进步真的是可以明显看见的。

5. 李航的《统计学习方法》

不是很厚的蓝皮书,但是学起来真的很痛苦,如果要认认真真推导一遍公式。建议是有机器学习的基本知识和能力以后再来攻克,否则真的是分分钟想放弃。

和第一本西瓜书一样,都算是国内的经典教材,非常值得有时间有精力的学生党仔细研读,如果是时间比较紧张的工作党们,可以酌情看其中的部分章节。

三、总结和写在后面的话

可能看到中间,就有小伙伴开始疑惑,欸,不是说机器学习吗?怎么不知不觉就说到了深度学习?

其实,人工智能领域发展到现在,机器学习已经远远不能满足我们的日常需求了。

甚至可以这样说,机器学习的知识只是这个领域的冰山一角,我们仅靠单薄的机器学习的知识,早就不能找到一份理想的工作。

计算机这个行业,从来都是活到老学到老,人们眼中的高薪,也就决定了它残酷的竞争性和知识迅速的更替性。

机器学习入门以后,就需要你根据自己的需求来制定个性化的路线了。比如大数据分析、图模型、深度学习、自动驾驶、机器人、自然语言处理、图像识别、语音识别等等,既有应用方向,也有理论方向。

正如我开篇所提到的,早在不知不觉间,机器学习就已经深入到了我们生活的方方面面。

在推荐中,我提到的都是自己亲自看过(虽然有一些并没有看完)的资料,也有很多名气很大很权威的资料没有提及。

比如《Elements of Statistical Learning》《机器学习基石》等等等。

毕竟个人能力有限,也欢迎大家一起来讨论补充。同时,我也坚信,现在这个时代,好的资料太多,而人的精力有限,与其把时间和精力花在筛筛选选上,不如静下心把几本经典的教材吃透。

最后,无论你是从哪里开始,选择好方向,坚持走下去,才是唯一走到最后的诀窍,时间才是检验奋斗的唯一标准。

与君共勉。

原文转自: 粽子 在 GitChat 上分享「零基础的新手,如何入门机器学习?」

【小白必读】机器学习入门须知相关推荐

  1. 什么是 CNN?Facebook 员工写给小白的机器学习入门贴彻底火了!

    公众号关注 "视学算法" 设为 "星标",DLCV消息即可送达! 白交 发自 凹非寺  量子位 报道 | 公众号 QbitAI 看你是人还是物,是猫还是狗. 卷 ...

  2. 什么是CNN?写给小白的机器学习入门贴,Facebook员工打造,47k访问量

    白交 发自 凹非寺  量子位 报道 | 公众号 QbitAI 看你是人还是物,是猫还是狗. 卷积神经网络(CNN)最重要的用途就是图像分类.说起来,似乎很简单. 为什么不使用普通的神经网络呢? 那是因 ...

  3. 曲线聚类_机器学习入门必读:6种简单实用算法及学习曲线、思维导图

    来源:大数据DT 本文约3500字,建议阅读7分钟 本文为你介绍掌握机器领域知识的学习曲线.技术栈以及常用框架. [ 导读 ] 大部分的机器学习算法主要用来解决两类问题--分类问题和回归问题.在本文当 ...

  4. 机器学习入门必读:6种简单实用算法及学习曲线、思维导图

    来源:大数据DT 本文约3500字,建议阅读7分钟 本文为你介绍掌握机器领域知识的学习曲线.技术栈以及常用框架. [ 导读 ] 大部分的机器学习算法主要用来解决两类问题--分类问题和回归问题.在本文当 ...

  5. 机器学习入门需要多久

    原入门机器学习需要会哪些编程语言? 38 0 对"机器学习"跃跃欲试的你,可能也有这样的问题:入门机器学习,我需要会那种(些)酷炫的编程语言呢?别问了,这个问题的"正解& ...

  6. 机器学习入门学习资料推荐

    今天介绍一些机器学习的学习资料,主要是分为以下几个方面的内容: 编程语言:实现机器学习,主要是介绍 Python 方面的语言: 书籍:看书通常是入门的一种方法,比较适合自律性强的同学: 视频:入门的第 ...

  7. 机器学习入门系列(2)--如何构建一个完整的机器学习项目(一)

    上一篇机器学习入门系列(1)–机器学习概览简单介绍了机器学习的一些基本概念,包括定义.优缺点.机器学习任务的划分等等. 接下来计划通过几篇文章来介绍下,一个完整的机器学习项目的实现步骤会分为几步,最后 ...

  8. 一.hadoop入门须知

    目录: 1.hadoop入门须知 2.hadoop环境搭建 3.hadoop mapreduce之WordCount例子 4.idea本地调试hadoop程序 5.hadoop 从mysql中读取数据 ...

  9. 数据分析(入门)纳米学位_tensorflow纳米级程序对机器学习入门的回顾

    数据分析(入门)纳米学位 About the service provider for the context: 关于上下文的服务提供商: Udacity is a for-profit organi ...

最新文章

  1. MacOS AElf Boilerplate开发体验
  2. boost::mp11::tuple_for_each相关用法的测试程序
  3. 10.16 多校联测
  4. 完美解决SSM中 java.lang...c3p0/impl/NewProxyResultSet.isClosed()Z is abstract 【插入数据只能插入一条问题】
  5. 彼聆智能语音机器人_人工智能2.0时代,创造他们的究竟是谁?
  6. python学习: 优秀Python学习资源收集汇总--转
  7. 鸿蒙后的时期有什么,鸿蒙系统什么时候上市 华为鸿蒙系统有多厉害?
  8. 针对新手的Java EE7和Maven项目–第7部分
  9. 通过fiddler和逍遥模拟器模拟抓包android手机
  10. docker随着主机启动 自动启动设置
  11. Android 功耗(14)----Android功耗 问题debug处理
  12. qt connect函数_Qt 串口上位机开发Rice 上位机 学习开发
  13. FreeRTOS 教程指南 学习笔记 第五章 软件计时器
  14. exe反编译为python语言_如何反编译Python写的exe到py
  15. Excel 筛选唯一值或删除重复值
  16. java解析excel文件详解_java解析excel文件的方法
  17. 能与迅雷扳手腕,且无视敏感汁源的闪电下载出电脑内测版了!
  18. 计算机网络-传输层:TCP协议
  19. 异地备份工具_5个有用的Amazon S3备份工具
  20. 软件需求工程课程总结

热门文章

  1. 事件数据 - EventData
  2. 如何在对方不知情的情况下定位微信好友
  3. 种子是down.php,[原创作品][PHP]BT种子打包推送小神器~~
  4. 将图片集合成一个视频
  5. 单片机方案设计红外人体测温仪方案
  6. 【STM32F429开发板用户手册】第33章 STM32F429的SPI总线应用之驱动DAC8563(双通道,16bit分辨率,正负10V)
  7. python入门教程 傻瓜_python傻瓜教程
  8. 大数据之scala学习(一) 案例操作
  9. 二层板的射频RF信号如何控阻抗 四层板的射频RF信号如何控阻抗  射频信号是否可以不控阻抗,射频差分需要控阻抗吗?为什么射频信号需要挖空隔层参考?射频信号为什么要加粗?
  10. 手机电子邮件设置exchange方式登录163邮箱