【机器学习系列文章】第1部分：为什么机器学习很重要？

路线图

谁应该读这个？

为什么机器学习很重要

语义树：人工智能和机器学习

强大的AI将永远改变我们的世界; 要了解如何，学习机器学习是一个很好的起点

如何阅读这个系列

关于作者

简单，简单的解释，附有数学，代码和现实世界的例子。

这个系列是一本完整的电子书！在这里下载。免费下载，贡献赞赏（paypal.me/ml4h）

路线图

第1部分：为什么机器学习很重要。人工智能和机器学习的大局 - 过去，现在和未来。

第2.1部分：监督学习。学习答案键。引入线性回归，损失函数，过度拟合和梯度下降。

第2.2部分：监督学习II。两种分类方法：逻辑回归和SVM。

第2.3部分：监督学习III。非参数学习者：k-最近邻居，决策树，随机森林。介绍交叉验证，超参数调整和集合模型。

第3部分：无监督学习。聚类：k-means，层次结构。降维：主成分分析（PCA），奇异值分解（SVD）。

第4部分：神经网络和深度学习。学习的原因，地点和深度。博士从大脑中获取灵感。卷积神经网络（CNN），递归神经网络（RNN）。真实世界的应用程序。

第5部分：强化学习。探索和开发。马尔可夫决策过程。Q-learning，政策学习和深度强化学习。价值学习问题。

附录：最佳机器学习资源。用于创建机器学习课程的精选资源列表。

谁应该读这个？

希望快速掌握机器学习速度的技术人员
非技术人员希望获得机器学习的入门知识，并愿意参与技术概念
任何对机器如何思考感到好奇的人

本指南旨在供任何人访问。将讨论概率，统计，编程，线性代数和微积分的基本概念，但没有必要事先了解它们以从该系列中获得价值。

本系列文章是在2-3小时内获得高级机器学习概念的指南。
如果您对确定要学习哪些课程，阅读课本，尝试项目等更感兴趣，请查看附录中的建议：最佳机器学习资源。

为什么机器学习很重要

人工智能将比本世纪任何其他创新更有力地塑造我们的未来。任何不理解它的人很快就会发现自己感到被遗忘，在一个充满技术感觉越来越像魔术的世界里醒来。

加速率已经令人震惊。经过几个人工智能冬季和过去四十年的虚假希望之后，近年来数据存储和计算机处理能力的快速发展极大地改变了游戏。

2015年，谷歌培训了一个会话代理（AI），它不仅可以令人信服地与人类作为技术支持服务台进行互动，还可以讨论道德，表达意见和回答基于事实的一般问题。

（Vinyals＆Le，2017）

同年，DeepMind 在49个Atari游戏中开发了一个超过人类级别表现的代理，只接收像素和游戏分数作为输入。不久之后，在2016年，DeepMind通过发布一种名为A3C 的最先进的游戏方法淘汰了自己的成就。

与此同时，AlphaGo击败了Go中最优秀的人类玩家之一 - 在机器首次征服国际象棋之后的二十年里，人类主导的游戏取得了非凡的成就。很多大师都无法理解机器如何能够掌握这个古老的中国战争战略游戏的全部细微差别和复杂性，其中有10个可能的棋盘位置（宇宙中只有10个原子）。

职业围棋选手Lee Sedol在失败后回顾了他与AlphaGo的比赛。照片来自大西洋。

2017年3月，OpenAI创建了代理商，他们发明了自己的语言进行合作，更有效地实现了目标。据报道，Facebook不久后成功培训代理商进行谈判甚至撒谎。

就在几天前（撰写本文时），2017年8月11日，OpenAI通过在线多人游戏Dota 2的1v1比赛击败世界顶级专业人士，达到了另一个令人难以置信的里程碑。

在YouTube上观看 The International 2017的完整比赛，Dendi（人类）与OpenAI（bot）。

我们的大部分日常技术都是由人工智能驱动的。在您下次前往台湾旅行期间将相机对准菜单，餐厅的选择将通过Google Translate应用程序神奇地以英文显示。

谷歌翻译使用卷积神经网络实时覆盖饮料菜单上的英文翻译。

今天，AI被用于为癌症患者设计基于证据的治疗计划，立即分析医学检查的结果，立即升级到相应的专家，并进行药物发现的科学研究。

伦敦BenevolentAI的大胆宣言（2017年8月关于我们页面的截图）。

在日常生活中，发现传统上由人类占据的角色的机器越来越普遍。真的，如果你下次打电话到酒店服务台发送一些牙膏时，如果一个小的家政服务机器人出现而不是人类，请不要感到惊讶。

在本系列中，我们将探索这些技术背后的核心机器学习概念。最后，您应该能够描述它们在概念层面的工作方式，并配备自己开始构建类似应用程序的工具。

语义树：人工智能和机器学习

一点建议：将知识视为一种语义树是很重要的 - 确保在进入树叶/细节之前了解基本原则，即树干和大树枝，或者没有什么可以让它们挂起来至。- Elon Musk，Reddit AMA

机器学习是人工智能的许多子领域之一，涉及计算机从经验中学习的方式，以提高他们思考，计划，决定和行动的能力。

人工智能是研究能够感知周围世界，形成计划并做出决策以实现其目标的代理人。其基础包括数学，逻辑，哲学，概率，语言学，神经科学和决策理论。许多领域属于人工智能的范畴，如计算机视觉，机器人，机器学习和自然语言处理。

机器学习是人工智能的一个子领域。它的目标是使计算机能够自己学习。机器的学习算法使其能够识别观察数据中的模式，构建解释世界的模型，并在没有明确的预编程规则和模型的情况下预测事物。

AI效应：实际上什么是“人工智能”？

符合“AI”的技术的确切标准有点模糊，并且解释随时间而变化。AI标签倾向于描述传统上在人类领域执行任务的机器。有趣的是，一旦计算机弄清楚如何完成其中一项任务，人类就会倾向于说这不是真正的情报。这被称为AI效应。

例如，当IBM的深蓝在1997年击败世界象棋冠军加里卡斯帕罗夫时，人们抱怨它使用的是“蛮力”方法，而且根本不是“真正的”情报。正如Pamela McCorduck所写的那样，“人工智能领域的历史的一部分，每当有人想出如何让电脑做某事 - 玩好的跳棋，解决简单但相对非正式的问题 - 有批评的合唱者说， “那不是在思考”（McCorduck，2004）。
或许有一定的JE NE最高审计机关quoi固有的什么人会接受可靠的“人工智能”：

“人工智能是尚未完成的任何事情。” - Douglas Hofstadter

那么计算器算作AI吗？也许通过一些解释。那辆自动驾驶汽车怎么样？今天，是的。在未来，也许不是。你的酷新聊天机器人启动自动化流程图？当然......为什么不呢。

强大的AI将永远改变我们的世界; 要了解如何，学习机器学习是一个很好的起点

上面讨论的技术是人工窄智能（ANI）的示例，其可以有效地执行狭义定义的任务。

与此同时，我们将继续在人类级人工智能（AGI）方面取得基础性进展，AGI也称为强AI。AGI的定义是一种人工智能，可以成功地执行人类可以执行的任何智力任务，包括在不确定条件下学习，计划和决策，以自然语言交流，制作笑话，操纵人，交易股票，或......重新编程本身。

最后一个是一个大问题。一旦我们创建了一个可以改善自身的人工智能，它将解锁一个递归自我改善的循环，这可能导致在几十年到一天的某个未知时间段内发生情报爆炸。

让超智能机器被定义为一种机器，它可以远远超过任何人的所有智力活动，无论多么聪明。由于机器设计是这些智能活动之一，超智能机器可以设计更好的机器; 毫无疑问，这将是一场“情报爆炸”，人类的智慧将远远落后。因此，第一台超智能机器是人类需要制造的最后一项发明，只要机器足够温顺，告诉我们如何控制它。 - IJ Good，1965

你可能听说过这一点被称为奇点。该术语借用于黑洞中心的引力奇点，这是一个无限密集的一维点，我们理解它们的物理定律开始分解。

我们对黑洞事件视界之外发生的事情零视野，因为没有光可以逃脱。同样地，在我们解开AI递归改进的能力之后，就不可能预测会发生什么，就像 故意设计人类的老鼠可能难以预测人类会对他们的世界做些什么一样。它会继续帮助他们获得更多的奶酪吗？（图片来自 WIRED）

人类未来研究所最近的一份报告调查了一组人工智能研究人员关于 AGI的时间表，并发现“研究人员认为，在45年内，所有任务中人工智能的表现都超过人类的50％”（Grace等，2017）。我们亲自与一些理智和合理的AI从业者谈过，他们预测更长的时间表（上限是“从不”），而其他人的时间表非常短 - 只需几年。

图片来自Kurzweil的The Singularity Is Near，于2005年出版。现在，2017年，只有其中几张海报可以合理地留在墙上。

高于人类的人工超级智能（ASI）的出现可能是我们物种发生的最好或最坏的事情之一。它带来了巨大的挑战，以一种对人类友好的方式指定AI 想要的东西。

虽然不可能说出未来会发生什么，但有一件事是肯定的：2017年是开始了解机器思维方式的好时机。为了超越哲学家在扶手椅上的抽象，并巧妙地塑造我们关于人工智能的路线图和政策，我们必须参与机器如何看待世界的细节 - 他们“想要什么”，他们潜在的偏见和失败模式，他们的气质怪癖 - 就像我们研究心理学和神经科学一样，了解人类如何学习，决定，行动和感受。

有关人工智能的复杂，高风险的问题需要我们在未来几年内的细心关注。

我们如何打击AI 在现有数据集中明显进一步加剧系统性偏见的倾向？我们应该对世界上最强大的技术专家关于人工智能的潜在风险和利益的根本分歧做些什么？在没有工作的世界里，人类的目的感会发生什么？

机器学习是我们人工智能通信之旅的核心，与此同时，它将改变每个行业并对我们的日常生活产生巨大影响。这就是为什么我们认为值得理解机器学习，至少在概念层面 - 我们设计这个系列是最好的起点。

如何阅读这个系列

您不一定需要阅读系列封面到封面才能获得价值。以下是关于如何处理它的三个建议，具体取决于您的兴趣和您有多少时间：

T形方法。从头到尾阅读。用你自己的话来总结每个部分（参见：费曼技术）; 这鼓励积极阅读和更强的保留。深入了解与您的兴趣或工作最相关的领域。我们将在每个部分的末尾包含用于进一步探索的资源。
专注的方法。直接跳到你最感兴趣的部分，并将精力集中在那里。
80/20方法。一次性浏览所有内容，在有趣的高级概念上做几点注释，然后称之为夜晚。?

关于作者

“好吧，当我们完成这种啤酒时，我们必须完成梯度下降。”@ 爱丁堡的Boozy Cow

Vishal最近在Upstart领导增长，Upstart是一个利用机器学习来定价信贷，自动化借贷流程和收购用户的借贷平台。他花时间思考初创公司，应用认知科学，道德哲学和人工智能伦理。

Samer是加州大学圣地亚哥分校计算机科学与工程硕士生，也是Conigo Labs的联合创始人。在读研究生之前，他创建了中小企业商业智能工具TableScribe，并花了两年时间为麦肯锡的财富100强公司提供咨询服务。Samer曾在耶鲁大学学习计算机科学与伦理，政治和经济学。

这个系列的大部分内容是在为期10天的英国之旅中写成的，模糊的火车，飞机，咖啡馆，酒吧和其他任何地方我们都可以找到一个干燥的地方。我们的目标是巩固我们对人工智能，机器学习以及其中的方法如何组合在一起的理解 - 并希望在此过程中创造值得分享的东西。

现在，不用多说了，让我们通过第2.1部分：监督学习深入学习机器学习！

原文：https://medium.com/machine-learning-for-humans/why-machine-learning-matters-6164faf1df12

【机器学习系列文章】第1部分：为什么机器学习很重要？相关推荐

系列文章（一）：机器学习与深度学习——数据预处理（数值型数据）
系列文章(一):机器学习与深度学习中的数据预处理(数值型数据) 目录系列文章(一):机器学习与深度学习中的数据预处理(数值型数据) 一.引言 1.1 为何预处理(Why preprocessing? ...
机器学习系列笔记：林轩田机器学习基石——机器学习的可行性
机器学习系列笔记:林轩田机器学习基石--机器学习的可行性
svm多分类代码_跟我一起机器学习系列文章知识点与代码索引目录，持续更新…...
<跟我一起机器学习> 系列文章知识点与代码索引目录 0 环境配置如何才能入门机器学习? 优雅的安装和使用Anaconda 使用Conda来进行环境的创建与管理 Pycharm安装与使用 ...
机器学习系列文章（chapter two）——数据特征分析处理
一.数据来源用机器学习来分析数据.获取客观规律,首先我们要能有海量数据去进行分析,才有可能得出相对准确的结论.如果数据量不够大,则很可能得出误导性的结论.比如去高端住宅区调查人均存款情况,得出的结论 ...
机器学习系列文章——算法的实现（knn，朴素贝叶斯，决策树，模型评估）
一.机器学习算法分类: 机器学习算法可分为两大类,即分类与回归.其中分类是针对离散型数据,比如判定一直动物是猫是狗,判断一个人的信用等级:而回归问题为针对连续型数据,如预测淘宝店铺销量,预测明天气温等 ...
机器学习系列文章-决策树
决策树由于我们是使用sklearn对决策树代码进行实现,所以并不是很关心其原理部分.但我仍需要对其进行一定的了解.通过查询资料,去学习了下决策树的原理,这里对其原理进行简要介绍. 注:这里决策树的原 ...
【机器学习系列文章】第2.2部分：监督学习II
目录分类:预测标签 Logistic回归:0还是1? 支持向量机(SVM) 成功! 练习材料和进一步阅读使用逻辑回归和支持向量机(SVM)进行分类. 分类:预测标签这封电子邮件是垃圾邮件吗?借款 ...
《机器学习系列教程》：第二章机器学习基础
第二章机器学习基础机器学习and 数据分析 2.2 监督学习.非监督学习.半监督学习.弱监督学习? 根据数据类型的不同,对一个问题的建模有不同的方式.依据不同的学习方式和输入数据,机器学习主要分为 ...
【机器学习系列】概率图模型第三讲：深入浅出无向图中的条件独立性和因子分解
作者:CHEONG 公众号:AI机器学习与知识图谱研究方向:自然语言处理与知识图谱阅读本文之前,先注意一下两点: 1. 机器学习系列文章常含有大量公式推导证明,为了更好理解,文章在最开始会给出本文 ...

【机器学习系列文章】第1部分：为什么机器学习很重要？