终极算法——第八章：无师自通

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容，仅供参考。

如果我们能重新回忆婴儿和蹒跚学步时期的自己，然后从新生儿的角度看待这个世界，那么许多关于学习的疑问，甚至关于存在本身，都会突然变得清晰明朗。

虽然孩子理所当然从父母那里获得了许多帮助，但很多时候他们在没人监督的情况下进行学习，这才是最不可思议的地方。

对事物进行聚类，这是人类的天性，也是获取知识的第一步。

大数据和机器学习的全部要点在于避免粗糙思考。

有一个更大的问题，那就是K均值算法只有在集群易于区分的情况下才能起作用：在超空间中，每个集群可看作一个球团，每个团距离彼此都很远，而它们都有相似的体积，并包含想近数量的物体。

无论何时，当我们想掌握某个统计模型，但又缺乏一些关键信息时(如例子的类别)，就可以利用EM。这使它在所有机器学习中成为最受欢迎的算法。

机器学习算法称该过程为维数约减，因为该过程将大量的可见维度(像素)简化称几个隐形维度(表情、面部特征)。维数约减对于应对大数据来说很关键。

寻找主要成分的整个过程，可以利用线性代数一次性完成。

主要成分分析(PCA)，正如人们对该过程的了解，是科学家的工具箱中关键的工具之一。PCA属于线性算法。

PCA完全没有解释数据的形状，而是奖其模糊化了。

对于非线性降维算法来说，最受欢迎的算法——等距映射算法，就可以实现这一点。

等距映射算法有惊人的能力，可以对准复杂数据中最重要的维度。

时间，换句话说，就是记忆的主要成分。

聚类和维度简化虽然使我们更加靠近人类学习，但仍丢失了一些很重要的东西——互动。

在任何情况下，步进监督都不应该被采用(用于互动)。家长不糊教自己的孩子爬、走或者跑，他们都是自己摸索。目前为止，所有的学习算法都不能做到这一点。

人类确实有稳定的向导：情感。我们追求快乐，躲避痛苦。

有一个机器学习的子域致力于这样的算法：进行主动探索，偶然得到奖励，然后弄清楚将来怎样才能再得到奖励。这个过程称为“强化学习”。

强化学习的一个重要先驱是跳棋游戏程序，这是IBM的研究员阿瑟·塞缪尔于20世纪50年代编写的。棋盘游戏是强化学习问题的典范：你得走好多步棋，却得不到任何反馈，奖励或惩罚都是在最后一刻揭晓，其形式也就是嬴和输。

强化学习的首要思想是：并不是所有的状态都有奖励，但每种状态都会有价值。

强化学习通过估算每种状态的价值来做到这一点，从该状态开始你所期望得到的全部奖励，然后选择能将奖励最大化的行为。

强化学习面对利用——探索困境的解决方法是：时而选择最佳行动，时而随机选择。

实际上，强化学习就是一种加速进化过程——尝试、丢弃，然后在单个生命的一生而不是几代中改进行动——有了这个标准，它的效率就会很高。

对于强化学习的研究自20世纪80年代早期才正式开始，马萨诸塞大学的里奇·萨顿和安迪·巴尔托参与了研究工作。他们认为学习取决于与环境的互动，这一点很关键，但监督算法并没有发现这一点。

1989年，当时剑桥大学的克里斯·沃特金斯在儿童学习实验发的的推动下，实现了强化学习的现代形式，即在未知环境中进行最优控制。

在监督式学习中，某个状态的目标价值总是一样的；但在强化学习中，它会不断变化。

讽刺的是，人在最痛苦时学到的东西往往最多。

通过练习你会做的更好，但不会以恒定覅人速度进步：一开始你进步很快，接下来就没那么快了，最后你变得很慢。

组块是一个来自感知与记忆心理学的概念。

人类解决问题的方式是将问题分解为小问题，再将小问题分解为更小的问题，然后系统地减少初始状态与目标状态之间的差异。

于是纽厄尔、罗森布鲁姆、莱尔德作出这样的假设——组块是学习所需的“唯一”机制，换句话说，就是终极算法。

尝试将强化学习、监督式学习，以及别的一切简化称组块，基本上会制造更多的问题，而不会解决问题。

A/B测试证明常听到的批评言论的错误：大数据制对寻找相关关系有好处，对寻找因果关系则没用。

了解一个实体的最佳方法——无论它是人、动物、网页还是分子——就是了解它如何与其他实体进行连接。

关联学习算法能达到的最佳效果就是让懒散的老师变得勤奋。

终极算法

终极算法——第八章：无师自通相关推荐

重构机器学习算法的知识体系 - 《终极算法》读书笔记
2019独角兽企业重金招聘Python工程师标准>>> 最近有幸从图书馆借阅了Pedro Domingos的<The Master Alogrithm>一书,这本书的中文 ...
JVM内存管理------GC算法精解（五分钟教你终极算法---分代搜集算法）
转载自 JVM内存管理------GC算法精解(五分钟教你终极算法---分代搜集算法) 引言何为终极算法? 其实就是现在的JVM采用的算法,并非真正的终极.说不定若干年以后,还会有新的终极算法, ...
大咖来信 | 张亚勤@2018：终日“闭关”读论文，思考终极算法
李根发自凹非寺量子位报道 | 公众号 QbitAI 张亚勤是1998年决定回国的,距今已过20年. 这20年中,技术变革天翻地覆,中国发展也日新月异.他见证了互联网在中国的从弱到强,也看到了 ...
终极算法——第一章：机器学习的革命
本文为阅读总结个人认为书里概念性的.对本人有帮助的内容,仅供参考. 我们生活在算法的时代. 算法就是一系列指令,告诉计算机该做什么,即如何操作计算机中的几十亿晶体管.所有算法,无论多复杂,都能分解为三 ...
终极算法【7】——类推学派
类比是推动许多历史上最伟大科学进度的动力.当达尔文阅读马尔萨斯的<人口论>时,被经济和自然界中生存竞争的相似性触动,所以有了自然选择理论的诞生. 类比在机器学习中扮演重要性刚开始进展缓慢, ...
终极算法——第三章：符号学派：休谟的归纳问题
本文为阅读总结个人认为书里概念性的.对本人有帮助的内容,仅供参考. 你是理性主义者还是经验主义者? 理性主义者认为,感官会欺骗人,而逻辑推理是通往知识的唯一可靠的道路.经验主义者认为所有推理都不可靠, ...
终极算法——第七章：类推学派：像什么就是什么
本文为阅读总结个人认为书里概念性的.对本人有帮助的内容,仅供参考. 类比式推动许多历史上最伟大科学进步的动力. 类比推理有着突出的知识谱系.亚里士多德在他的相似律中就表达了这一点:如果两个事物相似,其 ...
SEO优化指南与c语言,SEO终极算法：一篇文章精通SEO优化
今天是2017年9月14日,我大概是2015年7月份开始接触的SEO,如今已经有整整两年多的时间了,怎么说我也算半个老司机了.之前我也写过关于SEO优化一整套的优化流程,比如SEO终极算法系列,这一次 ...
斗地主AI算法——第八章の被动出牌(2)
上一章我们已经搭好了被动出牌的基本架子,本章我们主要说明一下被动出牌算法的基本步骤. 我把出牌逻辑分为四个阶段,也就是策略的优先级.分别是:[直接打光手牌]→[同类型牌压制]→[炸弹王炸压制]→[不出 ...

终极算法——第八章：无师自通

终极算法——第八章：无师自通相关推荐

最新文章

热门文章