本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。

如果我们能重新回忆婴儿和蹒跚学步时期的自己,然后从新生儿的角度看待这个世界,那么许多关于学习的疑问,甚至关于存在本身,都会突然变得清晰明朗。

虽然孩子理所当然从父母那里获得了许多帮助,但很多时候他们在没人监督的情况下进行学习,这才是最不可思议的地方。

对事物进行聚类,这是人类的天性,也是获取知识的第一步。

大数据和机器学习的全部要点在于避免粗糙思考。

有一个更大的问题,那就是K均值算法只有在集群易于区分的情况下才能起作用:在超空间中,每个集群可看作一个球团,每个团距离彼此都很远,而它们都有相似的体积,并包含想近数量的物体。

无论何时,当我们想掌握某个统计模型,但又缺乏一些关键信息时(如例子的类别),就可以利用EM。这使它在所有机器学习中成为最受欢迎的算法。

机器学习算法称该过程为维数约减,因为该过程将大量的可见维度(像素)简化称几个隐形维度(表情、面部特征)。维数约减对于应对大数据来说很关键。

寻找主要成分的整个过程,可以利用线性代数一次性完成。

主要成分分析(PCA),正如人们对该过程的了解,是科学家的工具箱中关键的工具之一。PCA属于线性算法。

PCA完全没有解释数据的形状,而是奖其模糊化了。

对于非线性降维算法来说,最受欢迎的算法——等距映射算法,就可以实现这一点。

等距映射算法有惊人的能力,可以对准复杂数据中最重要的维度。

时间,换句话说,就是记忆的主要成分。

聚类和维度简化虽然使我们更加靠近人类学习,但仍丢失了一些很重要的东西——互动。

在任何情况下,步进监督都不应该被采用(用于互动)。家长不糊教自己的孩子爬、走或者跑,他们都是自己摸索。目前为止,所有的学习算法都不能做到这一点。

人类确实有稳定的向导:情感。我们追求快乐,躲避痛苦。

有一个机器学习的子域致力于这样的算法:进行主动探索,偶然得到奖励,然后弄清楚将来怎样才能再得到奖励。这个过程称为“强化学习”。

强化学习的一个重要先驱是跳棋游戏程序,这是IBM的研究员阿瑟·塞缪尔于20世纪50年代编写的。棋盘游戏是强化学习问题的典范:你得走好多步棋,却得不到任何反馈,奖励或惩罚都是在最后一刻揭晓,其形式也就是嬴和输。

强化学习的首要思想是:并不是所有的状态都有奖励,但每种状态都会有价值。

强化学习通过估算每种状态的价值来做到这一点,从该状态开始你所期望得到的全部奖励,然后选择能将奖励最大化的行为。

强化学习面对利用——探索困境的解决方法是:时而选择最佳行动,时而随机选择。

实际上,强化学习就是一种加速进化过程——尝试、丢弃,然后在单个生命的一生而不是几代中改进行动——有了这个标准,它的效率就会很高。

对于强化学习的研究自20世纪80年代早期才正式开始,马萨诸塞大学的里奇·萨顿和安迪·巴尔托参与了研究工作。他们认为学习取决于与环境的互动,这一点很关键,但监督算法并没有发现这一点。

1989年,当时剑桥大学的克里斯·沃特金斯在儿童学习实验发的的推动下,实现了强化学习的现代形式,即在未知环境中进行最优控制。

在监督式学习中,某个状态的目标价值总是一样的;但在强化学习中,它会不断变化。

讽刺的是,人在最痛苦时学到的东西往往最多。

通过练习你会做的更好,但不会以恒定覅人速度进步:一开始你进步很快,接下来就没那么快了,最后你变得很慢。

组块是一个来自感知与记忆心理学的概念。

人类解决问题的方式是将问题分解为小问题,再将小问题分解为更小的问题,然后系统地减少初始状态与目标状态之间的差异。

于是纽厄尔、罗森布鲁姆、莱尔德作出这样的假设——组块是学习所需的“唯一”机制,换句话说,就是终极算法。

尝试将强化学习、监督式学习,以及别的一切简化称组块,基本上会制造更多的问题,而不会解决问题。

A/B测试证明常听到的批评言论的错误:大数据制对寻找相关关系有好处,对寻找因果关系则没用。

了解一个实体的最佳方法——无论它是人、动物、网页还是分子——就是了解它如何与其他实体进行连接。

关联学习算法能达到的最佳效果就是让懒散的老师变得勤奋。

终极算法

终极算法——第八章:无师自通相关推荐

  1. 重构机器学习算法的知识体系 - 《终极算法》读书笔记

    2019独角兽企业重金招聘Python工程师标准>>> 最近有幸从图书馆借阅了Pedro Domingos的<The Master Alogrithm>一书,这本书的中文 ...

  2. JVM内存管理------GC算法精解(五分钟教你终极算法---分代搜集算法)

    转载自   JVM内存管理------GC算法精解(五分钟教你终极算法---分代搜集算法) 引言 何为终极算法? 其实就是现在的JVM采用的算法,并非真正的终极.说不定若干年以后,还会有新的终极算法, ...

  3. 大咖来信 | 张亚勤@2018:终日“闭关”读论文,思考终极算法

    李根 发自 凹非寺  量子位 报道 | 公众号 QbitAI 张亚勤是1998年决定回国的,距今已过20年. 这20年中,技术变革天翻地覆,中国发展也日新月异.他见证了互联网在中国的从弱到强,也看到了 ...

  4. 终极算法——第一章:机器学习的革命

    本文为阅读总结个人认为书里概念性的.对本人有帮助的内容,仅供参考. 我们生活在算法的时代. 算法就是一系列指令,告诉计算机该做什么,即如何操作计算机中的几十亿晶体管.所有算法,无论多复杂,都能分解为三 ...

  5. 终极算法【7】——类推学派

    类比是推动许多历史上最伟大科学进度的动力.当达尔文阅读马尔萨斯的<人口论>时,被经济和自然界中生存竞争的相似性触动,所以有了自然选择理论的诞生. 类比在机器学习中扮演重要性刚开始进展缓慢, ...

  6. 终极算法——第三章:符号学派:休谟的归纳问题

    本文为阅读总结个人认为书里概念性的.对本人有帮助的内容,仅供参考. 你是理性主义者还是经验主义者? 理性主义者认为,感官会欺骗人,而逻辑推理是通往知识的唯一可靠的道路.经验主义者认为所有推理都不可靠, ...

  7. 终极算法——第七章:类推学派:像什么就是什么

    本文为阅读总结个人认为书里概念性的.对本人有帮助的内容,仅供参考. 类比式推动许多历史上最伟大科学进步的动力. 类比推理有着突出的知识谱系.亚里士多德在他的相似律中就表达了这一点:如果两个事物相似,其 ...

  8. SEO优化指南与c语言,SEO终极算法:一篇文章精通SEO优化

    今天是2017年9月14日,我大概是2015年7月份开始接触的SEO,如今已经有整整两年多的时间了,怎么说我也算半个老司机了.之前我也写过关于SEO优化一整套的优化流程,比如SEO终极算法系列,这一次 ...

  9. 斗地主AI算法——第八章の被动出牌(2)

    上一章我们已经搭好了被动出牌的基本架子,本章我们主要说明一下被动出牌算法的基本步骤. 我把出牌逻辑分为四个阶段,也就是策略的优先级.分别是:[直接打光手牌]→[同类型牌压制]→[炸弹王炸压制]→[不出 ...

最新文章

  1. 高空抛物悲剧频出,AI 监控系统:让我来「罩」着你
  2. 教你如何配置Tomcat 绑定指定目录的工程文件
  3. 全球首款5g全网通智能路由器华为5G CPE Pro发布 售价2499元
  4. C#利用委托跨线程更新UI数据
  5. php in_array性能优化
  6. bitnami_redmine3.3.0-1 问题及备份恢复
  7. 定制.NET GridView的长文本显示表格
  8. java list filter_Java8使用stream().filter()过滤List对象(查找符合条件的对象集合)
  9. linux网络对时命令
  10. linux怎样获得最好权限,详解2种Linux获得管理员权限方法
  11. c语言编程环境搭配,windows7系统搭建C语言开发环境的操作方法?
  12. acer台式电脑怎么重装系统_宏基台式电脑怎么重装系统
  13. ElementUI 日期组件在IE下数据无法正常显示
  14. 天行健,君子以自强不息;地势坤,君子以厚德载物
  15. uni-app的video禁止快进及seek()上的小坑
  16. XP计算机里改单核,如何将双核CPU改成单核CPU 双核改单核教程
  17. 【Spring】IOC:基于注解的IOC容器初始化源码分析
  18. ciscn_2019_n_7(exit_hook)、wdb_2018_1st_babyheap(fsop的例子)
  19. js 实现页面语音播报
  20. 为什么这么多的顶尖黑客来自俄罗斯?

热门文章

  1. 演讲干货 | 招聘版「狼人杀」详解,企业面试提效增速神器
  2. 怎么写年终工作总结,能让老板更认可我?
  3. LayUI upload上传组件上传文件的两种方式(手动上传、自动上传)
  4. 12个Excel实用小技巧
  5. 预览word文件,支持下载(微软提供)
  6. 如何提升DT场景下的AEC效果
  7. 悬浮的广告是怎么用js设计出来的
  8. 安徽淮北市高中计算机学校,安徽淮北实力强悍的4所高中,全是省级示范中学,有你的母校吗?...
  9. [渝粤教育] 浙江工业大学 运动控制系统 参考 资料
  10. oneui2正式版,三星全系OneUI正式版官方更新时间表曝光:最早明年二月