转自:http://www.52cs.org 作者:老师木

首先先简单写点吴军《数学之美》和李航《统计机器学习原理》的书评,然后再谈我心中理想的机器学习书。

我买了一本吴军的《数学之美》,这是一本不错的科普书,特色是作者与很多传奇人物有过交往,能讲一些他们的八卦。但原理介绍方面,还是有一些瑕疵。1)最大熵、LR、CRF这三个算法本是一个道理,却分散在三章中介绍,而且也没有指出他们的联系;2)动态规划在全书中有好几处应用:地图搜索、维特比算法、HMM、CRF等,同样一个算法分散介绍也不突出他们的内在联系;3)“聚类”和“分类”混用;4)“不可计算”是一个与NP-COMPLETTE不同的概念。

吴军在讨论“规则与统计”,以及对阿米特-辛格之简单哲学的吹捧,显得很没境界。哪个流派称为显学,哪个没落,十年河东,十年河西而已,历史上这样的故事发生了很多次了。而且他在讨论“规则与统计”时捧统计抑规则,而在讨论艾米特辛格简单哲学时,捧规则抑统计,不知他信仰到底是什么?

李航的书对LR与MaxEnt之间的关系介绍得也不够理想。应引入指数族分布,给定一些约束求最大熵分布,数学结果是指数族分布;且参数结果与已知分布为指数族时的最大似然解等价。具有广泛实例的指数族竟是最大熵原理的自然结果,让人感叹自然界的奇迹,也内心欣赏这样一个连定理都称不上的原则的神奇。

机器学习书,数学的严谨当然不可少,但只堆公式还不够,若看公式直接找论文就可以了,没必要看书。

物理意义。一定要给每一个数学结论都赋予物理意义。来龙去脉,给出每一个重要发展的来龙去脉、历史渊源或者八卦背景,学术点叫motivation。只有了解这些才能融会贯通,历史地理解一个方法或理论的地位、局限性等。

每一个问题的最好说明方式。有很多艰深的理论,极难理解,但总有各种著作有自己的阐述方式,写作者要了解这些已有的阐述方式,并判断哪种方式最绝妙,若不存在已有的好的方式,则要自己创造,只要作者理解深刻,一定能找到简单的说明方式。

深度和广度。不只是罗列算法,对领域内最深刻的问题不能逃避,计算学习理论有两本教材,翻过的人会知道这些基本的东西都不难理解。广度,机器学习所涉及的随机、矩阵、优化自然少不了,人工智能、信号处理。信息论中胡同的方法和理论也要拿来举一反三,心理学、脑科学。哲学问题也要大胆讨论。

实在。要传达给读者最有用的理念,理论是帮助人认识问题的,不是唬人的,必须向读者说明某某东西说白了就是什么。对介绍的东西不要一味吹捧,必须有批判。作者不能纸上谈兵,必须有丰富的实战经验。

综合。各种理论,算法直接的联系,使读者学会一个就轻松了解另一个。已有书在这个方向上努力了,但还不够。

现在有书达到这个要求了吗?都只是部分达到。这些要求太高了,除非作者把写书当作事业。ESP、PRML都是经常被推荐的书。李航的书可取之处是重要的结论都有推导,还给出一个很简单的例子一步一步手算。

现在有一本Kevin Murphy出了一个 Machine Leaning:a probabilistic perspective,这本书不错,我写过一句话评论:complete but not comprehensive enough。 有些独特的东西,以后再谈。

0

【 理想的机器学习书】相关推荐

  1. 写给大家看的机器学习书【Part3】直观易懂的感知机学习算法PLA

    作者:徐晗曦 原文:写给大家看的机器学习书(第三篇) 本次转载已获得作者授权,尊重原创,若需转载请联系作者本人. 相关文章: 写给大家看的机器学习书[Part1]什么是机器学习?机器学到的到底是什么? ...

  2. 美国三院院士、加州大学伯克利分校统计系主任Michael I. Jordan介绍[推荐的机器学习书单等] (公号可下载PDF)

    美国三院院士.加州大学伯克利分校统计系主任Michael I. Jordan介绍[推荐的机器学习书单等] (公号可下载PDF) 原创: 秦陇纪 科学Sciences 今天 科学Sciences导读:论 ...

  3. 原来,王兴是理想汽车的「二当家」!股份只比李想少1.6%丨理想汽车招股书

    郭一璞 搬运自 SEC 量子位 报道 | 公众号 QbitAI 今天,理想汽车(Li Auto Inc.),向SEC提交了招股书,开启纳斯达克IPO冲刺之旅. 理想汽车,名如其人,就是那个高中辍学,却 ...

  4. 写给大家看的机器学习书【Part1】什么是机器学习?机器学到的到底是什么?

     写给大家看的机器学习书[Part1]什么是机器学习?机器学到的到底是什么? 机器学习 深度学习 神经网络 人工智能 阅读1390

  5. 机器学习书单(实践篇)

    机器学习书单 (实践篇) HZBOOK 长按二维码了解及购买 <Python机器学习(原书第2版)> ISBN:978-7-111--55880-4 作 者: [美] Sebastian ...

  6. 不用啃大部头,这本《100页的机器学习书》已收获7000读者

    郭一璞 发自 麦拜德  量子位 报道 | 公众号 QbitAI 看书从来都是一个系统工程,尤其是读严肃的内容,啃大部头的书总是让人感到脑壳疼. 所以,这位名叫Andriy Burkov的小哥干脆说:我 ...

  7. 【好书推荐】推荐一份从入门到进阶的机器学习书单

    今天推荐的图书专注机器学习主题,一共7本,都是经过实践检验的好书--<机器学习><图解机器学习><机器学习实战><机器学习系统设计><Spark机 ...

  8. 百面机器学习第一章——特征工程(基本是百面机器学习书的内容)

    02.类别型特征 ------------------------------------------ 场景描述 类别型特征(Categorical Feature)主要是指性别(男.女).血型(A. ...

  9. 损失函数结果不理想解决方案——机器学习

    Tips for training 如何得到更好的训练结果 Model bias Optimization Hessian 矩阵法优化 Small Batch Gradient Descent + M ...

  10. 机器学习入门的书单(数据挖掘、模式识别等一样)

    好久没有写博客了,最近的主题还是机器学习了.上了一年的课,自己也看了一两本书,但是对整个机器学习还是很迷茫.看看其他人怎么做的吧. (写在前面)昨天说写个机器学习书单,那今天就写一个吧.这个书单主要是 ...

最新文章

  1. 有n个人围成一圈,按顺序从1到n编号。从第一个人开始报数
  2. C# (逻辑与) ||(逻辑或)优先级辨析
  3. 查看mysql SQL物理读_Oracle查看逻辑读、物理读资源占用排行的SQL语句
  4. java开源库web3j的以太坊过滤器(filter)和智能合约事件(event)教程
  5. 图像卷积和图像滤波的一些知识
  6. 信息学奥赛一本通(1009:带余除法)
  7. OpenCV简单应用(一、摄像头拍照)
  8. 12000字解读BabyCare:母婴用品品牌的终局是走向全品类吗?
  9. dcp7080d怎么加墨粉_兄弟7080打印机怎么加粉
  10. OpenGL第八版--初识OpenG
  11. 《高性能MySQL》读书笔记(1~6章)
  12. pod2g宣布A5的Sandbox破解成功
  13. Vue 钩子函数activated未触发
  14. 尤雨溪:VUE 3 之后会休息一下
  15. 华为HCIP之静态路由
  16. ImageGP/BIC无代码绘制差异基因火山图
  17. 游戏王-黑暗大魔法师发动教程
  18. 雷电3菊链功能_别选错!笔记本的Type-C和雷电3接口区别可大了
  19. ‘A’与”A”的区别
  20. 学习css3,使用代码实现一根心爱的二踢脚

热门文章

  1. 19. 镜像二叉树(C++版本)
  2. mysql 结果集换页_MySQL 按结果集分页
  3. 出场顺序很重要下一句_孩子爱不爱你,出场顺序很重要
  4. #笔记2021-08
  5. 解决ubuntu不能远程连接
  6. python使用redis实现session_redis与python交互session的redis存储配置
  7. oracle 如何使用循环语句,Oracle条件语句跟循环语句
  8. oracle pivot 去除引号,使用pivot显示列式统计结果实例
  9. SQL:postgresql增加自增字段
  10. oracle高级函数api,Oracle函数-高阶篇