西瓜书《机器学习》无疑是机器学习的必读书籍。本书作为该领域的入门教材,在内容上尽可能涵盖机器学习基础知识的各方面。 为了使尽可能多的读者通过本书对机器学习有所了解, 作者试图尽可能少地使用数学知识. 然而, 少量的概率、统计、代数、优化、逻辑知识似乎不可避免。

对于这本书,我是非常推荐的。但是对于很多初学者或者数学基础不是特别扎实的同学们来说,想要完整、清晰地弄懂这本书其实并不容易。因此,一份优秀的笔记对于我们学习本书来说,帮助很大。

今天就给大家推荐一个西瓜书《机器学习》的精炼版笔记。作者 Vay-keen 来自深圳大学,将自己整理的完整版笔记发布在了 GitHub 上。直接放出笔记地址:

https://github.com/Vay-keen/Machine-learning-learning-notes

对于这份笔记,作者这样说:

周志华《机器学习》又称西瓜书是一本较为全面的书籍,书中详细介绍了机器学习领域不同类型的算法(例如:监督学习、无监督学习、半监督学习、强化学习、集成降维、特征选择等),记录了本人在学习过程中的理解思路与扩展知识点,希望对新人阅读西瓜书有所帮助!

笔记目录

这份笔记总共包含 17 份 .md 文档,优势在于美分文档集合了图片和公式,清晰明了。这 17 份文档涵盖了西瓜书 16 章的完整内容。具体笔记目录如下:

  • 绪论

  • 性能度量

  • 假设检验&方差&偏差

  • 线性模型

  • 决策树

  • 神经网络

  • 支持向量机

  • 贝叶斯分类器

  • EM 算法

  • 集成学习

  • 聚类

  • 降维与度量学习

  • 特征选择与稀疏学习

  • 计算学习理论

  • 半监督学习

  • 概率图模型

  • 强化学习

笔记内容

下面,我们将摘录一些笔记的内容,供大家参考。

1. 线性回归

回归就是通过输入的属性值得到一个预测值,利用上述广义线性模型的特征,是否可以通过一个联系函数,将预测值转化为离散值从而进行分类呢?线性几率回归正是研究这样的问题。对数几率引入了一个对数几率函数(logistic function),将预测值投影到0-1之间,从而将线性回归问题转化为二分类问题。

2. 神经网络

在机器学习中,神经网络一般指的是“神经网络学习”,是机器学习与神经网络两个学科的交叉部分。所谓神经网络,目前用得最广泛的一个定义是“神经网络是由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所做出的交互反应”。

一直沿用至今的“M-P神经元模型”正是对这一结构进行了抽象,也称“阈值逻辑单元“,其中树突对应于输入部分,每个神经元收到n个其他神经元传递过来的输入信号,这些信号通过带权重的连接传递给细胞体,这些权重又称为连接权(connection weight)。细胞体分为两部分,前一部分计算总输入值(即输入信号的加权和,或者说累积电平),后一部分先计算总输入值与该神经元阈值的差值,然后通过激活函数(activation function)的处理,产生输出从轴突传送给其它神经元。M-P神经元模型如下图所示:

作者还给出了 BP 神经网络算法调整隐含层到输出层的权重调整规则的推导过程:

3. 支持向量机

支持向量机是一种经典的二分类模型,基本模型定义为特征空间中最大间隔的线性分类器,其学习的优化目标便是间隔最大化,因此支持向量机本身可以转化为一个凸二次规划求解的问题。

4. 集成学习

顾名思义,集成学习(ensemble learning)指的是将多个学习器进行有效地结合,组建一个“学习器委员会”,其中每个学习器担任委员会成员并行使投票表决权,使得委员会最后的决定更能够四方造福普度众生~...~,即其泛化性能要能优于其中任何一个学习器。

Boosting族算法最著名、使用最为广泛的就是AdaBoost,AdaBoost使用的是指数损失函数,因此AdaBoost的权值与样本分布的更新都是围绕着最小化指数损失函数进行的。

整个AdaBoost的算法流程如下所示:

以上只摘录了一小段笔记内容,完整的笔记请大家自行查阅,希望对你有所帮助。

最后,再次放上西瓜书开源笔记链接地址:

https://github.com/Vay-keen/Machine-learning-learning-notes

备注:西瓜书请买正版,支持下周志华老师

作者的公众号:

本站简介↓↓↓ 

“机器学习初学者”是帮助人工智能爱好者入门的个人公众号(创始人:黄海广)

初学者入门的道路上,最需要的是“雪中送炭”,而不是“锦上添花”。

本站的知识星球(黄博的机器学习圈子)ID:92416895

目前在机器学习方向的知识星球排名第一(上图二维码)

往期精彩回顾

  • 良心推荐:机器学习入门资料汇总及学习建议

  • 黄海广博士的github镜像下载(机器学习及深度学习笔记及资源)

  • 机器学习小抄-(像背托福单词一样理解机器学习)

  • 首发:深度学习入门宝典-《python深度学习》原文代码中文注释版及电子书

  • 机器学习的数学基础

  • 机器学习必备宝典-《统计学习方法》的python代码实现、电子书及课件

  • Python代码写得丑怎么办?推荐几个神器拯救你

  • 重磅 | 完备的 AI 学习路线,最详细的资源整理!

  • 图解word2vec(原文翻译)

  • CS229线性代数翻译

备注:本站qq群:865189078(共8个群,不用重复加)。

加入本站微信群,请加黄博的助理微信,说明:公众号用户加群。

推荐:周志华《机器学习》西瓜书精炼版笔记来了!相关推荐

  1. 周志华-机器学习西瓜书-第三章习题3.3 编程实现对率回归

    本文为周志华机器学习西瓜书第三章课后习题3.3答案,编程实现对率回归,数据集为书本第89页的数据 使用tensorflow实现过程 # coding=utf-8 import tensorflow a ...

  2. 【吃瓜教程】周志华机器学习西瓜书第三章答案

    线性模型结构梳理 3.1 试析在什么情形下式3.2中不必考虑偏置项b 答案一: 偏置项b在数值上代表了自变量取0时,因变量的取值: 1.当讨论变量x对结果y的影响,不用考虑b: 2.可以用变量归一化( ...

  3. 机器学习_周志华_西瓜书_学习笔记_第二章--模型的评估与选择

    2 模型的评估与选择 2.1 误差与过拟合 我们将学习器对样本的实际预测结果与样本的真实值之间的差异成为:误差(error).定义: 在训练集上的误差称为训练误差(training error)或经验 ...

  4. 机器学习(周志华)西瓜书 课后习题4.3 信息熵决策树算法——python实现(包括树的可视化)

    机器学习(周志华)西瓜书 课后习题4.3 信息熵决策树算法--python实现(包括树的可视化) 算法原理 1.信息熵 2.信息增益 我们所以要做的就是不断地从当前剩余的属性当中选取最佳属性对样本集进 ...

  5. 机器学习_周志华(西瓜书) 课后习题答案 第一章 Chapter1

    机器学习_周志华 课后习题答案 第一章 Chapter1 习题1.1 Q:表1.1中若只包含编号为1和4的两个样例,试给出相应的版本空间. 由所给出的数据集(训练集)可知,属性3个:色泽.根蒂.敲声, ...

  6. 从周志华的西瓜书到李宏毅的机器学习开源项目,一文总结Datawhale系列分享

    今天是开源组织Datawhale一周岁生日,这一年来,Datawhale 分享了很多优质内容,希望通过这篇总结帮助大家更好地系统学习. Datawhale是一个专注于AI领域的开源组织,也是我的亲密伙 ...

  7. 【周志华机器学习】八、集成学习

    文章目录 参考资料 1. 基本概念 1.1 个体与集成 2. Boosting 3. Bagging 4.随机森林 5. 结合策略 5.1 平均法(回归问题) 5.2 投票法(分类问题) 5.3 学习 ...

  8. 【周志华机器学习】十四、概率图模型

    文章目录 参考资料 1. 基本概念 2. 隐马尔可夫模型(HMM) 2.1 隐马尔可夫三大问题 1. 第一个问题解法 2. 第二个问题解法 3. 第三个问题解法 3. 马尔可夫随机场(MRF) 3.1 ...

  9. 【周志华机器学习】十二、计算学习

    文章目录 参考资料 1. 基本概念 2. PAC学习 3. 有限假设空间 3.1 可分情形 3.2 不可分情形 4. VC维 4.1 增长函数 4.2 对分与打散 4.3 VC维 5. 稳定性 参考资 ...

最新文章

  1. 修改C:\WINDOWS\system32\drivers\etc\hosts 文件有什么作用
  2. 安卓 屏蔽子控件点击事件
  3. 我们的合作伙伴Datawhale两岁啦!
  4. dblink查询_分库数据如何查询统计
  5. java集合源码分析之HashMap
  6. 外媒:苹果公司将在美国为其“苹果汽车”生产电池
  7. python小白从哪来开始-如何从零开始学习Python【小白入门】
  8. ea 如何画bce备选架构图_GitHub - wongdean/rime-settings at 941ea079832ff211723bce1ce8e47344e527575e...
  9. mysql查看当前连接数据
  10. 33. 深入解析互联网协议的原理
  11. 几个生僻字:烎,囧、槑、玊、奣、嘦、勥、巭、嫑、恏、兲、氼、忈、炛
  12. 迅为RK3399开发板外接固态硬盘测试
  13. nifty bootstrap_nifty admin_nifty admin 下载-一个高端的bootstrap后台管理模板
  14. 创建MySQL数据库·数据库笔记(三)
  15. 隐形眼镜的评价分析报告
  16. 科普:学C++的以后能从事哪些岗位?
  17. k8s 安装 elasticsearch(ECK)
  18. 不是运算容错,而是高温降频率,软件劣化老硬件
  19. 【分布式版本控制系统Git】| Git 分支操作、Git 团队协作机制、GitHub 操作
  20. 博弈论—NP图法kiki's game HDU - 2147

热门文章

  1. NOIp2018集训test-9-7(pm) (联考一day1)
  2. DB2查询结果显示n行
  3. Individual Project
  4. 实现锁死的有滚动条的div的表格(datagird)
  5. 解决android应用程序适用新老android系统版本方法
  6. 关于jstl动态变量用法
  7. c、c++、Java和gcc写Hello World
  8. java比python难_python java JAVA比python难多少?
  9. 【ML】 李宏毅机器学习一:error
  10. java读取文件指定位置_Java读取指定路径下的文件列表