吃瓜笔记(第一、二章)

《机器学习》(周志华)

文章目录

  • 吃瓜笔记(第一、二章)
    • 笔记
    • 章节习题
    • 延伸思考

笔记

  1. 通过对大量的对象属性进行分析后得到模型的过程称之为训练

  2. 进行科学推理常用方法

    • 归纳

      • 从特殊到一般的总结、归纳出一般规律
    • 演绎
      • 从一般规律
  3. 不同的模型会有不同的归纳偏好,也会得到不同的推演结论

  4. 不同的偏好的算法,并非就有一个更好。而是,两者在不同的情况下,都会有自己的优势,更接近事实

  5. 合取式、析取式、合取范式、析取范式

    • 仅由有限个文字构成的析取式称作“简单析取式”:﹁p ∨ ﹁q p ∨ q
    • 仅由有限个文字构成的合取式称作“简单合取式”:﹁p ∧ ﹁q p ∧ q
    • 由有限个简单合取式构成的析取式称为析取范式:A = A1 ∨ A2 ∨ A3 ∨ … ∨ An
    • 由有限个简单析取式构成的合取式称为合取范式:A = A1 ∧ A2 ∧ A3 ∧ … ∧ An合取式:
  6. 在学习器学习过程中,应适当的泛化。过拟合 会使得,把训练样本的“独特”当做所有潜在样本的“普遍”特性,从而使得性能下降,通常因为学习能力太“强”造成。如:选择劳动力,因为选择的训练样本中劳动力,国籍均为中国。那么过拟合将国籍确定,则会使得泛化能力下降,而无法选取符合条件的“外籍”男性作为劳动力,但这显然是违背初衷,初衷为选择合适的男性作为劳动力。欠拟合反之,通常是因为学习能力低下造成。

  7. P 问题、NP 问题
    P 问题:能在多项式时间内解决的问题
    NP 问题:能在多项式时间内判断正确与否
    理想状态下,如果能让 NP=P,那么久能解决过拟合问题

  8. 评估泛化误差的常用方法

    • 留出法: 数据集一分为二,一部分测试集,一部分为训练集
    • 交叉验证法: 数据集分为多个互斥子集。每次剩一个作为测试集,其余均为训练集。而测试集可是是其中的任意一个子集。故,若将数据集分为 k 个子集,则可进行 k 次训练和测试
    • 自助法:
      将包含 n 个数据的数据集D,随机取n次,获得数据集D’作为训练集,而将数据集D中 n 次均没有取到过的数据,作为测试集

章节习题

1.1 包含编号为1,4的两个样例,给出相应的样版本空间

序号 色泽 根蒂 敲声 好瓜
1 青绿 蜷缩 浊响
4 乌黑 稍蜷 沉闷

析:

假设空间:所有可能出现的情况的集合

版本空间:与训练集一致的所有假设所构成的集合

共有三种属性,每种属性有三种情况,分别是:青绿、乌黑以及*(无所谓),故,假设空间空间为,3x3x3=27 种。但符合“好瓜”要求的仅可能是以下七种。

分别是:
(色泽=青绿)∧(根蒂=*)      ∧(敲声=*)
(色泽=*)      ∧(根蒂=蜷缩)∧(敲声=*)
(色泽=*)      ∧(根蒂=*)      ∧(敲声=浊响)
(色泽=青绿)∧(根蒂=蜷缩)∧(敲声=*)
(色泽=青绿)∧(根蒂=*)      ∧(敲声=浊响)
(色泽=*)      ∧(根蒂=蜷缩)∧(敲声=浊响)
(色泽=青绿)∧(根蒂=蜷缩)∧(敲声=浊响)

1.2. 与使用单个合取式来进行假设表示相比,使用“析合范式”将使得假设空间具有更强的表示能力。若使用最多包含k个合取式的析合范式来表达表1.1西瓜分类问题的假设空间,试估算有多少种可能的假设
题目中 三种属性,假设空间为: 3x4x4=48。所以 k 值,最大取值为 48。
占坑,回补

1.3 若数据包含噪声,则假设空间有可能不存在与所有训练样本都一致的假设,在此情况下,试设计一种归纳偏好用于假设选择
析:
噪声数据:噪声数据(Noisy Data)就是无意义的数据,这个词通常作为损坏数据的同义词使用
最暴力的方法,就是将属性值相同,但标记结果不同的任去掉其中一个

1.5 试述机器学习能在互联网搜索中哪些环节起到什么作用

  • 在输入阶段:

    • 分析用户的文本语义
    • 可以根据用户的输入文本给于相应的联想
  • 在搜索阶段:
    • 提高关键字匹配程度
    • 根于用户的搜索习惯提高内容的适配度
  • 在展示结果阶段:
    • 对返回结果进行排序,优先展示

延伸思考

  1. 机器学习必然是一个从 实践 -> 理论(模型预测) -> 实践 的一个过程。从实际中获取数据,对数学进行分析、建模,不断训练,最终进行预测在实际生活中运用,造福人类

机器学习 --《机器学习》(周志华)第一、二章相关推荐

  1. 机器学习 -- 《机器学习》(周志华) 第三章

    机器学习 – <机器学习>(周志华) 第三章 笔记 文章目录 机器学习 -- <机器学习>(周志华) 第三章 笔记 注 常用数学符号 正交回归 点距离线的距离是正交回归 线性回 ...

  2. 机器学习(周志华) 第九章聚类

    关于周志华老师的<机器学习>这本书的学习笔记 记录学习过程 本博客记录Chapter9 文章目录 1 聚类任务 2 性能度量 3 距离计算 4 原型聚类 4.1 k均值算法 4.2 学习向 ...

  3. 《机器学习》周志华第10章降维与度量学习 思维导图+笔记+习题

    K-Means与LVQ都试图以类簇中心作为原型指导聚类,其中K-Means通过EM算法不断迭代直至收敛,LVQ使用真实类标辅助聚类:高斯混合聚类采用高斯分布来描述类簇原型:密度聚类则是将一个核心对象所 ...

  4. 《机器学习》周志华 --第3章 线性模型 思维导图+笔记+习题

    基本形式 问题描述:给定由d个属性描述的示例x=(x1;x2;x3-xd),其中xi是x的第i个属性上的取值,线性模型试图学得一个通过属性的线性组合来进行预测函数, 函数形式:f(x) = w1x1+ ...

  5. 《机器学习》周志华课后习题答案——第一章(1-3题完结)

    <机器学习>周志华课后习题答案--第一章 文章目录 <机器学习>周志华课后习题答案--第一章 一.表1.1中若只包含编号为1和4的两个样例,试给出相应的版本空间 二.与使用单个 ...

  6. 机器学习 周志华 第一章课后习题

    机器学习 周志华 第一章课后习题 1.1 1.2 1.3 1.4 1.5 1.1 在下面这张图片中若只包含编号为1和4的两个样例,试给出相应的版本空间. 书上实例: 1.表 1.1 对应的假设空间如下 ...

  7. 机器学习_周志华(西瓜书) 课后习题答案 第一章 Chapter1

    机器学习_周志华 课后习题答案 第一章 Chapter1 习题1.1 Q:表1.1中若只包含编号为1和4的两个样例,试给出相应的版本空间. 由所给出的数据集(训练集)可知,属性3个:色泽.根蒂.敲声, ...

  8. 《机器学习》周志华课后习题答案——第三章 (1-7题)

    <机器学习>周志华课后习题答案--第三章 (1-7题) 文章目录 <机器学习>周志华课后习题答案--第三章 (1-7题) 一.试析在什么情形下式(3.2)中不必考虑偏置项b. ...

  9. 《机器学习》周志华 第二章——模型评估与选择笔记

    <机器学习>周志华 第二章--模型评估与选择 过拟合和欠拟合 过拟合:对训练数据拟合过当的情况,训练集表现很好,测试集表现差. 欠拟合:模型在训练和预测时都表现不好. 降低过拟合的方法: ...

最新文章

  1. Blend制作的下载动画
  2. 在哪开启oracle服务器,开启企业殿堂的钥匙 Oracle服务器的安装
  3. 皖西学院计算机协会组织部,皖西学院
  4. 我身边的计算机网,电脑在我身边作文700字
  5. Java基础学习总结 -- 图形用户界面GUI
  6. 算法设计与分析期末复习题(史上最详细)
  7. Java二叉树前序遍历
  8. 远程唤醒、WOL、Magic_Packet
  9. 运维简历怎么写项目描述_简历中的项目描述
  10. 鸿蒙系统吹了多少年了还没出,实话实说,在鸿蒙系统上,余承东吹了几次牛都没实现...
  11. . java.lang.IllegalArgumentException: requirement failed: Can only call getServletHandlers on a runn
  12. 公司技术分享-全文技术分享Lucene VS ElasticSearch VS Solr
  13. MFC CFile 读写文件
  14. 【台大郭彦甫】Matlab入门教程超详细学习笔记七:数值微积分(附PPT链接)
  15. 【继上篇】云计算架构概念和技术基础
  16. IIC通信协议(STM32学习笔记 一)
  17. JQuery-图片剪裁
  18. 代码混淆之class-winter
  19. java 变量过期实现
  20. Atom 打造无懈可击的 Markdown 编辑器

热门文章

  1. CNN(经典卷积神经网络)来了!
  2. JAVA计算机毕业设计企业门户网站(附源码、数据库)
  3. Morgan Stanley面经
  4. 高并发分布式系统中生成全局唯一订单号
  5. 0x00310030指令引用的0x00310030内存。该内存不能为written
  6. BNUOJ-4716题 IQ test
  7. badboy中文是什么意思_Bad boy 是什么意思
  8. js画图开发库--mxgraph--[wires-电路图.html]
  9. [世界杯] 英格兰 1:0小胜 巴拉圭
  10. 【ARMv8基础篇】400系列控制器IP