文章目录

  • 第1章 绪论
  • 结语

第1章 绪论

1.1 求版本空间
先看书中示例
版本空间: 从假设空间删除掉与正例不一致和与反例一致的假设后,剩余的假设所组成的集合。它可以看成是对正例的最大泛化。

表1.1的训练数据集对应的假设空间应该如下:
1 色泽=*,根蒂=*,敲声=*
2 色泽=青绿,根蒂=*,敲声=*
3 色泽=乌黑,根蒂=*,敲声=*
4 色泽=*,根蒂=蜷缩,敲声=*
5 色泽=*,根蒂=硬挺,敲声=*
6 色泽=*,根蒂=稍蜷,敲声=*
7 色泽=*,根蒂=*,敲声=浊响
8 色泽=*,根蒂=*,敲声=清脆
9 色泽=*,根蒂=*,敲声=沉闷
10 色泽=青绿,根蒂=蜷缩,敲声=*
11 色泽=青绿,根蒂=硬挺,敲声=*
12 色泽=青绿,根蒂=稍蜷,敲声=*
13 色泽=乌黑,根蒂=蜷缩,敲声=*
14 色泽=乌黑,根蒂=硬挺,敲声=*
15 色泽=乌黑,根蒂=稍蜷,敲声=*
16 色泽=青绿,根蒂=*,敲声=浊响
17 色泽=青绿,根蒂=*,敲声=清脆
18 色泽=青绿,根蒂=*,敲声=沉闷
19 色泽=乌黑,根蒂=*,敲声=浊响
20 色泽=乌黑,根蒂=*,敲声=清脆
21 色泽=乌黑,根蒂=*,敲声=沉闷
22 色泽=*,根蒂=蜷缩,敲声=浊响
23 色泽=*,根蒂=蜷缩,敲声=清脆
24 色泽=*,根蒂=蜷缩,敲声=沉闷
25 色泽=*,根蒂=硬挺,敲声=浊响
26 色泽=*,根蒂=硬挺,敲声=清脆
27 色泽=*,根蒂=硬挺,敲声=沉闷
28 色泽=*,根蒂=稍蜷,敲声=浊响
29 色泽=*,根蒂=稍蜷,敲声=清脆
30 色泽=*,根蒂=稍蜷,敲声=沉闷
31 色泽=青绿,根蒂=蜷缩,敲声=浊响
32 色泽=青绿,根蒂=蜷缩,敲声=清脆
33 色泽=青绿,根蒂=蜷缩,敲声=沉闷
34 色泽=青绿,根蒂=硬挺,敲声=浊响
35 色泽=青绿,根蒂=硬挺,敲声=清脆
36 色泽=青绿,根蒂=硬挺,敲声=沉闷
37 色泽=青绿,根蒂=稍蜷,敲声=浊响
38 色泽=青绿,根蒂=稍蜷,敲声=清脆
39 色泽=青绿,根蒂=稍蜷,敲声=沉闷
40 色泽=乌黑,根蒂=蜷缩,敲声=浊响
41 色泽=乌黑,根蒂=蜷缩,敲声=清脆
42 色泽=乌黑,根蒂=蜷缩,敲声=沉闷
43 色泽=乌黑,根蒂=硬挺,敲声=浊响
44 色泽=乌黑,根蒂=硬挺,敲声=清脆
45 色泽=乌黑,根蒂=硬挺,敲声=沉闷
46 色泽=乌黑,根蒂=稍蜷,敲声=浊响
47 色泽=乌黑,根蒂=稍蜷,敲声=清脆
48 色泽=乌黑,根蒂=稍蜷,敲声=沉闷
49 Ø

按照上述过程进行学习:
(1,(色泽=青绿、根蒂=蜷缩、敲声=浊响),好瓜)
可以删除假设空间中的3、5、6、8、9、11-15、17-21、23-30、32-49
(2,(色泽=乌黑、根蒂=蜷缩、敲声=浊响),好瓜)
可以删除剩余假设空间中的2、10、16、31
(3,(色泽=青绿、根蒂=硬挺、敲声=清脆),坏瓜)
可以删除剩余假设空间中的1
(4,(色泽=乌黑、根蒂=稍蜷、敲声=沉闷),坏瓜)
剩余假设空间中无可删除的假设

学习过后剩余的假设为
4 色泽=*,根蒂=蜷缩,敲声=*
7 色泽=*,根蒂=*,敲声=浊响
22 色泽=*,根蒂=蜷缩,敲声=浊响
这就是最后的“假设集合”,也就是“版本空间”。

其中:图中清脆应改为浊响

本题解析
西瓜1((色泽=青绿、根蒂=蜷缩、敲声=浊响),好瓜))为正例
找到与它不一致的假设:3、5、6、8、9、11-15、17-21、23-30、32-49
西瓜4((色泽=乌黑、根蒂=稍蜷、敲声=沉闷),坏瓜))为反例
找到与它一致的假设:1,、3、6、9、15、21、30、48
所以在搜索过程中删除的假设有:1、3、5、6、8、9、11-15、17-21、23-30、32-49
剩下的假设有为:2、4、7、10、16、22、31
所以,所求版本空间为:{2、4、7、10、16、22、31}

1.2 与使用单个合取式来进行假设表示相比,使用“析合范式”将使得假设空间具有更强的表示能力。例如:好瓜←→((色泽=)∧(根蒂=蜷缩)∧(敲声=))∨((色泽=乌黑)∧(根蒂=)∧(敲声=沉闷)),会把“(色泽=)∧(根蒂=蜷缩)∧(敲声=)”以及“(色泽=乌黑)∧(根蒂=)∧(敲声=沉闷)”都分类为“好瓜”。若使用最多包含k个合取式的析合范式来表达表1.1西瓜分类问题的假设空间,试估算共有多少中可能的假设。(提示:注意冗余情况,如(A=a)∨(A=)与(A=)等价。)
本题解析
由题1.1知,共有49种假设,其中:
全部不泛化 2∗3∗3=182∗3∗3=18种假设;
一个属性泛化:2∗3+3∗3+2∗3=21种假设;
两个属性泛化:2+3+3=82+3+3=8种假设;
三属性泛化:1种假设
空集:1种假设
不考虑空集,则有48种假设,所以k的最大值为48。
而组成的析合范式是这48种假设的排列组合,展开序列为(即杨辉三角的一排):(1、48、1128、… 、1128、48、1)共49个数,左边的1表示:一个假设都没选,右边的1表示:全部假设都被选。

如果k=48,就是说最多采用48种合取式来组成析合范式,排除一种都不选的情况,就是2^48 - 1种。(2^48是根据二项式系数之和得的)
如果0<k<48,那就把展开序列的前k+1(因为展开序列从0开始数)项全部加起来再减1
如果指定了k的个数,那就是展开序列的第k+1(因为展开序列从0开始数)项的数

但是,这个结果得去重才行,因为泛化是对若干种假设的包含(包容),它本身不是某种假设。把泛化的 * 展开后,就是若干种具体的假设。如果此题采取48,那么把 * 展开后,假设集合中一定有重复,而且一种具体假设还不止重复一次。此题应该采用18种具体假设来计算, 就是:2^18 - 1

结语

如果你喜欢我写的文章,欢迎来踩我个人搭建的博客~
ChengNing’s Blog

周志华《机器学习》习题答案(不断更新中)相关推荐

  1. 《机器学习》周志华课后习题答案——第一章(1-3题完结)

    <机器学习>周志华课后习题答案--第一章 文章目录 <机器学习>周志华课后习题答案--第一章 一.表1.1中若只包含编号为1和4的两个样例,试给出相应的版本空间 二.与使用单个 ...

  2. 《机器学习》周志华课后习题答案——第三章 (1-7题)

    <机器学习>周志华课后习题答案--第三章 (1-7题) 文章目录 <机器学习>周志华课后习题答案--第三章 (1-7题) 一.试析在什么情形下式(3.2)中不必考虑偏置项b. ...

  3. 《机器学习》周志华课后习题答案——第八章 (1-2已完结)

    <机器学习>周志华课后习题答案---第五章 (1-2已完结) 文章目录 <机器学习>周志华课后习题答案---第五章 (1-2已完结) 一.如图所示 二.如图所示 一.如图所示 ...

  4. 《机器学习》周志华课后习题答案——第五章(1-7已完结)

    第五章课后习题答案 文章目录 第五章课后习题答案 一.试述将线性函数f(x) = wTx用作神经元激活函数的缺陷? 二.试述使用图5.2(b)激活函数的神经元与对率回归的联系 三.对于图5.7中的Vi ...

  5. 机器学习-周志华-课后习题答案-线性模型

    3.1试分析在什么情况下,在以下式子中不比考虑偏置项b. 答:在线性回归中,所有参数的确定都是为了让残差项的均值为0且残差项的平方和最小.在所有其他参数项确定后,偏置项b(或者说是常数项)的变化体现出 ...

  6. 机器学习-周志华-课后习题答案-决策树

    本文为博主原创,由于没有可以参考的答案,所以内容中若有错误的地方烦请指正,不甚感激. 注:本文中的代码均使用python,常用工具包包括 pandas,scikit-learn,numpy, scip ...

  7. 机器学习-周志华-课后习题答案5.5

    5.5 试编程实现标准BP算法和累计BP算法,在西瓜数据集3.0上分别用这两个算法训练一个单隐层网络,并进行比较. 通过编程实践发现,在本例下要达到某一限定的均方误差时,标准BP算法比累积BP算法明显 ...

  8. 周志华-机器学习西瓜书-第三章习题3.3 编程实现对率回归

    本文为周志华机器学习西瓜书第三章课后习题3.3答案,编程实现对率回归,数据集为书本第89页的数据 使用tensorflow实现过程 # coding=utf-8 import tensorflow a ...

  9. 周志华机器学习(西瓜书)学习笔记(持续更新)

    <周志华机器学习>笔记 第1章 绪论 1.1 引言 1.2 基本术语 1.3 假设空间 1.4 归纳偏好 1.5 发展历程 1.6 应用现状 第2章 模型评估与选择 2.1 经验误差与过拟 ...

  10. 机器学习 周志华 课后习题3.5 线性判别分析LDA

    机器学习 周志华 课后习题3.5 线性判别分析LDA 照着书上敲了敲啥都不会,雀食折磨 python代码 # coding=UTF-8 from numpy import * # 我安装numpy的时 ...

最新文章

  1. 存储过程授权给子用户
  2. [置顶]       设计模式之创建类模式——原型模式
  3. NSA释出逆向工程工具GHIDRA针对恶意软件逆向分析
  4. 如何将 DateTime 转成 UnixTime ?
  5. php xml表格形式输出,PHP XML如何输出nice格式
  6. 新浪微博分享 小记!!!(尚未成功)
  7. MTK平台调试LCD步骤浅析
  8. Sean Baxter 开发的GPU排序函数库
  9. php 什么函数获取ip,php函数获取在线ip与客户端ip
  10. 10 个 Linux 网络和监控命
  11. C# 使用 NPOI操作excle文件(读取与新建重写)
  12. CENTOS安装XXNET
  13. 打造最强浏览器之浏览器选择刨析及搜索引擎利用
  14. 【研发管理】质量管理之约瑟夫·M.朱兰
  15. python deap,安装Deap for Python(Spyder)
  16. 把ATmega128开发板转为Arduino
  17. flash绘制荷花多个图层_《荷花》Flash动画课件
  18. 用Python写的简易PDF阅读器
  19. html5在线裁剪,HTML5和JQuery裁剪图像实时预览缩略图并上传
  20. w ndoWs8pE模式下载,天意PE迷你版V2011.9.9(天意PE系统)下载 - 下载吧

热门文章

  1. Android:关闭软键盘自动弹出的解决方案
  2. 用一年时间备考,如何拿到高中学科竞赛金牌?
  3. 解决Windows挂起状态
  4. leaflet Api中文文档
  5. 循环input、thymeleaf使用a标签传值并跳转
  6. 解决Elasticsearch外网访问的问题(楼主亲测)
  7. win10程序员必备工具_与客户沟通的10种必备工具
  8. 可观测宇宙思维导图,结构图
  9. 素描对学计算机的意义,浅谈学习素描的目的和意义何在
  10. 使用arcMap发布要素服务到使用的全流程记录