下面是自己结合百度的资料来理解的一些比较通俗的说法:

假设空间:属性所有可能取值组成的可能的样本

版本空间:与已知数据集一致的所有假设的子集集合。

(绿色加号代表正类样本,红色小圈代表负类样本)

GB 是最大泛化正假设边界(maximally General positive hypothesis Boundary),;

SB 是最大精确正假设边界(maximally Specific positive hypothesis Boundary)

GB与SB之间所围成的区域就是版本空间。

----->总结:

在西瓜问题中,如何根据训练集求所对应的版本空间?

①写出假设空间:先列出所有可能的样本点(即特征向量)(即每个属性都取到所有的属性值)

②对应着给出的已知数据集,将与正样本不一致的、与负样本一致的假设删除。

即可得出与训练集一致的假设集合,也就是版本空间了。

----->举例:

表1.1的训练数据集对应的假设空间应该如下:

1 色泽=*,根蒂=*,敲声=*

2 色泽=青绿,根蒂=*,敲声=*

3 色泽=乌黑,根蒂=*,敲声=*

4 色泽=*,根蒂=蜷缩,敲声=*

5 色泽=*,根蒂=硬挺,敲声=*

6 色泽=*,根蒂=稍蜷,敲声=*

7 色泽=*,根蒂=*,敲声=浊响

8 色泽=*,根蒂=*,敲声=清脆

9 色泽=*,根蒂=*,敲声=沉闷

10 色泽=青绿,根蒂=蜷缩,敲声=*

11 色泽=青绿,根蒂=硬挺,敲声=*

12 色泽=青绿,根蒂=稍蜷,敲声=*

13 色泽=乌黑,根蒂=蜷缩,敲声=*

14 色泽=乌黑,根蒂=硬挺,敲声=*

15 色泽=乌黑,根蒂=稍蜷,敲声=*

16 色泽=青绿,根蒂=*,敲声=浊响

17 色泽=青绿,根蒂=*,敲声=清脆

18 色泽=青绿,根蒂=*,敲声=沉闷

19 色泽=乌黑,根蒂=*,敲声=浊响

20 色泽=乌黑,根蒂=*,敲声=清脆

21 色泽=乌黑,根蒂=*,敲声=沉闷

22 色泽=*,根蒂=蜷缩,敲声=浊响

23 色泽=*,根蒂=蜷缩,敲声=清脆

24 色泽=*,根蒂=蜷缩,敲声=沉闷

25 色泽=*,根蒂=硬挺,敲声=浊响

26 色泽=*,根蒂=硬挺,敲声=清脆

27 色泽=*,根蒂=硬挺,敲声=沉闷

28 色泽=*,根蒂=稍蜷,敲声=浊响

29 色泽=*,根蒂=稍蜷,敲声=清脆

30 色泽=*,根蒂=稍蜷,敲声=沉闷

31 色泽=青绿,根蒂=蜷缩,敲声=浊响

32 色泽=青绿,根蒂=蜷缩,敲声=清脆

33 色泽=青绿,根蒂=蜷缩,敲声=沉闷

34 色泽=青绿,根蒂=硬挺,敲声=浊响

35 色泽=青绿,根蒂=硬挺,敲声=清脆

36 色泽=青绿,根蒂=硬挺,敲声=沉闷

37 色泽=青绿,根蒂=稍蜷,敲声=浊响

38 色泽=青绿,根蒂=稍蜷,敲声=清脆

39 色泽=青绿,根蒂=稍蜷,敲声=沉闷

40 色泽=乌黑,根蒂=蜷缩,敲声=浊响

41 色泽=乌黑,根蒂=蜷缩,敲声=清脆

42 色泽=乌黑,根蒂=蜷缩,敲声=沉闷

43 色泽=乌黑,根蒂=硬挺,敲声=浊响

44 色泽=乌黑,根蒂=硬挺,敲声=清脆

45 色泽=乌黑,根蒂=硬挺,敲声=沉闷

46 色泽=乌黑,根蒂=稍蜷,敲声=浊响

47 色泽=乌黑,根蒂=稍蜷,敲声=清脆

48 色泽=乌黑,根蒂=稍蜷,敲声=沉闷

49 Ø

根据总结,按照上述过程进行学习:

(1,(色泽=青绿、根蒂=蜷缩、敲声=浊响),好瓜)

可以删除假设空间中的3、5、6、8、9、11-15、17-21、23-30、32-49

(2,(色泽=乌黑、根蒂=蜷缩、敲声=浊响),好瓜)

可以删除剩余假设空间中的2、10、16、31

(3,(色泽=青绿、根蒂=硬挺、敲声=清脆),坏瓜)

可以删除剩余假设空间中的1

(4,(色泽=乌黑、根蒂=稍蜷、敲声=沉闷),坏瓜)

剩余假设空间中无可删除的假设

学习过后剩余的假设为:

4 色泽=*,根蒂=蜷缩,敲声=*

7 色泽=*,根蒂=*,敲声=浊响

22 色泽=*,根蒂=蜷缩,敲声=浊响

这就是最后的“假设集合”,也就是“版本空间”。

西瓜书(周志华):什么是版本空间以及如何求取版本空间相关推荐

  1. 西瓜书周志华读书笔记

  2. 机器学习西瓜书(周志华)第七章 贝叶斯分类器

    第七章 贝叶斯分类器 1. 贝叶斯决策论 1.1 先验分布 1.2 后验分布 1.3 似然估计 1.4 四大概率在贝叶斯分类中指代含义 1. 朴素贝叶斯 7. 课后练习参考答案 1. 贝叶斯决策论 贝 ...

  3. 周志华机器学习(西瓜书)学习笔记(持续更新)

    <周志华机器学习>笔记 第1章 绪论 1.1 引言 1.2 基本术语 1.3 假设空间 1.4 归纳偏好 1.5 发展历程 1.6 应用现状 第2章 模型评估与选择 2.1 经验误差与过拟 ...

  4. 推荐:周志华《机器学习》西瓜书精炼版笔记来了!

    西瓜书<机器学习>无疑是机器学习的必读书籍.本书作为该领域的入门教材,在内容上尽可能涵盖机器学习基础知识的各方面. 为了使尽可能多的读者通过本书对机器学习有所了解, 作者试图尽可能少地使用 ...

  5. 周志华《机器学习》西瓜书出全新视频课啦!

    课程推荐: 算法理论+实战紧密结合 "机器学习"西瓜书训练营 不是每个人都适合2万小时定律,努力的方向不对,就是白努力. 如果你对人工智能跃跃欲试,第一步该怎么办?我们通常的做法是 ...

  6. 周志华-机器学习西瓜书-第三章习题3.3 编程实现对率回归

    本文为周志华机器学习西瓜书第三章课后习题3.3答案,编程实现对率回归,数据集为书本第89页的数据 使用tensorflow实现过程 # coding=utf-8 import tensorflow a ...

  7. 如何啃透周志华的《机器学习》西瓜书?

    嘿,如果让你推荐两本国内机器学习的入门经典作,你会推荐哪些呢? 相信大家和我一样,非李航的<统计学习方法>和周志华的<机器学习>莫属. 周志华老师的<机器学习>,相 ...

  8. 周志华西瓜书课后习题答案总目录

    https://blog.csdn.net/icefire_tyh/article/details/52064910 机器学习(周志华西瓜书)参考答案总目录 从刚开始学习机器学习到现在也有几个月了,期 ...

  9. 【吃瓜教程】周志华机器学习西瓜书第三章答案

    线性模型结构梳理 3.1 试析在什么情形下式3.2中不必考虑偏置项b 答案一: 偏置项b在数值上代表了自变量取0时,因变量的取值: 1.当讨论变量x对结果y的影响,不用考虑b: 2.可以用变量归一化( ...

最新文章

  1. 基于pytorch的模型压缩和模型剪枝Model Prune示例
  2. 遍历JavaScript中的数组
  3. 不开玩笑:请远离那些吃老本的同事
  4. 最大似然估计Maximum-likelihood (ML) Estimation
  5. nRF52832 — 连接指定name、UUID、addr的蓝牙设备
  6. SQL编程where子句与操作符
  7. windows7 64位下安装tensorflow终极解决方案
  8. php 单选框选中事件,html中的checkbox和radio事件选择用法详解
  9. C#学习笔记(十三):I/O操作
  10. 蓝桥杯 BASIC-5 基础练习 查找整数
  11. eclipse新建服务器项目,使用eclipse快速新建spirngboot项目的方法
  12. 整理一下Entity Framework的查询
  13. JZOJ5197 C
  14. paypal中授权返回_微信开放平台授权登录流程详解
  15. 步步为营VS 2008 + .NET 3.5(2) - VS 2008新特性之JavaScript Intellisense and Debugging
  16. eclipse插件开发的打包
  17. Spring mvc时间格式处理
  18. 2022年6月25日PMP考试通关宝典-4
  19. Java指定屏幕区域截屏
  20. JPA-Specification 实现复杂查询

热门文章

  1. 【shell】scp 同时向多个主机拷贝数据
  2. 如何利用Syncthing+蒲公英快速实现异地文件同步
  3. 如何解决Excel文档已损坏呢?
  4. 蜗牛星际修改82583V网卡MAC地址
  5. 魔兽世界称全球玩家达1150万
  6. javascript实现下拉列表框模糊查询
  7. CentOS7安装nfdump+nfsen+sflow 实现流量监控
  8. 离散数学中谓词逻辑推理规则总结,附各规则英文
  9. 微信公众号,主要分析哪些方面的数据?
  10. python大数据需要什么技术有前途_大数据就业前景好不好 一般要掌握哪些技术...