例子,给出西瓜数据集,根据某个西瓜三个属性的描述,判断瓜的好坏

编号 色泽 根蒂 敲声 好瓜
1 青绿 蜷缩 浊响
2 乌黑 蜷缩 清脆
3 青绿 硬挺 沉闷
4 乌黑 稍蜷 沉闷

样本空间

以样本的属性为坐标轴张成的多维空间,也叫属性空间、输入空间。

上例中,每行样本包含三个属性:色泽、根蒂、敲声,则可以以这三个属性为坐标轴,生成一个三维空间,每个西瓜(只要用这三种属性描述)都能在该空间中找到其对应的坐标位置。

假设空间

上例中,假设空间由形如 “(色泽=?) ∧ (根蒂=?) ∧ (敲声=?)” 的所有假设组成。

如果属性色泽、根蒂、敲声分别有3 、2 、2种可能取值,还要考虑到一种属性可能无论取什么值都合适(用通配符*表示),另外有一种情况就是好瓜这个概念根本不成立(用∅表示),则假设空间大小为 (3 + 1)×(2 + 1)×(2 + 1)+ 1 = 37 。

假设空间部分如下,
1 色泽=*,根蒂=*,敲声=*
2 色泽=青绿,根蒂=*,敲声=*
3 色泽=乌黑,根蒂=*,敲声=*
4 色泽=*,根蒂=蜷缩,敲声=*
5 色泽=*,根蒂=硬挺,敲声=*

36 色泽=乌黑,根蒂=稍蜷,敲声=*
37 Ø

学习过程就是,从假设空间不断删除与正例不一致或者与反例一致的假设,最终得到对所有训练样本能进行正确判断的假设,这样我们最后就可以得到一组形如 “色泽=? ∧ 根蒂=? ∧ 敲声=? ⇔ 好瓜 ” 的概念作为学习结果。

版本空间

因为训练样本数量有限,假设空间含有很多假设,最终筛选后有可能剩下多个假设是符合训练样本的,这些剩下的假设组成的集合就称为版本空间。
版本空间的例子

机器学习笔记(1)—— 样本空间、假设空间、版本空间相关推荐

  1. 机器学习#假设空间与版本空间

    读周志华的机器学习,卡在假设空间和版本空间这一块了,写一下自己的理解: 假设空间:所有属性的可能性(可能取值)组合形成的假设(假设*,*,*为好瓜),组成假设空间,以西瓜问题假设为例.色泽属性可取(青 ...

  2. 西瓜书_1、符号学习、迁移学习、连接主义、假设空间、版本空间

    一.符号学习 符号学习是指学习单个符号或一组符号的意义,人必须通过反复的学习来建立符号与其代表的事物之间的等值关系.例如,儿童通过学习,可以用"苹果"或"apple&qu ...

  3. 机器学习中的概念---输入空间、标记空间、样本空间、假设空间、版本空间

    一:输入空间/特征空间/属性空间 这三个概念都是指的X,都是指的输入量 二:标记空间/输出空间 指的是Y,指的是输出量.(有时候,X-Y的所有映射也被当作Y,概念上有点混乱) 一:样本空间 样本空间的 ...

  4. 人工智能(1)-样本空间、假设空间、版本空间

    这儿主要归纳一下,样本空间.假设空间.版本空间的定义,三者的联系与区别. 西瓜数据集 编号 色泽 根蒂 敲声 好瓜 1 青绿 蜷缩 浊响 是 2 乌黑 蜷缩 浊响 是 3 青绿 硬挺 清脆 否 4 乌 ...

  5. (西瓜书)#版本空间与样本空间

    假设空间:所有属性值可能取值的集合 版本空间:与已知数据集一致的假设空间的子集合 求西瓜问题的版本空间 色泽属性可取(青绿,乌黑,*),根蒂属性可取(蜷缩,硬挺,稍蜷,*),敲声属性可取(浊响,清脆, ...

  6. 西瓜书(周志华):什么是版本空间以及如何求取版本空间

    下面是自己结合百度的资料来理解的一些比较通俗的说法: 假设空间:属性所有可能取值组成的可能的样本 版本空间:与已知数据集一致的所有假设的子集集合. (绿色加号代表正类样本,红色小圈代表负类样本) GB ...

  7. 机器学习中的隐变量/潜变量和隐藏空间/潜在空间

    机器学习中的隐变量/潜变量和隐藏空间/潜在空间 1.什么是隐变量? 1.什么是潜在空间(Latent Space)? 2.机器学习中为什么要压缩数据? 3.潜在空间中的"空间"是什 ...

  8. oracle查看表空间的内容,学习笔记:Oracle查看object对象 表空间 表 索引 数据文件的使用空间...

    天萃荷净 运维DBA咨询想要查看Oracle的object对象的使用空间大小,包括表空间 表 索引 数据文件的使用空间 1.查看Oracle表空间大小 Select Tablespace_Name,S ...

  9. 机器学习笔记(六) ---- 支持向量机(SVM)

    支持向量机(SVM)可以说是一个完全由数学理论和公式进行应用的一种机器学习算法,在小批量数据分类上准确度高.性能好,在二分类问题上有广泛的应用. 同样是二分类算法,支持向量机和逻辑回归有很多相似性,都 ...

最新文章

  1. linux 远程挂载摄像头_基于Linux的嵌入式网络摄像机设计
  2. 软件开发是一门手艺活
  3. C#统计子字符串出现次数(转帖,http://www.it130.cn/)
  4. 黑客道诠释完整版1-7
  5. hiberante 二级缓存设置
  6. 图标出问题_同是Office365,为什么你的软件图标还是旧版的?
  7. BugkuCTF-Reverse题Easy_vb多方法解决
  8. linux监听端口无响应,linux – tomcat运行,但是8080端口没有响应
  9. 对WinForm的App.config文件进行加密
  10. 拓端tecdat|数据度量消费贷款—消费者的考虑因素数据分析
  11. html炫酷动态时钟代码,HTML5动态时钟代码
  12. [论文总结] 深度学习在农业领域应用论文笔记8
  13. Pycharm修改镜像源并添加信任
  14. 苹果小企业项目申请App Store Small Business Program
  15. 去掉UISearchBar自带的的边框背景
  16. 计算机高特效吃鸡游戏主机配置单,吃鸡最高特效配置 万元i7-8700K/GTX1080Ti吃鸡特效全开配置 (全文)...
  17. SEM和SD的区别和联系,以及其计算方法
  18. 微信小程序分析送积分功能如何实现_微信积分小程序特色功能——积分营销
  19. 教你如何做好微信客户管理?做到这3点,效率翻5倍
  20. 第一篇:爬虫基本原理

热门文章

  1. 海思HI3751_Android解决方案 开发指南
  2. 绝世舞姬计算机弹音乐,绝世舞姬(伴奏)
  3. HDFS中四个核心的设计
  4. iOS中网络编程长连接
  5. 开发人员的人品问题 收藏
  6. preg_replace与远程代码执行
  7. php 网站访问统计插件,帝国CMS教程_网站访问统计插件使用教程_好特教程
  8. stm32 hid游戏手柄程序
  9. mysql 按时间累计计算_mysql查询——计算占比与累计占比
  10. Java学生信息管理系统——管理员登录模块(简单易上手)