机器学习笔记(1)—— 样本空间、假设空间、版本空间
例子,给出西瓜数据集,根据某个西瓜三个属性的描述,判断瓜的好坏
编号 | 色泽 | 根蒂 | 敲声 | 好瓜 |
---|---|---|---|---|
1 | 青绿 | 蜷缩 | 浊响 | 是 |
2 | 乌黑 | 蜷缩 | 清脆 | 是 |
3 | 青绿 | 硬挺 | 沉闷 | 否 |
4 | 乌黑 | 稍蜷 | 沉闷 | 否 |
样本空间
以样本的属性为坐标轴张成的多维空间,也叫属性空间、输入空间。
上例中,每行样本包含三个属性:色泽、根蒂、敲声,则可以以这三个属性为坐标轴,生成一个三维空间,每个西瓜(只要用这三种属性描述)都能在该空间中找到其对应的坐标位置。
假设空间
上例中,假设空间由形如 “(色泽=?) ∧ (根蒂=?) ∧ (敲声=?)” 的所有假设组成。
如果属性色泽、根蒂、敲声分别有3 、2 、2种可能取值,还要考虑到一种属性可能无论取什么值都合适(用通配符*表示),另外有一种情况就是好瓜这个概念根本不成立(用∅表示),则假设空间大小为 (3 + 1)×(2 + 1)×(2 + 1)+ 1 = 37 。
假设空间部分如下,
1 色泽=*,根蒂=*,敲声=*
2 色泽=青绿,根蒂=*,敲声=*
3 色泽=乌黑,根蒂=*,敲声=*
4 色泽=*,根蒂=蜷缩,敲声=*
5 色泽=*,根蒂=硬挺,敲声=*
…
36 色泽=乌黑,根蒂=稍蜷,敲声=*
37 Ø
学习过程就是,从假设空间不断删除与正例不一致或者与反例一致的假设,最终得到对所有训练样本能进行正确判断的假设,这样我们最后就可以得到一组形如 “色泽=? ∧ 根蒂=? ∧ 敲声=? ⇔ 好瓜 ” 的概念作为学习结果。
版本空间
因为训练样本数量有限,假设空间含有很多假设,最终筛选后有可能剩下多个假设是符合训练样本的,这些剩下的假设组成的集合就称为版本空间。
版本空间的例子
机器学习笔记(1)—— 样本空间、假设空间、版本空间相关推荐
- 机器学习#假设空间与版本空间
读周志华的机器学习,卡在假设空间和版本空间这一块了,写一下自己的理解: 假设空间:所有属性的可能性(可能取值)组合形成的假设(假设*,*,*为好瓜),组成假设空间,以西瓜问题假设为例.色泽属性可取(青 ...
- 西瓜书_1、符号学习、迁移学习、连接主义、假设空间、版本空间
一.符号学习 符号学习是指学习单个符号或一组符号的意义,人必须通过反复的学习来建立符号与其代表的事物之间的等值关系.例如,儿童通过学习,可以用"苹果"或"apple&qu ...
- 机器学习中的概念---输入空间、标记空间、样本空间、假设空间、版本空间
一:输入空间/特征空间/属性空间 这三个概念都是指的X,都是指的输入量 二:标记空间/输出空间 指的是Y,指的是输出量.(有时候,X-Y的所有映射也被当作Y,概念上有点混乱) 一:样本空间 样本空间的 ...
- 人工智能(1)-样本空间、假设空间、版本空间
这儿主要归纳一下,样本空间.假设空间.版本空间的定义,三者的联系与区别. 西瓜数据集 编号 色泽 根蒂 敲声 好瓜 1 青绿 蜷缩 浊响 是 2 乌黑 蜷缩 浊响 是 3 青绿 硬挺 清脆 否 4 乌 ...
- (西瓜书)#版本空间与样本空间
假设空间:所有属性值可能取值的集合 版本空间:与已知数据集一致的假设空间的子集合 求西瓜问题的版本空间 色泽属性可取(青绿,乌黑,*),根蒂属性可取(蜷缩,硬挺,稍蜷,*),敲声属性可取(浊响,清脆, ...
- 西瓜书(周志华):什么是版本空间以及如何求取版本空间
下面是自己结合百度的资料来理解的一些比较通俗的说法: 假设空间:属性所有可能取值组成的可能的样本 版本空间:与已知数据集一致的所有假设的子集集合. (绿色加号代表正类样本,红色小圈代表负类样本) GB ...
- 机器学习中的隐变量/潜变量和隐藏空间/潜在空间
机器学习中的隐变量/潜变量和隐藏空间/潜在空间 1.什么是隐变量? 1.什么是潜在空间(Latent Space)? 2.机器学习中为什么要压缩数据? 3.潜在空间中的"空间"是什 ...
- oracle查看表空间的内容,学习笔记:Oracle查看object对象 表空间 表 索引 数据文件的使用空间...
天萃荷净 运维DBA咨询想要查看Oracle的object对象的使用空间大小,包括表空间 表 索引 数据文件的使用空间 1.查看Oracle表空间大小 Select Tablespace_Name,S ...
- 机器学习笔记(六) ---- 支持向量机(SVM)
支持向量机(SVM)可以说是一个完全由数学理论和公式进行应用的一种机器学习算法,在小批量数据分类上准确度高.性能好,在二分类问题上有广泛的应用. 同样是二分类算法,支持向量机和逻辑回归有很多相似性,都 ...
最新文章
- linux 远程挂载摄像头_基于Linux的嵌入式网络摄像机设计
- 软件开发是一门手艺活
- C#统计子字符串出现次数(转帖,http://www.it130.cn/)
- 黑客道诠释完整版1-7
- hiberante 二级缓存设置
- 图标出问题_同是Office365,为什么你的软件图标还是旧版的?
- BugkuCTF-Reverse题Easy_vb多方法解决
- linux监听端口无响应,linux – tomcat运行,但是8080端口没有响应
- 对WinForm的App.config文件进行加密
- 拓端tecdat|数据度量消费贷款—消费者的考虑因素数据分析
- html炫酷动态时钟代码,HTML5动态时钟代码
- [论文总结] 深度学习在农业领域应用论文笔记8
- Pycharm修改镜像源并添加信任
- 苹果小企业项目申请App Store Small Business Program
- 去掉UISearchBar自带的的边框背景
- 计算机高特效吃鸡游戏主机配置单,吃鸡最高特效配置 万元i7-8700K/GTX1080Ti吃鸡特效全开配置 (全文)...
- SEM和SD的区别和联系,以及其计算方法
- 微信小程序分析送积分功能如何实现_微信积分小程序特色功能——积分营销
- 教你如何做好微信客户管理?做到这3点,效率翻5倍
- 第一篇:爬虫基本原理