一:输入空间/特征空间/属性空间

  • 这三个概念都是指的X,都是指的输入量

二:标记空间/输出空间

  • 指的是Y,指的是输出量。(有时候,X-Y的所有映射也被当作Y,概念上有点混乱)

一:样本空间
样本空间的标准定义是:所有可能存在的、合理的、情况的集合。机器学习的主要工作就是寻找从属性空间(X)到标记空间(Y)的一个映射关系。说法很多,但可以认为Xi-Yi实际存在的一个组合就是一个样本,而所有样本的集合,就是样本空间。
上表中给出了四种实际存在的情况,也即是我们目前所能获得的训练集。而上述的的训练集只是样本空间一个很小的采样。
说法很多:
1、Xi-Yi实际存在的一个组合就是一个样本,而所有样本的集合,就是样本空间
2、X就是样本空间。

二:假设空间

起初,我们并不能得到样本空间。只有样本空间的一个很小的子集,也就是上面的四条样本。但可以确定的是(目前姑且这样认为)每一条示例有三条属性,即一个瓜的好或不好,由三个属性确定,而每个属性有三个值。就拿西瓜的颜色来说,表中有青绿、乌黑,姑且加一种浅白(仅为演示何为假设空间),可以确定的是一个好瓜应该是青绿或乌黑色;但也可能,西瓜的好或不好与颜色无关,即在好瓜的情况下西瓜的颜色可能是*(*代表任意颜色),那么西瓜的颜色这一属性就有四个可能的取值。

即假设空间可以这样定义:色泽:、根蒂:、敲声:是好瓜。色泽:、根蒂:、敲声:浊响是好瓜。色泽:、根蒂:、敲声:清脆是好瓜。色泽:、根蒂:、敲声:沉闷是好瓜。这是一个简单的排列组合问题。一共有44*4+1=65种情况。最后的1表示任何情况都不是好瓜,即没有好瓜的情况。

可以看出来,假设空间是在已知属性和属性可能取值的情况下,对所有可能满足目标(好瓜)的情况的一种毫无遗漏的假设集合。

三:版本空间

   从上面可以看到,假设空间,单纯的罗列的所有可能的情况,这更多的是一种数学上的罗列。显然假设空间中肯定有很多是不满足情况的,或是不合理的。…………比如根据上述表格中的训练数据(样本空间的子集)可以看出,“色泽:青绿、根蒂:硬挺、敲声:清脆不是好瓜“,所以假设空间中的“色泽:青绿、根蒂:硬挺、敲声:清脆是好瓜”显然是错误的假设,应当舍去。…………上面是删除假设空间明显错的假设。但还有那种不错误,但会有严重误导倾向的假设也需要删除。比如假设空间中有“色泽:青绿、根蒂:蜷缩、敲声:浊响是好瓜”,这和训练数据集正好吻合,显然是正确的,但是对于假设空间来说,此条假设也应该被删除。因为如果说“色泽:青绿、根蒂:蜷缩、敲声:浊响是好瓜”那么“色泽:乌黑、根蒂:蜷缩、敲声:浊响就不是好瓜了”这显然有种“过度精确”的错误。仅根据上述训练集中的四条数据来判断,“色泽:*、根蒂:蜷缩、敲声:浊响是好瓜”便比较合适了。这能很好的契合表中的四条数据。…………如果按照上述原则“色泽:浅白、根蒂:蜷缩、敲声:浊响”会被判断为好瓜,这正确与否显然是不知道的。所以,如果想做出正确的判断,就需要全面大量的训练,目的就是尽量的排出假设空间中不合理的假设。而剩下的假设就是在满足已有训练数据集的情况下,做出的最优选择了。…………现实问题中,我们常面临很大的假设空间,但学习过程是根据有限的样本训练集进行的,那么对于不同版本的训练集,应该会有不同版本的“删除后”的假设空间与之对应。便称之为版本空间。

参考文献:https://blog.csdn.net/csucsgoat/article/details/79598803

机器学习中的概念---输入空间、标记空间、样本空间、假设空间、版本空间相关推荐

  1. 机器学习中的概念区分:模型 vs 算法

    文章目录 1. 刷题里的算法 2. 机器学习里的算法 2.1 理解1:比较浅显,靠近常规认知 2.2 理解2:比较复杂,有点矛盾 2.3 我的理解 2.3.1 目标函数 vs 损失函数 以前没有注意过 ...

  2. 机器学习中的独立同分布(I.I.D.)假设

    随机过程简介 随机过程的本质有两个要点: 一是随机,随机说明任何时候结果都存在不确定性,即分布函数(或者概率密度函数) 二是过程,过程体现的是时间:在时间t时,随机变量服从某一分布,另一时刻随机变量服 ...

  3. 机器学习中的隐变量/潜变量和隐藏空间/潜在空间

    机器学习中的隐变量/潜变量和隐藏空间/潜在空间 1.什么是隐变量? 1.什么是潜在空间(Latent Space)? 2.机器学习中为什么要压缩数据? 3.潜在空间中的"空间"是什 ...

  4. 机器学习#假设空间与版本空间

    读周志华的机器学习,卡在假设空间和版本空间这一块了,写一下自己的理解: 假设空间:所有属性的可能性(可能取值)组合形成的假设(假设*,*,*为好瓜),组成假设空间,以西瓜问题假设为例.色泽属性可取(青 ...

  5. 机器学习的基本概念和相关术语

    文章目录 一.什么是机器学习 二.机器学习的相关术语 三.机器学习的典型任务 四.假设与假设空间 五.假设的选择原则 六.机器学习的三要素 推荐文章 一.什么是机器学习 人工智能标准化白皮书(2018 ...

  6. 西瓜书(周志华):什么是版本空间以及如何求取版本空间

    下面是自己结合百度的资料来理解的一些比较通俗的说法: 假设空间:属性所有可能取值组成的可能的样本 版本空间:与已知数据集一致的所有假设的子集集合. (绿色加号代表正类样本,红色小圈代表负类样本) GB ...

  7. ArcSDE for Oracle表空间管理——暂时(TEMP)表空间

    Oracle暂时表空间主要用来做查询和存放一些缓冲区数据.暂时表空间消耗的主要原因是须要对查询的中间结果进行排序. 重新启动数据库能够释放暂时表空间,假设不能重新启动实例,而一直保持问题sql语句的运 ...

  8. 机器学习中的数学基础怎么学?

    又到了周末了,但小编的周六并不算周末.回到本次的话题上,这次小编给大家分享机器学习中的数学基础该怎么学. 首先给出小编的态度:机器学习中涉及的数学课程比较多,要想一下子去穷尽所有课程显然也不现实,大可 ...

  9. (Latent Space)理解机器学习中的潜在空间

    原文链接:https://zhuanlan.zhihu.com/p/369946876 搬运自 https://towardsdatascience.com/understanding-latent- ...

最新文章

  1. 单片机温度控制系统DS18B20
  2. 初识图机器学习(part2)--图数据
  3. 计算机组成原理简单计算机设计,计算机组成原理课设.doc
  4. Flash竖向大焦点图代码_网页代码站(www.webdm.cn)
  5. CNDS-Markdown之公式编辑(二)
  6. 尚学堂python培训靠谱吗_尚学堂百战程序员:Python的字符串
  7. 英特尔处理器全部系列
  8. 神经网络训练集和测试集,神经网络验证集作用
  9. 关于Unable to read additional data from server sessionid 0x0问题的解决
  10. Pocket PC访问PC上的Webservice
  11. 如何防御ddos攻击?
  12. 计算机使用痕迹,彻底清除电脑使用痕迹的方法
  13. 熵为什么使用log?
  14. Web网页尺寸(1)
  15. mac使用u盘安装系统
  16. 最简单的Jenkins+Tomcat+Gog(Git)解决Java项目自动化部署
  17. 云客Drupal源码分析之Session进阶
  18. MySQL安装教程(详细)
  19. 网众无盘服务器 快车挂盘失败 显示 当前磁盘已经为超级工作站模式,快吧无盘精简版结合网众...
  20. HTML5使用Audio标签实现歌词同步的效果

热门文章

  1. js 或者vue中for循环去掉最后一个逗号
  2. python画图颜色代码rgb_如何获取matplotlib颜色方案的RGB值?
  3. 【自然语言处理】-jieba库学习笔记(一)
  4. 消息队列常见的几种使用场景介绍!
  5. 小尺寸android 手机推荐,喜欢小屏安卓手机的来看看,这三款便宜又好用
  6. MySQL开启ssl证书
  7. Java for循环-水仙花数
  8. node和npm如何升级版本
  9. 欧拉回路(欧拉路径)
  10. 【图解HTTP】——返回结果的HTTP状态码