上次写完决策树发现好多名词要写解释,就太多了,那么补上概念学习这部分。

简介

机器学习问题,一般都涉及从特殊训练样例中得到一般的概念。比如人们不断学习的一些一般概念:鸟类、车子、富有等等。这些都是一个集合,不是最大的集合,也不是最小的。所以给一个样例集合以及每个样例是否属于某一概念的标注,如何自动推断这个概念的一般定义,就是属于概念学习( concept learning )。

术语

概念定义在一个实例集合上,待学习的概念或函数称为目标概念。在学习概念的时候,要提供一套训练样例(training examples),每个样例为集合中的一个实例。对于所有目标概念值为1的实例称之为正例,对于为0的称之为反例

搜索的概念学习

概念学习过程也可以看做为一个搜索过程,范围就是假设的表示所隐含的定义的整个空间。搜索的目标是为了寻找能最好的拟合训练样例的假设。当假设的表示形式选定后,那么也就隐含的为学习算法确定了所有假设的空间。

假设更一般

在许多概念学习算法中,假设的一般到特殊序的关系是一种很有效的结构。

利用假设空间的这种自然结构,我们可以在无线的假设空间中进行彻底的搜索。

FIND-S:寻找极大特殊假设

首先定义一个: more_general_than是代表『比….更一般』。

算法流程为:

  1. 将h初始化为H中最特殊假设。
  2. 对每个正例x
    2.1 对h的每个属性约束a_i
    2.2 如果x满足a_i
    2.3 那么不做任何处理
    2.4 否则讲h中a_i替换为x满足的下一个更一般的约束
  3. 输出假设h

其实整个算法比较简单:

先定义一个假设:

h <- { *, *, *, * } //这里*代表空

首先第一个满足的假如是:

h <- { S, W, N, M } //每个字母代表一个属性

假设:对于 {s, Y, N, M}也是满足的约束。
那么遍历到这个约束的时候就要替换:

h <- { S, ?, N, M } //?代表更一般约束,表示W, Y都可以

这就是FIND-S的算法。

  • Finds的特点:对以属性约束的合取式描述的假设空间。

  • 问题:

    1. 学习过程是否收敛到正确的目标概念?
    2. 为什么要用最特殊假设
    3. 训练样例是否互一致?
    4. 如果有多个极大特殊假设怎么办?

变型空间和候选消除算法

候选消除算法(Candidate elimination)能解决Find-s的一些问题。
其中包括候选消除算法输出的是与训练样例一致的所有假设的集合。并且在描述这一集合的时候不需要明确列举其所有成员

消除候选算法的 应用:从化学质谱分析中学习规则行和学习启发式搜索的控制规则。

但是这两个算法都是有限制的:他们在训练数据含有噪声时候的性能比较差。

表示

定义: 一个假设h与训练阳历集合D一致,当且仅当对D中每一个样例{ x, c(x) } 都有 h(x) = c(x)。

列表后消除算法

算法实现流程如下:

列表后消除算法
1. 变型空间 VersionSpace <- 包含H中所有假设的列表
2. 对每个训练阳历{ x , c(x) }
2.1 从变型空间中移除所有 h(x) 不等于 c(x) 的假设h
3. 输出VersionSpace中的假设列表

原则上,只要假设空间是有限的,就可以使用列表后消除算法。

暂时先写这么多。

机器学习 - 概念学习相关推荐

  1. 《机器学习》读书笔记,第二章概念学习和一般到特殊序

    本章展示了几种概念学习算法,并讨论了这些算法能收敛到正确假设的条件.这里还分析了归纳学习的本质以及任意程序能从训练数据中泛华的理由. 2.1概念学习: 从有关某个布尔函数的输入输出训练样例中推断出该布 ...

  2. 离线轻量级大数据平台Spark之MLib机器学习库概念学习

    Mlib机器学习库 1.1机器学习概念 机器学习有很多定义,倾向于下面这个定义.机器学习是对能通过经验自动改进的计算机算法的研究.机器学习依赖数据经验并评估和优化算法所运行出的模型.机器学习算法尝试根 ...

  3. 机器学习算法基础概念学习总结

    转自:http://blog.csdn.net/lantian0802/article/details/38333479 1.基础概念: (1) 10折交叉验证:英文名是10-fold cross-v ...

  4. 机器学习(一) 贝叶斯法则与概念学习

    贝叶斯学习算法应用于机器学习的有两个原因,第一:贝叶斯学习能够计算显式的假设概率,如 朴素贝叶斯分类器.第二:贝叶斯方法为理解机器学习的其他方法提供了手段,如分析FIND-S算法. 贝叶斯法则对与贝叶 ...

  5. 机器学习与神经网络概念学习

    神经网络是进行机器学习的方式之一,也是目前使用最广泛的方式. 机器学习的目的是根据已有的数据来预测未知的结果. 通过已有的数据建立模型,在模型下进行预测,模型的可靠性决定预测结果的准确率. 如何建立更 ...

  6. 【机器学习】——逻辑模型:概念学习

    一.前言 逻辑模型包括:概念学习.树模型.规则模型.这类模型的共同特点是,它们均是通过逻辑表达式将实例空间划分为一组间隔,因此所构建的都是分组模型. 这类模型的目标如下:针对要解决的任务,找到可以使每 ...

  7. 机器学习算法基础概念学习总结(转载)

    来源:lantian0802的专栏 blog.csdn.net/lantian0802/article/details/38333479 一.基础概念 1.10折交叉验证,英文名是10-fold cr ...

  8. 【转载】机器学习算法基础概念学习总结

    1.基础概念: (1) 10折交叉验证:英文名是10-fold cross-validation,用来测试算法的准确性.是常用的测试方法.将数据集分成10份.轮流将其中的9份作为训练数据,1分作为测试 ...

  9. 机器学习中的数学:一份新鲜出炉的热门草稿

    来源:机器之心 本文约1500字,建议阅读5分钟. 本文为你分享近日<Mathematics for Machine Learning>的全部草稿已放出,我们整理了这本书的简要概述. 近日 ...

  10. 机器学习(MACHINE LEARNING) 【周志华版-”西瓜书“-笔记】 DAY1-绪论

    我太喜欢这本书了 ,因为封面很好看 .PS:划重点是教科书!需要一定基础,京东正版有售~ 1.1 引言 机器学习:例如我们人吃过,看过很多西瓜, 所以基于色泽.根蒂,敲声这几个特征我们就可以做出相当好 ...

最新文章

  1. springboot-数据访问
  2. POI学习笔记 自定义颜色
  3. POS开发问题 - 多个弹出框的实现
  4. mysql against包含英文_在MySQL中使用MATCH和AGAINST选择特定列中包含字符串的行
  5. nagios监控mysql主机,nginx,cpu,网卡流量
  6. java基础知识——面向对象基本概念
  7. C语言讲义——C语言的布尔类型
  8. chkconfig命令及的使用 与linux的七个运行级别
  9. 最新最全git使用大全
  10. 标准正态分布表(scipy.stats)
  11. FPGA工程师面试试题集锦11~20
  12. 中国开源走向第二梯队!
  13. 开源文档协作套件CryptPad
  14. VT虚拟化驱动入门教程
  15. python发送邮件 SMTP socks代理
  16. UVA 1471 Defense Lines 单调队列优化
  17. 16.控制转移指令(条件跳转指令、比较条件跳转指令、多条件分支跳转指令、无条件跳转指令)
  18. 风景类Midjouney prompt提示词
  19. 普通用户加入wheel,有sudo权限
  20. 安川840_深圳松岗安川伺服驱动器840中心

热门文章

  1. 计算机管理恢复分区,如何在Windows10中删除磁盘管理器中的恢复分区
  2. fprom预测结果内容_启动子分析预测数据库
  3. 公共DNS递归服务器(转发)
  4. 趣开门APP、微信开门小程序,让开门更简单,更有趣!
  5. vue手机号校验,邮箱校验
  6. 股票术语之期货、期权
  7. 网络打印机怎么扫描到计算机,怎么用打印机扫描文件-富士施乐SC2020复印机设置网络扫描到计算机(SMB)...
  8. 企业微信接入第三方应用(以服务商身份)
  9. 网易邮箱大师添加附件显示服务器连接失败,网易邮箱大师如何添加Word附件 添加附件方法步骤详细介绍...
  10. python 正则表达式 匹配任意长度英文字母