《机器学习》周志华第一章课后习题
机器学习第一章课后习题答案
1.1
先区分两个概念,假设空间和版本空间。假设空间是指所有的可能的情况所形成的假设组成的集合,而版本空间则是对假设空间进行搜索,删除与正例不一致的假设和与反例一致的假设,所得到的与训练集一致的假设 组成的集合。
对于表 1.1,若色泽、根蒂、敲声分别有3种取值,假设空间大小是 (3 + 1)^ 3 + 1 = 65,第一个 1 代表任意,即该特征对是否是好瓜无影响,第二个 1 代表空集,即没有“好瓜”这种概念(如果仅考虑表中的特征,那应该是344+1 = 49)。版本空间大小是3,包括{(色泽 = ,根蒂 = 蜷缩, 敲声 = 浊响),(色泽=,根蒂=,敲声=浊响),(色泽=,根蒂=蜷缩,敲声=*)}。
现在只考虑编号为1、4的两行,以 AAAT 表示第一行,BBBF表示第二行。假设空间的大小(只考虑1、4行出现的特征)是3^3 + 1 = 28。删除假设空间中与第1行不一致的假设和与第4行一致的情况,剩下的应该是这7种情况,##A,#A#,A##,AA#,A#A,#AA,AAA,其中#表示任意。
1.2
基本概念:
析取:∨
合取:∧
析取式:用析取真值连接词“∨”将两个或两个以上的命题联结而成的一种命题形式
合取式:用合取真值连接词“∧”将两个或两个以上的命题联结而成的一种命题形式
析合范式:多个合取式的析取
这题不会做,看了几个大佬的答案大体上明白思路了。
首先,排除空集,一共有344=48种合取式(18种0泛化,21种1泛化,8种2泛化,1种全泛化,不包括空集)。
然后,在这48种合取式中取k个进行析取,去除冗余情况,即是k个合取式对应的所有假设。比如,k等于1时,共有48种假设。
因为泛化是对若干种假设的包含(包容),它本身不是某种假设。把泛化的 * 展开后,就是若干种具体的假设。如果此题采取48,那么把 * 展开后,假设集合中一定有重复,而且一种具体假设还不止重复一次。此题应该采用18种具体假设来计算, 就是:2^18 - 1
当然,k对应的所有假设并不能覆盖所有的假设。下面是几种参考代码,每个博主的代码运行结果都不一样哈哈哈哈,python跑得巨慢。
python版:
参考1
参考2
C版:
参考3
纯理论版:
参考4
1.3
参考其他博主文章链接
方法一:去噪:若两个样例所有属性相同,但是取值不同,只保留正例(或反例),在此基础上再求版本空间。
书上P5有一句话“搜索过程中可以不断删除与正例不一致的假设、和(或)与反例一致的假设”,由此得到启发:
方法二:只删除与正例不一致的假设;
方法三:只删除与反例一致的假设;
比如对于“A B T”和“A B F”两个假设,如果按照方法二,偏好是保留“A B”,按照方法三,偏好是删除“A B”。
关于版本空间的一个很好的解释链接
1.4
模仿书上式1-2即可。
1.5
- 在向搜索引擎提交信息的阶段,能够从提交文本中进行信息提取,进行语义分析。
- 在搜索引擎进行信息匹配的阶段,能够提高问题与各个信息的匹配程度。
- 在向用户展示搜索结果的阶段,能够根据用户对结果感兴趣的程度进行排序。
《机器学习》周志华第一章课后习题相关推荐
- 机器学习(周志华)西瓜书 课后习题4.3 信息熵决策树算法——python实现(包括树的可视化)
机器学习(周志华)西瓜书 课后习题4.3 信息熵决策树算法--python实现(包括树的可视化) 算法原理 1.信息熵 2.信息增益 我们所以要做的就是不断地从当前剩余的属性当中选取最佳属性对样本集进 ...
- 【读书笔记】周志华 机器学习 第二章 模型评估和选择
第二章 模型评估和选择 1 欠拟合和过拟合 偏差和方差 1.1 欠拟合和过拟合 1.2 偏差和方差 2 评估方法 性能度量 2.1 评估方法 2.1.1 留出法 2.2.2 交叉验证法 2.2.3 自 ...
- 机器学习(周志华)第一章至第三章笔记
关于周志华老师的<机器学习>这本书的学习笔记 记录学习过程 本博客记录Chapter1 to Chapter3 文章目录 1 绪论 1.1 引言 1.2 基本术语 1.3 假设空间 1.4 ...
- 机器学习(周志华) 第一章 引言
第一章 引言 1.1引言 机器学习的定义: Machine Learning is Fields of study that gives computers the ability to learn ...
- 机器学习 周志华 第一章课后习题
机器学习 周志华 第一章课后习题 1.1 1.2 1.3 1.4 1.5 1.1 在下面这张图片中若只包含编号为1和4的两个样例,试给出相应的版本空间. 书上实例: 1.表 1.1 对应的假设空间如下 ...
- 周志华-机器学习西瓜书-第三章习题3.3 编程实现对率回归
本文为周志华机器学习西瓜书第三章课后习题3.3答案,编程实现对率回归,数据集为书本第89页的数据 使用tensorflow实现过程 # coding=utf-8 import tensorflow a ...
- 机器学习 -- 《机器学习》(周志华) 第三章
机器学习 – <机器学习>(周志华) 第三章 笔记 文章目录 机器学习 -- <机器学习>(周志华) 第三章 笔记 注 常用数学符号 正交回归 点距离线的距离是正交回归 线性回 ...
- 周志华机器学习--绪论
周志华机器学习–绪论 第一章 绪论 第二章 模型评估与选择 第三章 线性模型 第四章 决策树 第五章 支持向量机 第六章 神经网络 第七章 贝叶斯分类器 第八章 集成学习和聚类 文章目录 周志华机器学 ...
- 周志华机器学习(西瓜书)学习笔记(持续更新)
<周志华机器学习>笔记 第1章 绪论 1.1 引言 1.2 基本术语 1.3 假设空间 1.4 归纳偏好 1.5 发展历程 1.6 应用现状 第2章 模型评估与选择 2.1 经验误差与过拟 ...
- 周志华机器学习--模型评估与选择
周志华机器学习–模型评估与选择 第一章 绪论 第二章 模型评估与选择 第三章 线性模型 第四章 决策树 第五章 支持向量机 第六章 神经网络 第七章 贝叶斯分类器 第八章 集成学习和聚类 文章目录 周 ...
最新文章
- 自动驾驶新突破,国内有了第一款AI标注软件
- 数据结构C#版笔记--堆栈(Stack)
- 数据 3 分钟 | 《数据安全法》即将施行;ACM SIGMOD在西安举办;艾瑞咨询发布数据库行业报告...
- Java三层结构的概念_Java中的mvc和三层结构究竟是什么关系
- 六款值得推荐的android(安卓)开源框架简介
- php开发_图片验证码
- js 不相等 多次随机数_node.js静态\动态服务器
- Maya vray XYZ皮肤贴图材质节点连接
- QT绘图实现橡皮擦效果
- 50内的勾股数java_学习知识:50以内勾股数有哪些
- python分割图片、合并图片
- 巨杉数据库兼容mysql_SequoiaDB 巨杉数据库
- 揭秘!用标准Go语言能写脚本吗?
- gradle-5.4.1-all.zip下载与替换
- linux以root账号登陆gnome,CentOS 7 - 以root身份登入Gnome
- c语言编程酱油和醋互换,c语言 有两个瓶子A和B,分别盛放醋喝酱油,要求将他们互换...
- 缺少dll文件怎么办?修复dll文件的多种方法
- 吐血整理 这200道阿里P6必备Java面试题,我简直太爱了
- SaaS鉴证实录:网络营销企业的自我营销之道
- mysql导入数据命令Load data详解及示例