3.1 试析在什么情形下式(3.2) 中不必考虑偏置项 b.


参考网上的各种版本:不考虑偏置项b,那么函数过原点,只需要将训练集的每个样本减去第一个样本,就可以消去b,不必考虑b。

3.2 试证明,对于参数 ,对率团归的目标函数(3.18) 是非凸的,但其对数似然函数(3.27) 是凸的.



凸函数的定义不是很统一,这里给出西瓜书上使用的定义,P54左下角小字:

不考虑多元函数时:
对于3.18,用公式推导,证明其非凸,最后会等价为证明 e^(-z)为凸函数;
对于3.27,我的想法是分成两部分来证,第一部分直线,是凸函数;第二部分根据二阶导非负容易证明。两个凸函数相加仍然是凸函数。
考虑多元函数时:如果它是凸函数,则其Hessian矩阵为半正定矩阵。如果Hessian矩阵是正定的,则函数是严格凸函数。只需要证明3.18的Hessian矩阵不定,即存在负的特征值;证明3.27的Hessian矩阵半正定或者正定即可。

3.3 编程实现对率回归,并给出西瓜数据集 3.0α 上的结果.

参考代码

3.4 选择两个 UCI 数据集,比较 10 折交叉验证法和留 法所估计出的对率回归的错误率.

参考代码

3.5 编辑实现线性判别分析,并给出西瓜数据集 3.0α 上的结果.

参考代码

3.6 线性判别分析仅在线性可分数据上能获得理想结果?试设计一个改进方法,使其能较好地用于于非线性可分数据

根据课本6.3,可以将非线性可分数据映射到更高维空间,比如,二维映射到三维空间后,可以用平面进行划分。同时引入核函数来简化计算。

3.7 令码长为 9,类别数为 4,试给出海明距离意义下理论最优的 ECOC二元码并证明之.

可以参考论文Solving Multiclass Learning Problems via Error-Correcting Output Codes
根据论文 2.3 Error-Correcting Code Design部分,一个好的ECOC二元码应该满足不同行和不同列之间独立,可以通过增加海明距离来实现,同时不同列之间不互为反码。
论文中给出了四种方法来构造一个好的ECOC编码,3 <= k <= 7时,采用穷举法,参考论文中构造k=5时的做法,构造k=4时的ECOC码如下:

COL
ROL 1 2 3 4 5 6 7 8 9
1 1 1 1 1 1 1 1 0 0
2 0 0 0 0 1 1 1 1 0
3 0 0 1 1 0 0 1 1 1
4 0 1 0 1 0 1 0 0 1

此时的最小海明距离是4,能够纠正1位。可是,题目中说的是9位,从增加行之间的最小海明距离来考虑,我选择了0110和0011,这样行间最小海明距离就是5。不过,新加的两列是前7列中列的反码,加了反而没好处。

3.8* ECOC 编码能起到理想纠错作用的重要条件是:在每一位编码上出错的概率相当且独立.试析多分类任务经 ECOC 编码后产生的二类分类器满足该条件的可能性及由此产生的影响.

根据书上P65页最后一段文字描述,拆分后产生的二分类任务难度相当,训练生成的二分类器出错概率才会相当;
类别越多,可以产生的编码(组合)也越多,不同二分类器产生编码的海明距离只要足够大,就可以实现,类别越多越可能实现。
影响:一个理论纠错性质很好,但是导致的二分类问题很难的编码,与另一个理论纠错性质差一些,但产生的二分类问题很简单的编码,最终产生的模型性能好坏孰优孰劣很难说。

3.9 使用 OvR MvM 将多分类任务分解为二分类任务求解时,试述为何无需专门针对类别不平衡性进行处理.

根据P66页左侧小字,对于·OVR、MVM来说,由于对每个类进行了相同的处理,类别不平衡问题的影响相互抵消了。

3.10 试推导出多分类代价敏感学习(仅考虑基于类别的误分类代价)使用"再缩放"能获得理论最优解的条件.

太菜了,不会推。。。
答案在周志华老师的论文《On Multi-Class Cost-Sensitive Learning》里,在Analysis 和 The RESCALEnew Approach分别对二分类和多分类的代价敏感问题进行了分析。
在Analysis部分推导出了放缩比公式:

公式的含义:
Generally speaking, the optimal rescaling ratio of the i-th class against the j-th class can be defined as Eq. 3, which indicates that the classes should be rescaled in the way that the influence of the i-th class is τopt(i, j) times of that of the j-th class.
二分类时,传统方法等价与上述方法,多分类时而这并不等价,这解释了为什么传统的放缩方法效果不好。
考虑多分类时的放缩比可以得到下面的式子:

将其转化为线性方程组:

将其写成矩阵形式:

基于上面的矩阵,得到最优解的条件:当矩阵的秩小于类别数c 时,可以根据方程组求出权重向量w,放缩后的数据可以由非代价敏感分类器处理;否则,将这个多类别问题划分为满足条件的子问题 。

参考两篇论文:
On Multi-Class Cost-Sensitive Learning
The Foundations of Cost-Sensitive Learning

《机器学习》周志华第三章课后习题相关推荐

  1. 机器学习 -- 《机器学习》(周志华) 第三章

    机器学习 – <机器学习>(周志华) 第三章 笔记 文章目录 机器学习 -- <机器学习>(周志华) 第三章 笔记 注 常用数学符号 正交回归 点距离线的距离是正交回归 线性回 ...

  2. 机器学习(周志华)西瓜书 课后习题4.3 信息熵决策树算法——python实现(包括树的可视化)

    机器学习(周志华)西瓜书 课后习题4.3 信息熵决策树算法--python实现(包括树的可视化) 算法原理 1.信息熵 2.信息增益 我们所以要做的就是不断地从当前剩余的属性当中选取最佳属性对样本集进 ...

  3. 机器学习 周志华 第一章课后习题

    机器学习 周志华 第一章课后习题 1.1 1.2 1.3 1.4 1.5 1.1 在下面这张图片中若只包含编号为1和4的两个样例,试给出相应的版本空间. 书上实例: 1.表 1.1 对应的假设空间如下 ...

  4. 机器学习(周志华) 参考答案 第十四章 概率图模型 14.9

    机器学习(周志华西瓜书) 参考答案 总目录 http://blog.csdn.net/icefire_tyh/article/details/52064910 机器学习(周志华) 参考答案 第十四章 ...

  5. 小吴的《机器学习 周志华》学习笔记 第二章 模型评估与选择

    小吴的<机器学习 周志华>学习笔记 第二章 模型评估与选择 上一周我们介绍了第一章的基础概念,这一次将带来第二章的前三节.后面的2.4 比较检验与2.5 偏差与方差,涉及概率论与数理统计概 ...

  6. 小吴的《机器学习 周志华》学习笔记 第一章 绪论

    小吴的<机器学习 周志华>学习笔记 第一章 绪论 近一年时间接触到不少机器学习的知识,虽然断断续续学了一些,总感觉还没有入门(只学会了疯狂调包).因此,最近开始系统学习Machine Le ...

  7. 小吴的《机器学习 周志华》学习笔记 第二章 2.4 比较检验、2.5 偏差与方差

    小吴的<机器学习 周志华>学习笔记 第二章 2.4 比较检验. 2.5 偏差与方差 2.4 比较检验 上一周提到了实验的评价方法和性能量度,步骤简单可以看成:先使用某种实验评估方法测得学习 ...

  8. 机器学习 周志华 课后习题3.5 线性判别分析LDA

    机器学习 周志华 课后习题3.5 线性判别分析LDA 照着书上敲了敲啥都不会,雀食折磨 python代码 # coding=UTF-8 from numpy import * # 我安装numpy的时 ...

  9. 《计算机网络技术》第三章课后习题答案(全)

    <计算机网络技术>第三章课后习题答案(全) 1.网络协议包括的三要素是什么? 答: 语法.语义和时序关系. 2.在计算机网络中使用分层的思想有哪些好处? 答: (1)各层次之间可相互独立: ...

  10. 郑莉java课后答案,Java语言程序设计(郑莉)第三章课后习题答案

    <Java语言程序设计(郑莉)第三章课后习题答案>由会员分享,可在线阅读,更多相关<Java语言程序设计(郑莉)第三章课后习题答案(10页珍藏版)>请在人人文库网上搜索. 1. ...

最新文章

  1. oracle 查看统计情报,Oracle 查看收集统计信息
  2. linux 修改 ko文件内核版本号
  3. java个人学习笔记:javaBean
  4. python 如何将虚拟环境的项目的所有.py文件的import导包汇总到requirements.txt文件 (pipreqs)
  5. 二维数组求子数组中最大的和
  6. 21行代码AC——习题3-7 DNA序列(UVa-1368)_解题报告
  7. 了解ADF生命周期中的ADF绑定
  8. C++回调函数(callback)的使用
  9. freemarker ftl模板_效率提升百分之四十,AS模板也太好用了吧
  10. 计算字符在字符串中出现的次数
  11. 有一门课不及格的学生(信息学奥赛一本通-T1048)
  12. 项目收获与体会_格创丨项目开发部、ACM训练队、信息运营部
  13. 程序员口头禅_今年系统管理员的口头禅:更聪明地工作,而不是更努力
  14. C++14实现一个线程池
  15. .NET图像处理包 DotImage
  16. Adams入门详解与实例(第2版)pdf电子书
  17. IIS配置MIME类型
  18. python 生成式 生成器
  19. python爬大学生就业数据分析_Python 网络爬虫数据分析实战
  20. python暂停命令_命令行-Python中的暂停

热门文章

  1. 悬置线高通滤波器设计
  2. Java实现12306登录和查票
  3. 唯一标识 微信小程序_微信小程序中用户唯一ID的获取
  4. iphone 4 到iphone 6s plus的屏幕尺寸
  5. HttpClientUtil 工具类
  6. 水果忍者 java_水果忍者v1.7.2
  7. 电脑版微信打开内置浏览器
  8. c语言 opengl函数魔方,基于OpenGL的3D旋转魔方实现汇总.docx
  9. 如何免费将网页内容转成Word文档
  10. xpose使用教程 hook java层的代码 (一 公司取名.apk)