@Lecture 6: Theory of Generalization

Restriction of Break Point

确定假设H的成长函数是限定的,也就是H关于样本个数N的成长函数,如果mH(N)<2N,则存在break point

H的个数要满足任意k个point不能完全shatter的条件

Bounding Function: Basic Cases

扩展到无论分类规则是什么,证明B(N,K)都远小于N的多项式
B(N,K)满足:B(N,1)=1, 当N<K时,B(N,K)=2的N次方,当N=K时,B(N,K)=2的N次方-1
注意,B是mH的上限,不一定相等

Bounding Function: Inductive Cases

继续填表,求B(4,3),看B(4,3)和B(3,?)的关系

分开看a+beta 和a的限制
因此,放缩后就可以得到B(N,K)的上界

相当于经过上述证明,我们找到了H的成长函数mH的上限函数的上限,由此证明出来mH是远小于2的N次方的,会被N的多次项函数bound住

A Pictorial Proof

把mH会被N的多项式bound住代到坏事情发生的公式里面

第一步,因为上图公式里面的Eout(h)是一个未知的,需要替换掉,思路,拿在in的数据里面的再次取样得到的E’in代换Eout,因为Ein的概率期望为Eout

第二步,使用mH来衡量坏事发生概率的重叠度

第三步通过抽样还替换

到这里就证明了随着在2维空间的判别问题上,只要存在break point,H的个数会被bound住,Ein和Eout的差距也会被bound住,也就是说N的个数足够大时,Ein和Eout的值相差不会太大,选看到的样本上的Ein最小的h,在看不到的数据上的表现应该也是比较好的,机器学习算法PLA可行。

林轩田机器学习基石Lecture 6: Theory of Generalization相关推荐

  1. 林轩田机器学习基石笔记6 - Theory of Generalization

    Restriction of Break Point 四个成长函数与break point: 假设一个hypotheses,它的break point是2.那么当N=1的时候可以取到两个dichoto ...

  2. 台大林轩田·机器学习基石记要

    台大林轩田·机器学习基石记要 昨天开始看林轩田的机器学习基石,从今天起开始去粗取精 第一讲比较基础,一些概念自己早已经理解了,所以不再做笔记,有点印象的是讲到了ML.DL.AI的一些联系与区别,ML主 ...

  3. 台湾大学林轩田机器学习基石课程学习笔记13 -- Hazard of Overfitting

    红色石头的个人网站:redstonewill.com 上节课我们主要介绍了非线性分类模型,通过非线性变换,将非线性模型映射到另一个空间,转换为线性模型,再来进行分类,分析了非线性变换可能会使计算复杂度 ...

  4. 林轩田机器学习基石(Machine Learning Foundations)笔记(一)

    要求两周之内看完林轩田机器学习基石和技法,速度是要的,但是感觉看得太快我会不久就会忘记.因此记录一下梗概,顺便写写看视频时解决的不懂的地方(有种思想就是把知识传播给更多人,有时候就是靠大佬们善意的一句 ...

  5. 台湾大学林轩田机器学习基石课程学习 笔记资料汇总

    笔记: 红色石头的专栏(写得非常好) 课后练习: 機器學習基石(Machine Learning Foundations) 机器学习基石 课后习题链接汇总 https://download.csdn. ...

  6. 机器学习系列笔记:林轩田机器学习基石——机器学习的可行性

    机器学习系列笔记:林轩田机器学习基石--机器学习的可行性

  7. 台湾大学林轩田机器学习基石课程学习笔记6 -- Theory of Generalization

    红色石头的个人网站:redstonewill.com 上一节课,我们主要探讨了当M的数值大小对机器学习的影响.如果M很大,那么就不能保证机器学习有很好的泛化能力,所以问题转换为验证M有限,即最好是按照 ...

  8. 台湾大学林轩田机器学习基石课程学习笔记14 -- Regularization

    红色石头的个人网站:redstonewill.com 上节课我们介绍了过拟合发生的原因:excessive power, stochastic/deterministic noise 和limited ...

  9. 台湾大学林轩田机器学习基石课程学习笔记1 -- The Learning Problem

    红色石头的个人网站:redstonewill.com 最近在看NTU林轩田的<机器学习基石>课程,个人感觉讲的非常好.整个基石课程分成四个部分: When Can Machine Lear ...

最新文章

  1. Blender三维建筑场景动画制作学习教程
  2. Winform开发的界面处理优化
  3. 简单读懂微生物基因组的泛基因组学
  4. 【Linux入门连载二】Linux系统有哪些基本目录?
  5. 1.封装WinMain至动态链接库
  6. smem – Linux 内存监视软件
  7. Segment-based Disparity Refinement with Occlusion Handling for Stereo Matching翻译和理解
  8. Cookie、Session、Token、JWT区别与联系
  9. java简单数据类型的知识点
  10. OA系统中的HRM的发展和存在的误区,值得每一个HR学习
  11. 计算机cpu操作ppt,CPU基础知识PPT课件
  12. oracle导出dmp文件报错904,EXP-00008: 遇到 ORACLE 错误 904 ORA-01003
  13. 特定场景下的网络质量评估与预警方法介绍
  14. 使用fastlane match自动化管理证书和描述文件
  15. 在QCreator IDE中 使用 Orge3D
  16. 当老板让程序员换灯泡…… | 每日趣闻
  17. AD软件中的pcbdoc、schdoc等类似一些文件的图标变成了白板解决办法
  18. Sublime text 3 注册码(转自晚晴幽草(简书作者))
  19. IDEA中如何设置键盘快捷键可用
  20. 非常全面的NFS文档(FOR LINUX)

热门文章

  1. 联想扬天 V14 、V15 锐龙版 2023款 评测
  2. CCleaner如何列出已安装的程序
  3. linux如何输入命令,linux中的命令如何输入
  4. word表格复制到excel回车换行问题 2
  5. 关于碰到优盘插入电脑检测到病毒并且优盘里文件只显示System Volume Information文件夹的问题解决。
  6. python读取 xls,xlsx,csv,doc,docx,pdf 格式的文件
  7. Ubuntu布置Django项目
  8. 抖音表白程序Python版,明人不说暗话,我喜欢你
  9. 数据挖掘 NO.2 模型效果评估
  10. 华为交换机升级包及补丁验证完整性