ML之VC维:VC维(Vapnik-Chervonenkis Dimension)理论的概述(衡量模型复杂度和预测能力的指标)的简介、案例理解之详细攻略

目录

VC维(Vapnik-Chervonenkis Dimension)理论的简介

VC维(Vapnik-Chervonenkis Dimension)理论的概述(衡量模型复杂度和预测能力的指标,但VC维理论目前已被边缘化)

案例理解如何计算VC维的大小


VC维(Vapnik-Chervonenkis Dimension)理论的简介

VC维(Vapnik-Chervonenkis Dimension)理论的概述(衡量模型复杂度预测能力的指标,但VC维理论目前已被边缘化)

VC维理论的边缘化

VC维理论目前已被边缘化

VC维理论读起来很晦涩,它在解释分类决策面如SVM较成功,但VC维在神经网络中似乎是失效了。然而,对于科学习性、定性必须上升到定量化,VC维不是没用,而是需要进化。

VC维理论是一个目前被边缘化的知识。理由根据VC维理论,神经网络的VC维巨大,学习是不可行的。但是实际情况,神经网络却在一些领域表现良好。这又是什么原因呢?主要的解释有数据量激增、神经网络共享权值导致参数变少使得VC维下降等。

VC维理论由于理论性过强,计算复杂,对小样本不太 sensitive,泛化误差难以度量,过于强调模型复杂度等因素,使其作用相对被边缘化。此外,机器学习算法快速发展和深度学习的出现,无法解释深度学习,也在一定程度上减弱了VC维理论的影响和作用。VC维理论被相对边缘化有其客观原因,但是这并不代表其作用会完全消失。

简介

VC维(Vapnik-Chervonenkis Dimension),它是机器学习理论中的一个重要概念,由Vapnik和Chervonenkis提出,它表示模型的复杂度,衡量模型表示数据的能力。VC维越高,模型的表示能力就越强(模型越复杂),拟合能力越强,但也容易过拟合。

VC维是由Vladimir Vapnik和Alexey Chervonenkis提出的,用于描述一个模型的表示能力或假设空间的大小。它定义了一个模型可以拟合的最大样本集合的大小,使得模型可以在这个样本集合上表现良好,但不能保证在其他样本集合上表现良好。

意义

VC维是一个模型选择和正则化的重要指标。VC维是衡量模型复杂度和预测能力的重要指标。理解VC维有助于选择模型,判断过拟合,选择正则化参数。它为我们提供了模型评估与选择的理论基础,是机器学习理论中一个重要概念。

(1)、可以度量模型复杂度:VC维可以度量模型的参数数量、结构的复杂度,评估模型的预测能力。VC维可以用来衡量一个模型的复杂度和泛化能力。

(2)、可以刻画集合的复杂度:VC维度度量一个集合划分输入空间的能力,反映集合的复杂度。

(3)、可以判断过拟合:VC维可以用于判断模型是否过拟合。VC维过高,容易导致过拟合。VC维与模型表示数据的能力相关,VC维高的模型预测能力强,但过拟合风险大。

(4)、可以帮助选择模型:在机器学习算法的模型选择中,VC维是一个重要标准,选择VC维适中的模型可以避免过拟合。

(5)、可以用于选择正则化的强度:VC维与正则化参数密切相关,可以用于选择正则化强度,防止过拟合。

主要内容

VC维的主要内容是描述一个模型可以拟合的最大样本集合的大小。

具体来说,给定一个假设空间H,VC维是H中可以打破所有可能的标签配置的最大样本集合的大小。即,对于任意的n个样本和它们的标签,存在一种在H中的假设可以正确地分类这n个样本,但存在一种标签配置使得H中没有假设可以完美地分类这n个样本。

常用方法

常用的方法包括使用打散证明和计算上界估计。打散证明是通过构造不同的样本集合,证明VC维的上界。计算上界估计是通过计算VC维的上界来估计模型的泛化能力。

(1)、SRM结构风险最小化原则,选择VC维适中的模型;

(2)、选用正则化,控制VC维,防止过拟合。

经验

选择适当的VC维的模型,结合正则化手段,可以最大限度地减小泛化误差。这需要对不同模型的VC维有清晰的认识,权衡VC维和训练误差,选择最优的参数。这需要对机器学习理论有深入的理解,但这也是模型设计中的重要一步。

应用方法论

在应用中,VC维可以用于评估预训练大模型的复杂度和泛化性能。例如,可以通过测量预训练模型对不同大小和类型的数据集的拟合能力,来估计其VC维大小。这样可以帮助开发者更好地理解预训练大模型的能力和局限性,并指导其在特定任务上的选择和调整。

案例应用

VC维的应用非常广泛,包括支持向量机、神经网络、决策树、朴素贝叶斯等模型。(1)、在支持向量机中,VC维可以用于选择核函数的类型和参数,以达到更好的泛化性能。SVM中的模型选择往往选择VC维适中的模型;SVM中的正则化参数的选择需要综合考虑VC维和训练误差,选择一个可以最大限度减小泛化误差的正则化参数。

(2)、在神经网络中,VC维可以用于确定网络结构的大小和参数的数量,以避免过度拟合。

案例理解如何计算VC维的大小

给定一个假设空间H,它包含2个模型:
h1: y=0  (分类全部为0)
h2: y=1   (分类全部为1)
此时,该假设空间H的VC维为2。
如果我们只有两个点,那么无论它们的标签如何,都可以被任意一个线性分类器正确分类,因此这个假设空间的VC维为 2。
原因是:对任意2个样本及其标签,h1和h2都可以正确分类。如:(x1,y1) = (0,0)    (x2,y2) = (1,1)   
h1可以正确分类,h2也可以正确分类

但是,当有3个样本时,(1,0),(0,1),(1,1),此时无论选择h1还是h2,都无法完全正确分类这3个样本。
因此,这个假设空间H的VC维为2,它可以完全正确分类的最大样本集大小为2。

再举例:假设空间H包含3个模型:
h1: y=0   (分类全部为0) 
h2: y=1   (分类全部为1)
h3: y=x     (按输入分类)
此时,H的VC维为3。
原因是,对任意3个样本,(0,0),(1,0),(0,1),h3可以正确分类,而h1和h2都无法完全正确分类。
因此,H的VC维为3,它可以完全正确分类的最大样本集大小为3。
但是,当有4个样本(0,0),(1,0),(0,1),(1,1)时,不管选择h1,h2还是h3,都无法正确分类所有4个样本。

ML之VC维:VC维(Vapnik-Chervonenkis Dimension)理论的概述(衡量模型复杂度和预测能力的指标)的简介、案例理解之详细攻略相关推荐

  1. ML:机器学习模型可解释性之explainability和interpretability区别的简介、区别解读、案例理解之详细攻略

    ML:机器学习模型可解释性之explainability和interpretability区别的简介.区别解读.案例理解之详细攻略 目录 机器学习模型可解释性之explainability和inter ...

  2. DS之MDS:MDS(Multidimensional Scaling)多维尺度降维算法的简介、使用方法、案例应用之详细攻略

    DS之MDS:MDS(Multidimensional Scaling)多维尺度降维算法的简介.使用方法.案例应用之详细攻略 目录 MDS的简介 MDS(Multidimensional Scalin ...

  3. ML之ME/LF:机器学习之风控业务中常用模型评估指标PSI(人群偏移度指标)的的简介、使用方法、案例应用之详细攻略

    ML之ME/LF:机器学习之风控业务中常用模型评估指标PSI(人群偏移度指标)的的简介.使用方法.案例应用之详细攻略 目录 PSI(稳定度指标)的简介 1.如何计算PSI? (1).PSI计算过程

  4. ML之PPMCC:PPMCC皮尔逊相关系数(Pearson correlation coefficient)、Spearman相关系数的简介、案例应用之详细攻略

    ML之PPMCC:PPMCC皮尔逊相关系数(Pearson correlation coefficient).Spearman相关系数的简介.案例应用之详细攻略 目录 PPMCC皮尔逊相关系数的简介 ...

  5. ML之SR:Softmax回归(Softmax Regression)的简介、使用方法、案例应用之详细攻略

    ML之SR:Softmax回归(Softmax Regression)的简介.使用方法.案例应用之详细攻略 目录 Softmax回归的简介 Softmax回归的使用方法 Softmax回归的案例应用 ...

  6. ML之FE:数据处理—特征工程之特征三化(标准化【四大数据类型(数值型/类别型/字符串型/时间型)】、归一化、向量化)简介、代码实现、案例应用之详细攻略

    ML之FE:数据处理-特征工程之特征三化(标准化[四大数据类型(数值型/类别型/字符串型/时间型)].归一化.向量化)简介.代码实现.案例应用之详细攻略 目录 真正意义的标准化与归一化 1.标准化/Z ...

  7. ML之DataScience:基于机器学习处理数据科学(DataScience)任务(数据分析、特征工程、科学预测等)的简介、流程、案例应用执行详细攻略

    ML之DataScience:基于机器学习处理数据科学(DataScience)任务(数据分析.特征工程.科学预测等)的简介.流程.案例应用执行详细攻略 目录 数据科学的任务(数据分析.特征工程.科学 ...

  8. ML之FE:数据处理—特征工程之稀疏特征的简介、如何处理、案例应用之详细攻略

    ML之FE:数据处理-特征工程之稀疏特征的简介.如何处理.案例应用之详细攻略 目录 稀疏特征的简介 稀疏特征的如何处理 稀疏特征的案例应用 稀疏特征的简介 信号稀疏表示是过去近20年来信号处理界一个非 ...

  9. ML之Validation:机器学习中模型验证方法的简介、代码实现、案例应用之详细攻略

    ML之Validation:机器学习中模型验证方法的简介.代码实现.案例应用之详细攻略 目录 模型验证方法的简介 1.Hold-out验证 2.K-折交叉验证 3.自助重采样 模型验证方法的代码实现 ...

最新文章

  1. 如何用计算机玩我的世界,怎样在电脑上玩《我的世界》
  2. SpringCloud教程- 路由网关Zuul (SpringCloud版本Greenwich.SR4)
  3. sublime text java 开发_Sublime Text 3搭建Java开发环境
  4. mysql 查看集群状态_MySQL数据库集群正确配置步骤
  5. android o 结构光流程,惊艳亮相!一分钟看懂OPPO Find X 3D结构光技术是什么鬼,太牛了...
  6. linux 安装 php 5.2_Linux下安装PHP5.5
  7. iPhone 15有望配备潜望式摄像头 供应商已宣布投资建厂
  8. 被开除的Roadstar合伙人决定暂不回应,“报销大保健”也能忍?
  9. C++設計模式——策略模式
  10. [转载] Python的exec
  11. 利用Oracle Enterprise Manager Cloud Control 12c创建DataGuard Standby
  12. php出语句,PHP语句_php
  13. html诗词赏析网页制作,html 网页文本设计
  14. golden ticket和sliver ticket的区别是什么?
  15. web 视频演示,MP4小视频免费下载
  16. 关于nifty counters
  17. java抽象类例子月薪年薪程序_利用抽象类给一个有工资收入和稿费收入的小伙伴算税...
  18. 【WebDriver】WebDriverWait 用法代码
  19. [c++] 常成员函数
  20. druid数据源下 sqlserver 出现 对象名 'xxx' 无效

热门文章

  1. idea 启动项目突然间 java.lang.OutOfMemoryError: Java heap space
  2. AD从原理图到PCB超详细教程
  3. MYSQL数据库 增删改查基础语句
  4. Word文档中插入的图片显示不全、嵌入式图片显示不全解决方法,仅设置图片为单倍行距方法
  5. rtsp h256 流 web 软解播放
  6. 教你九种 JVM GC 问题的排查方法
  7. 三极管吸潮失效分析案例
  8. Win10打开休眠模式
  9. DDL(数据定义语言)讲解
  10. 最大似然估计算法(简单,通俗易懂)