ML之VC维:VC维(Vapnik-Chervonenkis Dimension)理论的概述(衡量模型复杂度和预测能力的指标)的简介、案例理解之详细攻略
ML之VC维:VC维(Vapnik-Chervonenkis Dimension)理论的概述(衡量模型复杂度和预测能力的指标)的简介、案例理解之详细攻略
目录
VC维(Vapnik-Chervonenkis Dimension)理论的简介
VC维(Vapnik-Chervonenkis Dimension)理论的概述(衡量模型复杂度和预测能力的指标,但VC维理论目前已被边缘化)
案例理解如何计算VC维的大小
VC维(Vapnik-Chervonenkis Dimension)理论的简介
VC维(Vapnik-Chervonenkis Dimension)理论的概述(衡量模型复杂度和预测能力的指标,但VC维理论目前已被边缘化)
VC维理论的边缘化 |
VC维理论目前已被边缘化 VC维理论读起来很晦涩,它在解释分类决策面如SVM较成功,但VC维在神经网络中似乎是失效了。然而,对于科学习性、定性必须上升到定量化,VC维不是没用,而是需要进化。 VC维理论是一个目前被边缘化的知识。理由根据VC维理论,神经网络的VC维巨大,学习是不可行的。但是实际情况,神经网络却在一些领域表现良好。这又是什么原因呢?主要的解释有数据量激增、神经网络共享权值导致参数变少使得VC维下降等。 VC维理论由于理论性过强,计算复杂,对小样本不太 sensitive,泛化误差难以度量,过于强调模型复杂度等因素,使其作用相对被边缘化。此外,机器学习算法快速发展和深度学习的出现,无法解释深度学习,也在一定程度上减弱了VC维理论的影响和作用。VC维理论被相对边缘化有其客观原因,但是这并不代表其作用会完全消失。 |
简介 |
VC维(Vapnik-Chervonenkis Dimension),它是机器学习理论中的一个重要概念,由Vapnik和Chervonenkis提出,它表示模型的复杂度,衡量模型表示数据的能力。VC维越高,模型的表示能力就越强(模型越复杂),拟合能力越强,但也容易过拟合。 VC维是由Vladimir Vapnik和Alexey Chervonenkis提出的,用于描述一个模型的表示能力或假设空间的大小。它定义了一个模型可以拟合的最大样本集合的大小,使得模型可以在这个样本集合上表现良好,但不能保证在其他样本集合上表现良好。 |
意义 |
VC维是一个模型选择和正则化的重要指标。VC维是衡量模型复杂度和预测能力的重要指标。理解VC维有助于选择模型,判断过拟合,选择正则化参数。它为我们提供了模型评估与选择的理论基础,是机器学习理论中一个重要概念。 (1)、可以度量模型复杂度:VC维可以度量模型的参数数量、结构的复杂度,评估模型的预测能力。VC维可以用来衡量一个模型的复杂度和泛化能力。 (2)、可以刻画集合的复杂度:VC维度度量一个集合划分输入空间的能力,反映集合的复杂度。 (3)、可以判断过拟合:VC维可以用于判断模型是否过拟合。VC维过高,容易导致过拟合。VC维与模型表示数据的能力相关,VC维高的模型预测能力强,但过拟合风险大。 (4)、可以帮助选择模型:在机器学习算法的模型选择中,VC维是一个重要标准,选择VC维适中的模型可以避免过拟合。 (5)、可以用于选择正则化的强度:VC维与正则化参数密切相关,可以用于选择正则化强度,防止过拟合。 |
主要内容 |
VC维的主要内容是描述一个模型可以拟合的最大样本集合的大小。 具体来说,给定一个假设空间H,VC维是H中可以打破所有可能的标签配置的最大样本集合的大小。即,对于任意的n个样本和它们的标签,存在一种在H中的假设可以正确地分类这n个样本,但存在一种标签配置使得H中没有假设可以完美地分类这n个样本。 |
常用方法 |
常用的方法包括使用打散证明和计算上界估计。打散证明是通过构造不同的样本集合,证明VC维的上界。计算上界估计是通过计算VC维的上界来估计模型的泛化能力。 (1)、SRM结构风险最小化原则,选择VC维适中的模型; (2)、选用正则化,控制VC维,防止过拟合。 |
经验 |
选择适当的VC维的模型,结合正则化手段,可以最大限度地减小泛化误差。这需要对不同模型的VC维有清晰的认识,权衡VC维和训练误差,选择最优的参数。这需要对机器学习理论有深入的理解,但这也是模型设计中的重要一步。 |
应用方法论 |
在应用中,VC维可以用于评估预训练大模型的复杂度和泛化性能。例如,可以通过测量预训练模型对不同大小和类型的数据集的拟合能力,来估计其VC维大小。这样可以帮助开发者更好地理解预训练大模型的能力和局限性,并指导其在特定任务上的选择和调整。 |
案例应用 |
VC维的应用非常广泛,包括支持向量机、神经网络、决策树、朴素贝叶斯等模型。(1)、在支持向量机中,VC维可以用于选择核函数的类型和参数,以达到更好的泛化性能。SVM中的模型选择往往选择VC维适中的模型;SVM中的正则化参数的选择需要综合考虑VC维和训练误差,选择一个可以最大限度减小泛化误差的正则化参数。 (2)、在神经网络中,VC维可以用于确定网络结构的大小和参数的数量,以避免过度拟合。 |
案例理解如何计算VC维的大小
给定一个假设空间H,它包含2个模型:
h1: y=0 (分类全部为0)
h2: y=1 (分类全部为1)
此时,该假设空间H的VC维为2。
如果我们只有两个点,那么无论它们的标签如何,都可以被任意一个线性分类器正确分类,因此这个假设空间的VC维为 2。
原因是:对任意2个样本及其标签,h1和h2都可以正确分类。如:(x1,y1) = (0,0) (x2,y2) = (1,1)
h1可以正确分类,h2也可以正确分类
但是,当有3个样本时,(1,0),(0,1),(1,1),此时无论选择h1还是h2,都无法完全正确分类这3个样本。
因此,这个假设空间H的VC维为2,它可以完全正确分类的最大样本集大小为2。
再举例:假设空间H包含3个模型:
h1: y=0 (分类全部为0)
h2: y=1 (分类全部为1)
h3: y=x (按输入分类)
此时,H的VC维为3。
原因是,对任意3个样本,(0,0),(1,0),(0,1),h3可以正确分类,而h1和h2都无法完全正确分类。
因此,H的VC维为3,它可以完全正确分类的最大样本集大小为3。
但是,当有4个样本(0,0),(1,0),(0,1),(1,1)时,不管选择h1,h2还是h3,都无法正确分类所有4个样本。
ML之VC维:VC维(Vapnik-Chervonenkis Dimension)理论的概述(衡量模型复杂度和预测能力的指标)的简介、案例理解之详细攻略相关推荐
- ML:机器学习模型可解释性之explainability和interpretability区别的简介、区别解读、案例理解之详细攻略
ML:机器学习模型可解释性之explainability和interpretability区别的简介.区别解读.案例理解之详细攻略 目录 机器学习模型可解释性之explainability和inter ...
- DS之MDS:MDS(Multidimensional Scaling)多维尺度降维算法的简介、使用方法、案例应用之详细攻略
DS之MDS:MDS(Multidimensional Scaling)多维尺度降维算法的简介.使用方法.案例应用之详细攻略 目录 MDS的简介 MDS(Multidimensional Scalin ...
- ML之ME/LF:机器学习之风控业务中常用模型评估指标PSI(人群偏移度指标)的的简介、使用方法、案例应用之详细攻略
ML之ME/LF:机器学习之风控业务中常用模型评估指标PSI(人群偏移度指标)的的简介.使用方法.案例应用之详细攻略 目录 PSI(稳定度指标)的简介 1.如何计算PSI? (1).PSI计算过程
- ML之PPMCC:PPMCC皮尔逊相关系数(Pearson correlation coefficient)、Spearman相关系数的简介、案例应用之详细攻略
ML之PPMCC:PPMCC皮尔逊相关系数(Pearson correlation coefficient).Spearman相关系数的简介.案例应用之详细攻略 目录 PPMCC皮尔逊相关系数的简介 ...
- ML之SR:Softmax回归(Softmax Regression)的简介、使用方法、案例应用之详细攻略
ML之SR:Softmax回归(Softmax Regression)的简介.使用方法.案例应用之详细攻略 目录 Softmax回归的简介 Softmax回归的使用方法 Softmax回归的案例应用 ...
- ML之FE:数据处理—特征工程之特征三化(标准化【四大数据类型(数值型/类别型/字符串型/时间型)】、归一化、向量化)简介、代码实现、案例应用之详细攻略
ML之FE:数据处理-特征工程之特征三化(标准化[四大数据类型(数值型/类别型/字符串型/时间型)].归一化.向量化)简介.代码实现.案例应用之详细攻略 目录 真正意义的标准化与归一化 1.标准化/Z ...
- ML之DataScience:基于机器学习处理数据科学(DataScience)任务(数据分析、特征工程、科学预测等)的简介、流程、案例应用执行详细攻略
ML之DataScience:基于机器学习处理数据科学(DataScience)任务(数据分析.特征工程.科学预测等)的简介.流程.案例应用执行详细攻略 目录 数据科学的任务(数据分析.特征工程.科学 ...
- ML之FE:数据处理—特征工程之稀疏特征的简介、如何处理、案例应用之详细攻略
ML之FE:数据处理-特征工程之稀疏特征的简介.如何处理.案例应用之详细攻略 目录 稀疏特征的简介 稀疏特征的如何处理 稀疏特征的案例应用 稀疏特征的简介 信号稀疏表示是过去近20年来信号处理界一个非 ...
- ML之Validation:机器学习中模型验证方法的简介、代码实现、案例应用之详细攻略
ML之Validation:机器学习中模型验证方法的简介.代码实现.案例应用之详细攻略 目录 模型验证方法的简介 1.Hold-out验证 2.K-折交叉验证 3.自助重采样 模型验证方法的代码实现 ...
最新文章
- 如何用计算机玩我的世界,怎样在电脑上玩《我的世界》
- SpringCloud教程- 路由网关Zuul (SpringCloud版本Greenwich.SR4)
- sublime text java 开发_Sublime Text 3搭建Java开发环境
- mysql 查看集群状态_MySQL数据库集群正确配置步骤
- android o 结构光流程,惊艳亮相!一分钟看懂OPPO Find X 3D结构光技术是什么鬼,太牛了...
- linux 安装 php 5.2_Linux下安装PHP5.5
- iPhone 15有望配备潜望式摄像头 供应商已宣布投资建厂
- 被开除的Roadstar合伙人决定暂不回应,“报销大保健”也能忍?
- C++設計模式——策略模式
- [转载] Python的exec
- 利用Oracle Enterprise Manager Cloud Control 12c创建DataGuard Standby
- php出语句,PHP语句_php
- html诗词赏析网页制作,html 网页文本设计
- golden ticket和sliver ticket的区别是什么?
- web 视频演示,MP4小视频免费下载
- 关于nifty counters
- java抽象类例子月薪年薪程序_利用抽象类给一个有工资收入和稿费收入的小伙伴算税...
- 【WebDriver】WebDriverWait 用法代码
- [c++] 常成员函数
- druid数据源下 sqlserver 出现 对象名 'xxx' 无效