很多参数估计问题均采用似然函数作为目标函数,当训练数据足够多时,可以不断提高模型精度,但是以提高模型复杂度为代价的,同时带来一个机器学习中非常普遍的问题——过拟合。所以,模型选择问题在模型复杂度与模型对数据集描述能力(即似然函数)之间寻求最佳平衡。

人们提出许多信息准则,通过加入模型复杂度的惩罚项来避免过拟合问题,此处我们介绍一下常用的两个模型选择方法——赤池信息准则(Akaike Information Criterion,AIC)和贝叶斯信息准则(Bayesian Information Criterion,BIC)。

1.AIC准则

AIC是衡量统计模型拟合优良性的一种标准,由日本统计学家赤池弘次在1974年提出,它建立在熵的概念上,提供了权衡估计模型复杂度和拟合数据优良性的标准。

通常情况下,它是拟合精度和参数未知个数的加权函数,AIC定义为:

AIC=2k-2In(L)

当在两个模型之间存在着相当大的差异时,这个差异出现于上式第二项,而当第二项不出现显著性差异时,第一项起作用,从而参数个数少的模型是好的模型。

让n为观察数,RSS为剩余平方和,那么AIC变为:

AIC=2k+nIn(RSS/n)

其中k是模型中未知参数个数,L是模型中极大似然函数值似然函数。从一组可供选择的模型中选择最佳模型时,通常选择AIC最小的模型。

当两个模型之间存在较大差异时,差异主要体现在似然函数项,

当似然函数差异不显著时,上式第一项,即模型复杂度则起作用,从而参数个数少的模型是较好的选择。

一般而言,当模型复杂度提高(k增大)时,似然函数L也会增大,从而使AIC变小,但是k过大时,似然函数增速减缓,导致AIC增大,模型过于复杂容易造成过拟合现象。目标是选取AIC最小的模型,AIC不仅要提高模型拟合度(极大似然),而且引入了惩罚项,使模型参数尽可能少,有助于降低过拟合的可能性。可见AIC准则有效且合理地控制了参数的维数k。显然AIC准则追求似然函数尽可能大的同时,k要尽可能的小。

举例:

设y1,y2,....,yn是来自未知总体g(y)的样本。总体的概率密度为f(y;θ),θ是r*1未知参数向量。若θ的极大似然估计是θ*,则L(θ*)=∑_(i=1)^n▒〖Inf(y_i;θ*)〗就是对数似然函数,由此,

AIC=-2L(θ*)+2r

可以度量f(y;θ)与g(y)之间的差异。

2.BIC

BIC(Bayesian InformationCriterion)贝叶斯信息准则与AIC相似,用于模型选择,1978年由Schwarz提出。训练模型时,增加参数数量,也就是增加模型复杂度,会增大似然函数,但是也会导致过拟合现象,针对该问题,AIC和BIC均引入了与模型参数个数相关的惩罚项,BIC的惩罚项比AIC的大,考虑了样本数量,样本数量过多时,可有效防止模型精度过高造成的模型复杂度过高。

BIC=kIn(n)-2In(L)

其中,k为模型参数个数,n为样本数量,L为似然函数。kln(n)惩罚项在维数过大且训练样本数据相对较少的情况下,可以有效避免出现维度灾难现象。

3.QAIC

为了使用过度离散(或缺乏拟合),提出了改进的AIC准则QAIC:

QAIC=-2In(L)/c+2k

c是方差膨胀因子

python aic准则_赤池信息准则AIC,BIC相关推荐

  1. 赤池信息准则AIC,BIC

    很多参数估计问题均采用似然函数作为目标函数,当训练数据足够多时,可以不断提高模型精度,但是以提高模型复杂度为代价的,同时带来一个机器学习中非常普遍的问题--过拟合.所以,模型选择问题在模型复杂度与模型 ...

  2. 赤池信息量准则(AIC)和贝叶斯信息准则(BIC)

    一 AIC 赤池信息量准则(Akaike information criterion,AIC)是评估统计模型的复杂度和衡量统计模型"拟合"资料之优良性(Goodness of fi ...

  3. AIC-赤池信息准则、BIC-贝叶斯信息准则

    1.AIC准则 2.BIC准则

  4. python综合管理系统_学生综合信息管理系统

    1 绪论 1.1 项目概述 学生基本信息管理系统分为六个板块 分别是修改密码.班级管理 学生管理.教师管理.课程管理和选课管理 ①密码修改是对登录身份(系统管理员.教师.学生)密码的修改 ②班级管理系 ...

  5. python apply_async函数_进程池未执行apply_async中添加的函数就直接结束了

    代码没有执行apply_async中添加的函数就直接结束了 from bs4 import BeautifulSoup import random import requests import pym ...

  6. python 时间序列预测_使用Python进行动手时间序列预测

    python 时间序列预测 Time series analysis is the endeavor of extracting meaningful summary and statistical ...

  7. python 多元线性回归_多元统计分析之多元线性回归的R语言实现

    多元统计分析之多元线性回归的R语言实现 多元统计分析--multivariate statistical analysis 研究客观事物中多个变量之间相互依赖的统计规律性.或从数学上说, 如果个体的观 ...

  8. 信息准则:AIC、BIC、FPE、LILC

    1.简介 信息准则(information criterion):经常地,对一堆数据进行建模的时候,特别是分类和回归模型,我们有很多的变量可供使用,选择不同的变量组合可以得到不同的模型,例如我们有5个 ...

  9. aic值检验 p值_模型选择方法:AIC和BIC

    经常地,对一堆数据进行建模的时候,特别是分类和回归模型,我们有很多的变量可供使用,选择不同的变量组合可以得到不同的模型,例如我们有5个变量,2的5次方,我们将有32个变量组合,可以训练出32个模型.但 ...

  10. AIC信息准则算法matlab实例

    AIC是一种信息准则,通常用于模型选择和拟合,因此具体的实现取决于你要解决的问题.以下是一个简单的示例程序,演示如何使用AIC选择一个线性回归模型: scssCopy code% Generate s ...

最新文章

  1. 堆和栈的区别(面试经验总结)
  2. mysql5.0 Using a password on the command line interface can be insecure.最简单的解决办法
  3. 下列哪个不是目前python里的内置模块-python中那些小众但有用的内置模块
  4. 函数 —— fgets()
  5. 【译】JS基础算法脚本:字符串重复
  6. flutter Web打包
  7. 如何攻击Java Web应用【转载】
  8. SpringBoot | 第十四章:基于Docker的简单部署
  9. 募捐:请帮助一名 Linux 程序员的女儿
  10. MVC实用架构设计(三)——EF-Code First(1):Repository,UnitOfWork,DbContext
  11. 036、JVM实战总结:糟糕!运行着的线上系统突然卡死无法访问,万恶的JVM GC!
  12. AngularJS从构建项目开始
  13. 为什么从PhoneGap中逃离
  14. Zookeeper+Curator 分布式锁
  15. 图片复印如何去除黑底_如何去除扫描件的底色? 扫描的图片去除背面的阴影的方法...
  16. Vue项目使用SSR服务器渲染
  17. Android学习日记(yzy):显示application并调用
  18. 计算机基础课程-书籍和视频教程资源
  19. Android常见设计模式——观察者模式 (Observer Pattern)
  20. s5pv210_gpio驱动及其在android2.3.1下jni调用~~

热门文章

  1. Nmap扫描和识别服务
  2. python图像拉伸_python处理图像
  3. 账结法”、“表结法”两种财务会计处理方法
  4. Markdown表格之表格内换行
  5. DT741-csf联通创维光猫桥接模式+华为WS5200路由器拨号设置
  6. easypoi 语法_【语法微课合集】50堂英语语法微课,视频课件免费下载,建议收藏或转发朋友圈...
  7. 玉米社:抖音玩法和运营机制,学会这些技巧,轻松上热门
  8. linux压缩归档命令gzip、bzip2、xz、tar、zip详解
  9. 如何申请CSDN博客?
  10. @Qualifier的作用和应用