2019独角兽企业重金招聘Python工程师标准>>>

  AIC信息准则即Akaike information criterion,是衡量统计模型拟合优良性的一种标准,又由与它为日本统计学家赤池弘次创立和发展的,因此又称赤池信息量准则。它建立在熵的概念基础上,可以权衡所估计模型的复杂度和此模型拟合数据的优良性。

在一般的情况下,AIC可以表示为: AIC=2k-2ln(L),其中:k是参数的数量,L是似然函数。 假设条件是模型的误差服从独立正态分布。 让n为观察数,RSS为剩余平方和,那么AIC变为: AIC=2k+nln(RSS/n)。

增加自由参数的数目提高了拟合的优良性,AIC鼓励数据拟合的优良性但是尽量避免出现过度拟合(Overfitting)的情况。所以优先考虑的模型应是AIC值最小的那一个。赤池信息准则的方法是寻找可以最好地解释数据但包含最少自由参数的模型。

经常地,对一堆数据进行建模的时候,特别是分类和回归模型,我们有很多的变量可供使用,选择不同的变量组合可以得到不同的模型,例如我们有5个变量,2的5次方,我们将有32个变量组合,可以训练出32个模型。但是哪个模型更加的好呢?目前常用有如下方法:
AIC=-2 ln(L) + 2 k  中文名字:赤池信息量 akaike information criterion
BIC=-2 ln(L) + ln(n)*k 中文名字:贝叶斯信息量 bayesian information criterion
HQ=-2 ln(L) + ln(ln(n))*k  hannan-quinn criterion

构造这些统计量所遵循的统计思想是一致的,就是在考虑拟合残差的同时,依自变量个数施加“惩罚”。但,倘若因此就说它们是同一个指标,恐怕还是有些不妥,毕竟“惩罚”的力度还是不尽相同的。此外,这些信息量的用途不仅限于选择模型,还能用于选取合适的变换等等。而在那些时候,这些信息量又是另一个模样,也就是说它们有许多变体。因此,它们也被称为AIC准则、BIC准则等等。它们中的每一个体现的都是一系列的标准,而非单独的一个简单式子。

注意这些规则只是刻画了用某个模型之后相对“真实模型”的信息损失(因为不知道真正的模型是什么样子,所以训练得到的所有模型都只是真实模型的一个近似模型),所以用这些规则不能说明某个模型的精确度,即三个模型A, B, C,在通过这些规则计算后,我们知道B模型是三个模型中最好的,但是不能保证B这个模型就能够很好地刻画数据,因为很有可能这三个模型都是非常糟糕的,B只是烂苹果中的相对好的苹果而已。

这些规则理论上是比较漂亮的,但是实际在模型选择中应用起来还是有些困难的,例如上面我们说了5个变量就有32个变量组合,如果是10个变量呢?2的10次方,我们不可能对所有这些模型进行一一验证AIC, BIC,HQ规则来选择模型,工作量太大。

因为AIC和BIC一般为负值 也就是绝对值越大 负得越多越好 你可以查一下AIC和BIC的计算公式 一般都是分为两个部分 一部分是度量拟合效果,另一部分是对参数个数增加的惩罚

转载于:https://my.oschina.net/u/1161889/blog/1549141

[经验分享] 【统计小百科】你知道AIC准则么?相关推荐

  1. 小程序审核经验分享|小程序发布如何快速过审?

    首先说明下这只是经验分享,并非100%的结论,但是我们公司按照这几点执行后,的确审核效率大大提高,甚至有2次半小时就审核通过了. 相信有个小伙伴会遇到这个棘手的问题,事前已经跟市场部,广告推广商量了好 ...

  2. 跨专业考清华大学的计算机,18级学长跨考清华大学计算机考研经验分享

    18级学长跨考清华大学计算机考研经验分享本站小编 Free考研网/2019-05-28 考清华计算机也考了两年,在这里得到了很多帮助,所以也是时候贡献一下了.先说下我的基本情况吧.我本科是天津大学精仪 ...

  3. 学计算机可以用算盘吗,看图猜成语黑板学生算盘计算机答案玩法经验分享

    看图猜成语黑板学生算盘计算机答案玩法经验分享是小编今天给各位玩家老爷到来的内容,这道题是什么呢,4张不同形式的表达效果,每张图所指的方向都是同一点,还不了解的玩家跟着小编一起看看接下来的分析吧,希望能 ...

  4. 南京理工计算机考研经验,南京理工大学2020社会工作初试391分经验分享

    南京理工大学2020社会工作初试391分经验分享本站小编 免费考研网/2020-02-27 2020考研南京理工社会工作专业经验贴 初试总分391 政治68 英二62 原理126 实务135 下面是我 ...

  5. 心理与行为科学统计_华东师范大学心理学考研备考经验分享

    21考研必看:华东师范大学心理学考研备考经验分享 +考研同盟QQ群:1004896729 群内有海量免费资料.真题.经验贴 +考研同盟QQ群:1004896729 群内有海量免费资料.真题.经验贴 学 ...

  6. 经验分享:微信小程序外包接单常见问题及流程

    2019独角兽企业重金招聘Python工程师标准>>> 从九月底内测到现在已经三个半月.凌晨一点睡觉已经习以为常,也正是这样,才让无前端经验的我做微信小程序开发并不感到费劲. 最近才 ...

  7. usb转ttl小板pl2303hx_TTL刷机经验分享,刷机后实现软件随便安装,电视直播免费看...

    前言 之前已经介绍过很多方法,把闲置运营商盒子刷出全网通盒子,实现软件任意装,电视免费看,网络视频任意点播.刷机方法针对不同盒子,方法各异,但适应性最强的就是TTL刷机了.这些分享一点刷机经验和注意事 ...

  8. 两个月入门深度学习,全靠动手实践!一位前端小哥的经验分享

    两个月入门深度学习,全靠动手实践!一位前端小哥的经验分享   在当前社会,技术日新月异,一个全栈工程师不及时学习新知识,掌握AI技能,再过两年就算不上"全栈"了. 产品发烧友.前端 ...

  9. 去年一个百万级的小软件项目经验分享,20来个功能模块,项目不太好做有些棘手...

    别人总觉得是在显吧,干脆把这个项目认为是小项目了,不知道把这个项目是小了,别人会不会又觉得又显吧了?说大也不行.说小也不行,也的确没招了. 我想主要把项目里遇到的问题分享给大家一起探讨,也并不是为了什 ...

  10. Kaggle比赛冠军经验分享:如何用 RNN 预测维基百科网络流量

    Kaggle比赛冠军经验分享:如何用 RNN 预测维基百科网络流量 from:https://www.leiphone.com/news/201712/zbX22Ye5wD6CiwCJ.html 导语 ...

最新文章

  1. spring-boot 引入xml注入bean
  2. MacOS系统下的图形化工具
  3. GitHub:GitHub简介、使用方法、经验总结(图文教程)之详细攻略(持续更新!)
  4. 栈的应用-四则运算表达式
  5. PIE SDK剔除栅格块算法
  6. codeforces 938D Buy a Ticket 有初值的Dijkstra、有趣的题目
  7. Java大数据处理的流行框架
  8. linux基础_centos安装与网络配置
  9. react月份选择控件_看我的案例:用react写一个日历控件!
  10. matlab中boxplot函数的参数设置_Matlab箱形图boxplot函数用法
  11. 《人件》(Peopleware)文摘
  12. my ReadBook_wangluoyingxiaoyucehua / network marketing / wangluoyingxiao
  13. cdn回源php_CDN回源、网站解析 是什么意思?
  14. 柳永 天涯 青砚1989
  15. Python图形界面编程
  16. c语言子程序返回指令,十八、使用call和ret指令实现子程序的调用和返回
  17. 我的小感悟(个人愚见)
  18. mysql sql 列变成横向_SQL 统计 字段 竖向转横向 (行转列)显示
  19. 继美团重申严禁诱导强迫骑手注册成个体工商户后,饿了么也回应了
  20. 一个应届生是怎样搞定google、微软、百度、腾讯、搜狗的

热门文章

  1. python没有缩进错误但报缩进_Python:“缩进错误:unindent与任何外部缩进级别都不匹配”...
  2. vue项目中微信分享安卓正常,ios报签名错误
  3. [EdgeAI] NXP eIQ 机器学习Toolkit (二):模型篇
  4. 【蓝屏解决】笔记本频繁蓝屏,错误代码IRQL_NOT_LESS_OR_EQUAL
  5. html中怎么设置表格自动换行在哪里,【HTML】表格自动换行
  6. 黑马程序员_面向对象简介
  7. uview框架u-form表单校验,rules校验对象中对象的值(解决 当form属性嵌套对象时未取到值的问题)
  8. Java-万元与元之间的换算
  9. 美团获得小样本学习榜单FewCLUE第一!Prompt Learning+自训练实战
  10. WEB学生网页作业【HTML+CSS】静态网页期末大作业课程设计