sufficient statistic 充分统计量

对于一个未知分布而言,充分统计量sufficient statistic,顾名思义,就是当知道这些量的时候,这个分布就可以确定了,所以这些量才有sufficient的意思,足够的意思。有了这些量,即便丢失掉样本的其他信息也对于估计未知的分布而言也是无关紧要了,所以那些量才能成为是sufficient的。维基上的解释最经典,没有任何其他来自同样样本的统计量能够比充分统计量提供更多关于未知参数的信息(我是这么理解的)。原句如下:In statistics, a sufficient statistic is a statistic which has the property of sufficiency with respect to a statistical model and its associated unknown parameter, meaning that "no other statistic which can be calculated from the same sample provides any additional information as to the value of the parameter".

比如,对于一些来自未知分布的样本,对于参数估计而言,就是可以把这个未知的分布表示成p(theta)的形式,样本的分布就可以表示为p(x|theta); 而充分统计量,假设为q,它的存在意义是当我们比较难以推导出theta时,如果由这些样本能比较容易的决定q,那此时p(x|theta)就等同于p(x|q),我们就由比较容易得出的充分统计量来代替了原来难以直接推导出的参数q。

对于大家熟知的正态分布而言,如果有很多样本抽样自正态分布,那我们知道当确定了分布的均值和方差后,对于这些样本的很多信息就都可以忽略了,比如他们出现的先后顺序,比如有些样本可能比其他样本的值大很多。这个时候可以理解为均值和方差就是正态分布的充分统计量,就是sufficient 统计量。

(更多更详细的介绍,可以参考维基百科:http://en.wikipedia.org/wiki/Sufficient_statistic)

理解了上面的概念,就不难理解说dirichlet distribution有有限维的sufficient statistic有什么好处了。

转自:http://blog.sina.com.cn/s/blog_5033f3b40101g2ur.html

sufficient statistic 充分统计量相关推荐

  1. Sufficient Statistic (充分统计量)

    文章目录 定义 充分统计量的判定 最小统计量 例子 U[0,θ]U[0, \theta]U[0,θ] U[α,β]U[\alpha, \beta]U[α,β] Poisson Normal 指数分布 ...

  2. Mathematics English Vocabulary (Cited)

    一般词汇 数学 mathematics, maths(BrE), math(AmE) 公理 axiom 定理 theorem 计算 calculation 运算 operation 证明 prove ...

  3. 数学专业英语词汇英汉对照

    数学专业英语词汇英汉对照 A absolute value 绝对值 accept 接受 acceptable region 接受域 additivity 可加性 adjusted 调整的 altern ...

  4. 常见的统计术语翻译(转帖)

    Absolute deviation, 绝对离差 Absolute number, 绝对数 Absolute residuals, 绝对残差 Acceleration array, 加速度立体阵 Ac ...

  5. 一文了解什么是指数族分布

    前言 指数分布族是一系列分布的统称,包含连续和离散的相关分布.例如,正态分布(Gaussian).泊松分布(Poisson).二项分布(Bernoulli).指数分布(exponential).Gam ...

  6. SLAM:现在,未来和鲁棒感知时代

    文章目录 SLAM 研究的时代划分 the classical age (1986 - 2004) the algorithmic-analysis age (2004 - 2015) the rob ...

  7. 主成分分析PCA(principal component analysis)原理

    PCA在很多方面均有应用,但是之前没有仔细探究过,最近看了一些博客和论文,做一下总结. 主成分分析(Principal Component Analysis,PCA), 是一种统计方法.通过正交变换将 ...

  8. 机器学习(二)——广义线性模型、生成学习算法

    http://antkillerfarm.github.io/ 逻辑回归(续) 注:Ronald Aylmer Fisher,1890-1962,英国人,毕业于剑桥大学.英国皇家学会会员.尽管他被称作 ...

  9. 最大似然估计_状态估计的基本概念(2)最大似然估计和最大后验估计

    (1)最大似然估计ML和最大后验估计MAP 最大似然估计量 非贝叶斯方法通常是最大化似然函数: 其中 被称为 的最大似然估计量,它是 的函数. 最大后验估计量 估计随机参数的通常方法是最大化后验分布函 ...

最新文章

  1. 利用标准库sprintf、sscanf函数实现字符串和数字的转换
  2. 程序员如何乘风破浪?从数据库历史看技术人发展 | CSDN 高校俱乐部
  3. java多线程——饥饿和公平
  4. arcgis-把X Y点展到arcgis中的陷阱
  5. 神策数据正式成为国家级信创工委会成员单位!
  6. dojo Quick Start/dojo入门手册--xmlhttp dojo.xhrGet
  7. jQuery的位置信息和事件
  8. python爬虫贴吧_Python爬虫简单实现,贴吧图片一键下
  9. 什么样的程序员会让人讨厌
  10. 前端学习(2518):生命周期钩子
  11. 小白的python之路Linux部分10/2829
  12. Android Sqlite数据库操作
  13. 当前的开源SLAM方案
  14. c语言常用绘图软件有哪些,数学绘图软件有哪些?好用的数学绘图软件推荐
  15. 29 伪造ICMP数据包的IP层
  16. Docker学习总结(45)——Docker在沪江落地的实践
  17. 16位微型计算机 下册,十六位微型计算机
  18. 光纤接入实现模式 P2P和PON。PON原理介绍。
  19. 阿里巴巴高德地图首席科学家任小枫:高精算法推动高精地图落地
  20. 国际结算银行:嵌入式监管可大幅简化合规监管

热门文章

  1. stm32 spi nss硬件模式配置参考程序
  2. unity 虚线 无视透视 近大远小
  3. 多元素运动框架-链式运动的封装
  4. java-php-net-python-绥化市北林区房屋拆迁管理信息管理系统计算机毕业设计程序
  5. Web前端第一季(HTML):三:课时 7 : 106-设置文档类型和网页编码+课时 8 : 107-段落标签和标题标签+课时 9 : 108-标签的属性和段落的对齐属性
  6. JavaSwing_1.1: FlowLayout(流式布局)
  7. 一文搞定scrapy爬取众多知名技术博客文章保存到本地数据库,包含:cnblog、csdn、51cto、itpub、jobbole、oschina等
  8. scala 中缀表达式和中置操作符
  9. cass常用命令快捷键
  10. Panoply地理网格绘制软件