统计量是数据的函数。函数就是一种「浓缩」讯息的动作。因此, 统计量中所包含的讯息, 通常比整个样本数据所包含的来得少.例如样本的顺序统计量只包含了有哪些值出现, 而不同值出现的顺序这样的讯息不见了。

但统计量比样本原数据少掉的讯息可能是无关紧要的 --- 和我们要了解的群体特性不相干, 如上述数据出现顺序在很多时候和我们关心的群体特性无关。统计量所包含关于群体特性的讯息不比原样本数据少, 就是充分统计量。

在参数化模型, 例如常态分布, 我们可能用很简单的统计量就可囊括样本中所包含的全部参数讯息, 如样本平均数和样本变异数包含了样本所携带的, 关于常态群体参数 (群体平均数和标准差) 的全部讯息。但有些时候,尤其是非参数化模型, 可能要整个样本的顺序统计量才是充分的。

sufficient statistic 充分统计量

对于一个未知分布而言,充分统计量sufficient statistic,顾名思义,就是当知道这些量的时候,这个分布就可以确定了,所以这些量才有sufficient的意思,足够的意思。有了这些量,即便丢失掉样本的其他信息也对于估计未知的分布而言也是无关紧要了,所以那些量才能成为是sufficient的。维基上的解释最经典,没有任何其他来自同样样本的统计量能够比充分统计量提供更多关于未知参数的信息(我是这么理解的)。原句如下:In statistics, a sufficient statistic is a statistic which has the property of sufficiency with respect to a statistical model and its associated unknown parameter, meaning that "no other statistic which can be calculated from the same sample provides any additional information as to the value of the parameter".

比如,对于一些来自未知分布的样本,对于参数估计而言,就是可以把这个未知的分布表示成p(\Theta)的形式,样本的分布就可以表示为p(x|\Theta); 而充分统计量,假设为q,它的存在意义是当我们比较难以推导出\Theta时,如果由这些样本能比较容易的决定q,那此时p(x|\Theta)就等同于p(x|q),我们就由比较容易得出的充分统计量来代替了原来难以直接推导出的参数q。

充分统计(sufficient statistic) 理解相关推荐

  1. sufficient statistic 充分统计量

    sufficient statistic 充分统计量 对于一个未知分布而言,充分统计量sufficient statistic,顾名思义,就是当知道这些量的时候,这个分布就可以确定了,所以这些量才有s ...

  2. R语言KMeans聚类分析确定最优聚类簇数实战:间隙统计Gap Statistic(确定最优聚类簇数)

    R语言KMeans聚类分析确定最优聚类簇数实战:间隙统计Gap Statistic(确定最优聚类簇数) 目录

  3. UA MATH567 高维统计 专题0 为什么需要高维统计理论?——理解稀疏向量与hard-threshold

    UA MATH567 高维统计 专题0 为什么需要高维统计理论?--理解稀疏向量与hard-threshold 稀疏向量的soft-threshold与hard-threshold近似 引入hard- ...

  4. Sufficient Statistic (充分统计量)

    文章目录 定义 充分统计量的判定 最小统计量 例子 U[0,θ]U[0, \theta]U[0,θ] U[α,β]U[\alpha, \beta]U[α,β] Poisson Normal 指数分布 ...

  5. eclipse代码量统计插件_Android Studio 代码行数统计插件Statistic的简单使用

    在项目开发过程中,有时候需要统计代码行数(比如组长想关心一下你的代码量,或者要申请软件著作权时),需要统计的文件类型主要是 .java..xml..kt等,已经有人开发好相关插件了,如果你是用Andr ...

  6. 【统计】如何理解相关系数,自相关和偏自相关函数(PACF)?

    The Intuition Behind Correlation 原文:https://timeseriesreasoning.com/contents/correlation/ 作者:Sachin ...

  7. 统计|如何简单理解单因素方差分析

    本博文源于<商务统计>,主要探讨如何理解单因素方差分析.首先可以很确定的说方差分析不是针对方差来做分析. 引例:消费者协会对不同企业的服务水平进行点差,测得23家投诉次数如下: 散点图讲解 ...

  8. idea中安装统计代码statistic插件

    百度一圈都是直接在idea中安装statistic插件,就不再重复 1.从官网下载:http://plugins.jetbrains.com/plugin/4509-statistic/version ...

  9. 代码行数统计工具statistic和cloc的使用

    简介 Cloc是一款使用Perl语言开发的开源代码统计工具,支持多平台使用.多语言识别,能够计算指定目标文件或文件夹中的文件数(files).空白行数(blank).注释行数(comment)和代码行 ...

  10. 现代信号处理笔记 2 统计信号处理基础(Statistical Signal Processing)

    重新回顾概率统计过程: Data→Model→ Decision 实际工程中,就是从这三点出发,走完概率统计的整个过程. 这里要清楚数据是上帝给的,模型是人造的,不可避免存在各种各样的问题.数据到模型 ...

最新文章

  1. DeepMind开源强化学习环境,灵活可配置,计算资源有限的小型实验室也能用
  2. java 大于30分钟,如何将会话超时设置为大于30分钟
  3. linux tail命令_操作手册
  4. easyui前端框架模板_.NET Core基于Ace Admin的响应式框架
  5. matlab代码转换成python_[Python]40行代码实现公式转换成图片,手把手教你从模仿到实现...
  6. redis 槽点重新分配 集群_Redis群集部署详解
  7. ffmpeg处理RTMP流媒体的命令大全
  8. 手机号 ,邮箱,固定电话js验证,身份证号(正则表达式)
  9. Django积木块11 —— 缓存
  10. matlab动力学系统仿真 教程,MATLAB/SIMULINK动力学系统建模与仿真
  11. prn文件导入Matlab,PPP_code(Matlab) GPS精密单点定位中的周跳探测与修复的算法研究代码 GPS develop 238万源代码下载- www.pudn.com...
  12. 桥接模式和NAT模式的区别
  13. C语言应用(3)——Base64编码/解码
  14. 在linux下刷B站方法总结
  15. html+在ul中加边框,为元素添加边框,你有多少种好办法?
  16. 科目二练习与考试点位总结
  17. 宇视科技android面试_宇视科技初面
  18. 高效能技术领导者,不仅是首席技术官,更是首席情绪官
  19. python jit_Pypy Python的JIT实现
  20. 创业者应具备的素质和条件

热门文章

  1. vs2015下,使用人脸检测算法对FDDB数据集进行测评
  2. 计算机硬盘扇区修复,一文教你搞定硬盘上的坏扇区要怎么修复,如果从坏扇区修复数据!...
  3. 电脑计算机硬盘坏了如何修理,笔记本电脑硬盘坏了怎么修复怎么办
  4. 编辑器 的保存怎么绑定事件_小鹿百度编辑器新增小程序URL,抢占百度新流量...
  5. ogg是什么格式的文件后缀
  6. 静态代理和动态代理的区别
  7. 工业相机选型和镜头焦距计算
  8. 进程的初步认识(程序与进程、并发、单道程序设计、多道程序设计、CPU、MMU)
  9. 复制xml导致乱码问题解决。
  10. 2021-CSP-J2/S2 自我题解