UA MATH566 统计理论4 贝叶斯统计基础1

  • 贝叶斯公式
  • 贝叶斯充分统计量

这一讲讨论贝叶斯统计的一些基础思想,会分成三个部分,第一部分讨论贝叶斯统计的设定;第二部分讨论贝叶斯统计的估计与假设检验;第三部分讨论贝叶斯统计的置信区间。

贝叶斯公式

假设XXX是概率空间(X,B(X),Pθ)(\mathcal{X},\mathcal{B}(\mathcal{X}),P_{\theta})(X,B(X),Pθ​)上的随机变量,X⊂Rn\mathcal{X} \subset \mathbb{R}^nX⊂Rn,它表示一组简单随机样本X1,⋯,Xn∼f(x∣θ)X_1,\cdots,X_n \sim f(x|\theta)X1​,⋯,Xn​∼f(x∣θ),θ\thetaθ是分布的参数,θ∈Θ\theta \in \Thetaθ∈Θ,Θ\ThetaΘ被称为参数空间。参数空间与其Borel σ\sigmaσ-代数构成一个可测空间(Θ,B(Θ))(\Theta,\mathcal{B}(\Theta))(Θ,B(Θ)),用Cap(Θ,B(Θ))Cap(\Theta,\mathcal{B}(\Theta))Cap(Θ,B(Θ))表示参数空间上所有可能的概率测度的集合,对于Pπ∈Cap(Θ,B(Θ))P_{\pi} \in Cap(\Theta,\mathcal{B}(\Theta))Pπ​∈Cap(Θ,B(Θ)),称测度PπP_{\pi}Pπ​导出的密度为参数θ\thetaθ的一个先验密度,记为π(θ)=Pπ(dθ)/dθ\pi(\theta) = P_{\pi}(d \theta)/d \thetaπ(θ)=Pπ​(dθ)/dθ,它与f(x∣θ)f(x|\theta)f(x∣θ)共同决定参数与样本的联合密度:
f(x,θ)=f(x∣θ)π(θ)f(x,\theta) = f(x|\theta)\pi(\theta)f(x,θ)=f(x∣θ)π(θ)
给定一组样本,参数的后验密度是
π(θ∣x)=f(x,θ)f(x)=f(x∣θ)π(θ)∫Θf(x∣θ)π(θ)dθ∝f(x∣θ)π(θ)\pi(\theta|x) = \frac{f(x,\theta)}{f(x)} = \frac{f(x|\theta)\pi(\theta)}{\int_{\Theta }f(x|\theta)\pi(\theta)d\theta} \propto f(x|\theta)\pi(\theta)π(θ∣x)=f(x)f(x,θ)​=∫Θ​f(x∣θ)π(θ)dθf(x∣θ)π(θ)​∝f(x∣θ)π(θ)
这个公式叫贝叶斯公式,f(x∣θ)π(θ)f(x|\theta)\pi(\theta)f(x∣θ)π(θ)叫后验密度的核,根据这个可以确定θ\thetaθ的分布形式。

例1 假设一个硬币掷出数字的概率是ppp,掷出头像的概率是1−p1-p1−p,如果ppp的先验是beta(3,3)beta(3,3)beta(3,3),重复30次试验掷出了16个正面,估计这个硬币掷出正面的概率。

例2 一组简单随机样本X1,⋯,Xn∼N(θ,σ2)X_1,\cdots,X_n \sim N(\theta,\sigma^2)X1​,⋯,Xn​∼N(θ,σ2),θ∼N(μ,1/λ0)\theta \sim N(\mu,1/\lambda_0)θ∼N(μ,1/λ0​),求θ\thetaθ的后验分布。

贝叶斯充分统计量

称统计量T(X)T(X)T(X)为贝叶斯充分统计量,如果∀Pπ∈Cap(Θ,B(Θ))\forall P_{\pi} \in Cap(\Theta,\mathcal{B}(\Theta))∀Pπ​∈Cap(Θ,B(Θ)),
π(θ∣x)=π(θ∣T(x))\pi(\theta|x) = \pi(\theta|T(x))π(θ∣x)=π(θ∣T(x))
即后验分布可以表示成θ\thetaθ与T(x)T(x)T(x)的函数。

定理 如果T(X)T(X)T(X)是充分统计量,则T(X)T(X)T(X)是贝叶斯充分统计量,反之亦然。

证明
1)假设T(X)T(X)T(X)是充分统计量,先用贝叶斯公式,然后用Fisher-Neyman定理
π(θ∣x)=f(x∣θ)π(θ)∫Θf(x∣θ)π(θ)dθ=h(x)g(θ,T(x))π(θ)∫Θh(x)g(θ,T(x))π(θ)dθ=g(θ,T(x))π(θ)∫Θg(θ,T(x))π(θ)dθ\pi(\theta|x) = \frac{f(x|\theta)\pi(\theta)}{\int_{\Theta }f(x|\theta)\pi(\theta)d\theta} = \frac{h(x)g(\theta,T(x))\pi(\theta)}{\int_{\Theta }h(x)g(\theta,T(x))\pi(\theta)d\theta}=\frac{g(\theta,T(x))\pi(\theta)}{\int_{\Theta }g(\theta,T(x))\pi(\theta)d\theta}π(θ∣x)=∫Θ​f(x∣θ)π(θ)dθf(x∣θ)π(θ)​=∫Θ​h(x)g(θ,T(x))π(θ)dθh(x)g(θ,T(x))π(θ)​=∫Θ​g(θ,T(x))π(θ)dθg(θ,T(x))π(θ)​
显然后验是只与θ\thetaθ和T(x)T(x)T(x)有关的,因此T(X)T(X)T(X)是贝叶斯统计量;
2)假设T(X)T(X)T(X)是贝叶斯充分统计量,根据贝叶斯公式,
π(θ∣x)=f(x,θ)f(x)=f(x∣θ)π(θ)f(x)⇒f(x∣θ)=π(θ∣x)f(x)π(θ)=f(x)π(θ∣T(x))π(θ)\pi(\theta|x) = \frac{f(x,\theta)}{f(x)} = \frac{f(x|\theta)\pi(\theta)}{f(x)} \Rightarrow f(x|\theta) = \frac{\pi(\theta|x)f(x)}{\pi(\theta)} = f(x)\frac{\pi(\theta|T(x))}{\pi(\theta)} π(θ∣x)=f(x)f(x,θ)​=f(x)f(x∣θ)π(θ)​⇒f(x∣θ)=π(θ)π(θ∣x)f(x)​=f(x)π(θ)π(θ∣T(x))​
其中f(x)f(x)f(x)只与样本有关,π(θ∣T(x))π(θ)\frac{\pi(\theta|T(x))}{\pi(\theta)}π(θ)π(θ∣T(x))​只与θ\thetaθ和T(x)T(x)T(x)有关,根据Fisher-Neyman定理,T(X)T(X)T(X)是充分统计量。

UA MATH566 统计理论4 贝叶斯统计基础1相关推荐

  1. UA MATH566 统计理论2 点估计基础

    UA MATH566 统计理论2 点估计基础 Rao-Blackwell定理 UMVUE 矩估计 最大似然估计 不变性与截面似然 Rao-Blackwell定理 统计推断的问题一般用统计决策理论的术语 ...

  2. UA MATH566 统计理论 Bayes统计基础

    UA MATH566 统计理论 Bayes统计基础 共轭分布 基于后验概率预测新的观测值 Bayes统计思想的基础是Bayes公式 P(Ci∣A)=P(A,Ci)P(A)=P(A∣Ci)P(Ci)∑i ...

  3. UA MATH566 统计理论2 C-R不等式简介

    UA MATH566 统计理论2 C-R不等式 单个参数的情形 多个参数的情形 点估计基础那一篇讨论到UMVUE了,这一讲试图给出无偏估计方差的一个下界.在统计理论1中推导的Fisher信息其实就是一 ...

  4. UA MATH566 统计理论8 置信区间简介

    UA MATH566 统计理论8 置信区间简介 例1:单个正态总体均值的置信区间(方差已知) 例2:单个正态总体均值的置信区间(方差未知) 假设检验与置信区间的关系 例3:根据单边检验导出单边置信区间 ...

  5. UA MATH566 统计理论1 充分统计量

    UA MATH566 统计理论1 充分统计量 指数族 自然形式 充分统计量 Neyman-Fisher因子分解定理 Bayes充分性 最小充分统计量 完备性 分布族的完备性 统计量的完备性 辅助统计量 ...

  6. UA MATH566 统计理论 一个例题 Hierarchical Model的统计性质

    UA MATH566 统计理论 一个例题 Hierarchical Model的统计性质 Y∣X∼Pois(X)Y|X \sim Pois(X)Y∣X∼Pois(X) and X∼Γ(α,β)X \s ...

  7. UA MATH566 统计理论 推导卡方拟合优度检验

    UA MATH566 统计理论 推导卡方拟合优度检验 卡方拟合优度检验主要是检验categorical data的,假设一共有ddd种category,每一种理论比例为pip_ipi​,满足 ∑i=1 ...

  8. UA MATH566 统计理论 概念与定理总结

    UA MATH566 统计理论 概念与定理总结 Part 1 Exponential Family Tip 1: Form of Exponential Family f(x∣η)=h(x)exp⁡( ...

  9. UA MATH566 统计理论 QE练习 位置变换后的指数分布

    UA MATH566 统计理论 QE练习 位置变换后的指数分布 2016年1月第六题 2018年5月第六题 2016年1月第六题 Part a Joint likelihood is L(θ)=exp ...

最新文章

  1. HackerRank:JavaScript 是最知名的编程语言
  2. 李彦宏候选中国工程院院士
  3. linux 之进程间通信-------------InterProcess Communication
  4. java 调用本地接口_JAVA通过本地接口调用C++
  5. oracle执行sql痕迹,Oracle 查询刚执行的SQL
  6. 双系统的电脑中如何完美系统其中一个操作系统
  7. 属格-my father's car和whose_32
  8. Python3爬取豆瓣图书Top250并写入txt文件当中
  9. 招聘:以考试为主,面试为辅
  10. linux mysql 编译后的版本_LINUX下编译安装最新版本mysql_MySQL
  11. iOS测试和Android测试的区别
  12. 一篇文章带你了解jsMind
  13. vue3.2 lottie-web动画+引入json动画
  14. vb wps 链接单元格_wps如何超链接wps表格.doc
  15. 骁龙660鸿蒙系统,骁龙660 AIE是什么意思?高通骁龙660 AIE与660的区别
  16. 漫谈程序员系列 薪资 你是我不能言说的伤
  17. mac charles代理设置
  18. CentOS 7安装Docker
  19. 用Rax开发一个联想搜索输入框,内附封装后的npm组件
  20. 百度地图POI数据获取

热门文章

  1. Python Numpy中返回下标操作函数-节约时间的利器
  2. i2c的时钟延展问题
  3. Acronis Disk Director Suite(windows7分区工具)
  4. 服务器linux系统支持php好,关于Linux服务器系统的七大优势,你知道几个?
  5. Vue指令之v-model和双向数据绑定
  6. PyQt5 图片兼容性问题:libpng warning: bKGD: invalid.,原因及解决办法。
  7. ARM版本的IAR下载和安装
  8. 单片机模块学习之键盘
  9. 3.6 matlab函数文件的定义与调用
  10. wilkinson--生成Wilkinson特征值测试矩阵