原文链接:http://tecdat.cn/?p=23099

原文出处:拓端数据部落公众号

在本文关于如何在R中进行贝叶斯分析。我们介绍贝叶斯分析,这个例子是关于职业足球比赛的进球数。

模型

首先,我们认为职业足球比赛的进球数来自分布,其中θ是平均进球数。现在假设我们用一位足球专家的意见来得出足球比赛的平均进球数,即参数θ,我们得到:

curve(dnorm(x, 2.5, 0.2), from = -2, to = 8,...)

我们想知道什么?

在这种情况下,我们想知道θ的后验分布是什么样子的,这个分布的平均值是什么。为了做到这一点,我们将在三种情况下分析:

我们有1个观察值x=1,来自分布为的总体。
我们有3个观测值x=c(1,3,5),来自一个具有分布的总体。
我们有10个观测值x=c(5,4,3,4,3,2,7,2,4,5),来自一个具有分布的总体。

理论方法

在这里,我想告诉你贝叶斯分析是如何分析的。首先,我们有一个来自具有未知参数θ的泊松分布的人口的似然函数。

我们知道参数θ的先验分布p(θ)是由以下公式给出的。

最后,θ的后验分布为。

其中常数C的计算方法如下。

而后验分布E(θ|x)的平均值由以下公式给出。

计算方法

在这里,你将学习如何在R中使用蒙特卡洛模拟来回答上面提出的问题。对于这三种情况,你将遵循以下步骤。

1. 定义数据

首先,你需要根据方案定义数据。

x <- 1 #第一种情况

2. 计算常数C

现在使用蒙特卡洛模拟来计算积分。为此,有必要从先验分布中产生N=10000个值θi,并在似然函数中评估它们。最后,为了得到C,这些值被平均化。R中的代码如下。

N <- 100000  # 模拟值的数量
rnorm(n=N, mean = 2.5, sd = 0.2) #先验分布
prod(dpois(x=x, lambda = theta)) #似然函数

3. 寻找后验分布

计算完C后,你可以得到后验分布,如下所示。

fvero(theta) * dnorm(x=theta) / C

4. 计算后验分布的平均数

最后你可以使用蒙特卡洛模拟计算积分来获得后验分布的平均值。

integral <- mean(aux)
posterior <- integral/C

结果

如前所述,上面介绍的代码用于所有三种情况,唯一根据情况变化的是x。在这一节中,我们将为每种情况展示一张图,其中包含θ的先验和后验分布、后验分布的平均值(蓝色虚线)和观测值(粉红色的点)。

第一种情况

curve(dnorm(x, 2.5, 0.2), col=4,,x=x, y=rep(0, length(x)),
line,v = mposterior,legend=c("topright", legend=c("后验", "先验"),)

第二种情况

第三种情况

结论

从结果中我们可以得出这样的结论:当我们有很少的观测数据时,如图1和图2,由于缺乏样本证据,后验分布将倾向于类似于先验分布。相反,当我们有大量的观测数据时,如图3,后验分布将偏离先验分布,因为数据将有更大的影响。

我希望你喜欢这篇文章并了解贝叶斯统计。我鼓励你用其他分布运行这个程序。


最受欢迎的见解

1.R语言多元Logistic逻辑回归 应用案例

2.面板平滑转移回归(PSTR)分析案例实现

3.matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR)

4.R语言泊松Poisson回归模型分析案例

5.R语言回归中的Hosmer-Lemeshow拟合优度检验

6.r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现

7.在R语言中实现Logistic逻辑回归

8.python用线性回归预测股票价格

9.R语言如何在生存分析与Cox回归中计算IDI,NRI指标

拓端tecdat|R语言贝叶斯Poisson泊松-正态分布模型分析职业足球比赛进球数相关推荐

  1. 拓端tecdat|R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险

    最近我们被客户要求撰写关于冠心病风险的研究报告,包括一些图形和统计输出. 相关视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠 ...

  2. 拓端tecdat|R语言用LOESS(局部加权回归)季节趋势分解(STL)进行时间序列异常检测

    最近我们被客户要求撰写关于LOESS(局部加权回归)的研究报告,包括一些图形和统计输出. 这篇文章描述了一种对涉及季节性和趋势成分的时间序列的中点进行建模的方法.我们将对一种叫做STL的算法进行研究, ...

  3. 拓端tecdat|R语言向量误差修正模型 (VECMs)分析长期利率和通胀率影响关系

    最近我们被客户要求撰写关于向量误差修正模型的研究报告,包括一些图形和统计输出. 向量自回归模型估计的先决条件之一是被分析的时间序列是平稳的.但是,经济理论认为,经济变量之间在水平上存在着均衡关系,可以 ...

  4. 拓端tecdat|R语言线性回归和时间序列分析北京房价影响因素可视化案例

    最近我们被客户要求撰写关于北京房价影响因素的研究报告,包括一些图形和统计输出. 目的 房价有关的数据可能反映了中国近年来的变化: 人们得到更多的资源(薪水),期望有更好的房子 人口众多 独生子女政策: ...

  5. R语言贝叶斯广义线性混合(多层次/水平/嵌套)模型GLMM、逻辑回归分析教育留级影响因素数据...

    全文下载链接:http://tecdat.cn/?p=24203 本教程使用R介绍了具有非信息先验的贝叶斯 GLM(广义线性模型) (点击文末"阅读原文"获取完整代码数据). 当前 ...

  6. R语言贝叶斯参数估计、回归与计算

    贝叶斯统计学是一门基本思想与传统基于频率思想的统计学完全不同的统计学方法:它以其灵活性和先进性在现代的统计学中占据着重要的地位.贝叶斯统计学是开展科学研究不可缺少的重要手段,但是,因为其思想.技术和方 ...

  7. R语言︱贝叶斯网络语言实现及与朴素贝叶斯区别(笔记)

    每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 一.贝叶斯网络与朴素贝叶斯的区别 朴素贝叶斯的 ...

  8. 使用R语言进行Metroplis-in-Gibbs采样和MCMC运行分析

    全文链接:http://tecdat.cn/?p=12200 对于许多模型,例如逻辑模型,没有共轭先验分布.因此,吉布斯采样不适用(点击文末"阅读原文"获取完整代码数据). 这篇文 ...

  9. python用pystan贝叶斯IRT模型拟合Rasch模型分析学生考试问题数据

    最近我们被客户要求撰写关于Rasch模型的研究报告,包括一些图形和统计输出. 由于某大学学生人数过多,助教不足,因此有必要对期中考试给每个学生的题目数量施加五道题的限制.所有必须使用的问题必须来自大约 ...

  10. matlab reff,R语言逻辑回归和泊松回归模型对发生交通事故概率建模

    我们已经看到了如何考虑风险敞口,计算包含风险敞口的多个数量(经验均值和经验方差)的非参数估计量.让我们看看如果要对二项式变量建模. 这里的模型如下: 未观察到 该期间的索赔数量  索偿的数量  考虑一 ...

最新文章

  1. DFS+剪枝 hdu 5113 Black And White
  2. 5GS 协议栈 — PFCP 协议 — QER QoS 实施规则
  3. Python 3 开发钉钉群机器人
  4. Cloud in Action: Install OpenStack Ocata from scratch
  5. Java NIO_I/O基本概念_Java中的缓冲区(Buffer)_通道(Channel)_网络I/O
  6. php5.4源码下载,WordPress v5.4.2官方正式版源码下载
  7. 了解及优化常见的Linux系统服务
  8. 基于51单片机的函数信号发生器
  9. (HDU)1157 -- Who's in the Middle(哪个居中)
  10. ios开发之手势处理 之手势识别一
  11. 数学图形(1.34) peut aussi曲线
  12. [转载] 【Python-Numpy】numpy.random.randint用法
  13. 机器学习与深度学习基本概念 学习笔记
  14. html5普通文本框代码,html 文本框代码
  15. Oliver的救援【BFS】
  16. windows server 2003的一些设置
  17. 【企业邮箱注册】管理员如何设置定期修改密码?
  18. MFC应用程序“生死因果”内幕
  19. 【前端网页特效】纯css3+html实现鼠标悬浮滑动效果
  20. Java实现-数字组合1

热门文章

  1. Visual Studio常用的快捷键
  2. 001-android eclipse 自动生成的程序
  3. DotNET的GNU版开源实现DotGNU
  4. 9 内存模型和名称空间
  5. Oracle的共享关闭 独有关闭和共享更新关闭 (2)
  6. 一句话木马:ASPX篇
  7. 高通又失一员大将,英特尔成功挖角高通CFO
  8. Linux服务器更换主板后,网卡识别失败的处理方法
  9. linux服务器的性能分析与优化(十三)
  10. treeview 如何从多个数据表中获取数据动态生成 [提问]