UA MATH566 例题 Poisson回归、Overdispersion

Poisson regression is widely used in modelling count data. Model assumption is Yi∼iidPois(βxi),i=1,⋯,nY_i \sim_{iid} Pois(\beta x_i),i=1,\cdots,nYi​∼iid​Pois(βxi​),i=1,⋯,n, β∈R1\beta \in \mathbb{R}^1β∈R1.

Part (a) Find MLE of β\betaβ. Denote as β^\hat\betaβ^​
Part (b) A drawback of Poisson regression is that mean and variance of reponse are assumed to be equal. If variance of response is greater than mean of reponse, we say the count data is overdispersion. Cameron and Trivedi (1990) developed regression-based method to test overdispersion. Mean response of Poisson regression is E[Yi∣xi]=βxiE[Y_i|x_i] = \beta x_iE[Yi​∣xi​]=βxi​, and let μi\mu_iμi​ denote βxi\beta x_iβxi​. Hypothesis for overdispersion test is
H0:Var[Yi∣xi]=μiHa:Var[Yi∣xi]>μiH_0:Var[Y_i|x_i] = \mu_i \\ H_a:Var[Y_i|x_i]>\mu_iH0​:Var[Yi​∣xi​]=μi​Ha​:Var[Yi​∣xi​]>μi​

Assume Var[Yi∣xi]=μi+αμiVar[Y_i|x_i] = \mu_i + \alpha \mu_iVar[Yi​∣xi​]=μi​+αμi​, α>0\alpha>0α>0 indicating overdispersion,
Var[Yi∣xi]=μi+αμi⇒E[(Yi−μi)2−Yi]=αμiVar[Y_i|x_i] = \mu_i + \alpha \mu_i \Rightarrow E[(Y_i-\mu_i)^2-Y_i] = \alpha \mu_iVar[Yi​∣xi​]=μi​+αμi​⇒E[(Yi​−μi​)2−Yi​]=αμi​

Suppose the data generating process is
(Yi−μi)2−Yi=αμi+ϵi(Y_i-\mu_i)^2 - Y_i = \alpha \mu_i + \epsilon_i(Yi​−μi​)2−Yi​=αμi​+ϵi​

Use weighted least square to estimate α\alphaα, assuming weights are wi=1/xi,i=1,⋯,nw_i=1/x_i,i=1,\cdots,nwi​=1/xi​,i=1,⋯,n.

Answer.
Part (a)
Joint likelihood of model Yi∼iidPois(βxi),i=1,⋯,nY_i \sim_{iid} Pois(\beta x_i),i=1,\cdots,nYi​∼iid​Pois(βxi​),i=1,⋯,n:
L(β)=∏i=1n(βxi)Yie−βxiYi!=β∑i=1nYie−β∑i=1nxi∏i=1nxiYiYi!ln⁡L(β)=nYˉln⁡β−βnxˉ−ln⁡∏i=1nxiYiYi!∂ln⁡L(β)∂β=nYˉβ−nxˉ=0⇒β^=YˉxˉL(\beta) = \prod_{i=1}^n \frac{(\beta x_i)^{Y_i}e^{-\beta x_i}}{Y_i!} = \beta^{\sum_{i=1}^n Y_i}e^{-\beta \sum_{i=1}^n x_i} \prod_{i=1}^n \frac{x_i^{Y_i}}{Y_i!} \\ \ln L(\beta) = n\bar{Y}\ln \beta - \beta n\bar{x} - \ln \prod_{i=1}^n \frac{x_i^{Y_i}}{Y_i!} \\ \frac{\partial \ln L(\beta)}{\partial \beta} = \frac{n\bar{Y}}{\beta} - n\bar{x} = 0 \Rightarrow \hat\beta = \frac{\bar{Y}}{\bar{x}}L(β)=i=1∏n​Yi​!(βxi​)Yi​e−βxi​​=β∑i=1n​Yi​e−β∑i=1n​xi​i=1∏n​Yi​!xiYi​​​lnL(β)=nYˉlnβ−βnxˉ−lni=1∏n​Yi​!xiYi​​​∂β∂lnL(β)​=βnYˉ​−nxˉ=0⇒β^​=xˉYˉ​

Part (b)
Residual is
ϵi=(Yi−μi)2−Yi−αμi\epsilon_i = (Y_i-\mu_i)^2 - Y_i - \alpha \mu_iϵi​=(Yi​−μi​)2−Yi​−αμi​

Replace μi\mu_iμi​ with fitted value from Poisson regression,
μ^i=EYi=β^xi=Yˉxixˉ\hat\mu_i = EY_i = \hat \beta x_i = \frac{\bar{Y} x_i}{\bar{x}}μ^​i​=EYi​=β^​xi​=xˉYˉxi​​

So weighted residual square is
wiϵi2=wi((Yi−Yˉxixˉ)2−Yi−αYˉxixˉ)2w_i\epsilon_i^2 = w_i \left( (Y_i-\frac{\bar{Y} x_i}{\bar{x}})^2 - Y_i - \alpha \frac{\bar{Y} x_i}{\bar{x}} \right)^2wi​ϵi2​=wi​((Yi​−xˉYˉxi​​)2−Yi​−αxˉYˉxi​​)2

Optimization for WLS is
min⁡αQ=∑i=1nwi((Yi−Yˉxixˉ)2−Yi−αYˉxixˉ)2\min_{\alpha} Q = \sum_{i=1}^n w_i \left( (Y_i-\frac{\bar{Y} x_i}{\bar{x}})^2 - Y_i - \alpha \frac{\bar{Y} x_i}{\bar{x}} \right)^2αmin​Q=i=1∑n​wi​((Yi​−xˉYˉxi​​)2−Yi​−αxˉYˉxi​​)2

Calculate
∂Q∂α=−2∑i=1nwiYˉxixˉ((Yi−Yˉxixˉ)2−Yi−αYˉxixˉ)=0⇒α^=∑i=1nwixi[(Yi−Yˉxixˉ)2−Yi]Yˉxˉ∑i=1nwixi2=∑i=1n(Yi−Yˉxixˉ)2−nYˉnYˉ\frac{\partial Q}{\partial \alpha} =-2\sum_{i=1}^n w_i \frac{\bar{Y} x_i}{\bar{x}} \left( (Y_i-\frac{\bar{Y} x_i}{\bar{x}})^2 - Y_i - \alpha \frac{\bar{Y} x_i}{\bar{x}} \right) = 0 \\ \Rightarrow \hat{\alpha} = \frac{\sum_{i=1}^n w_ix_i[(Y_i-\frac{\bar{Y} x_i}{\bar{x}})^2 - Y_i]}{\frac{\bar{Y}}{\bar{x}}\sum_{i=1}^n w_i x_i^2} = \frac{\sum_{i=1}^n (Y_i-\frac{\bar{Y} x_i}{\bar{x}})^2 - n\bar{Y}}{n\bar{Y}}∂α∂Q​=−2i=1∑n​wi​xˉYˉxi​​((Yi​−xˉYˉxi​​)2−Yi​−αxˉYˉxi​​)=0⇒α^=xˉYˉ​∑i=1n​wi​xi2​∑i=1n​wi​xi​[(Yi​−xˉYˉxi​​)2−Yi​]​=nYˉ∑i=1n​(Yi​−xˉYˉxi​​)2−nYˉ​

UA MATH566 例题 Poisson回归、Overdispersion与负二项回归相关推荐

  1. 零膨胀负二项回归模型的使用 R语言

    简介 近期,需要使用零膨胀负二项回归模型.因此,找到R语言中的一个包:pscl. 首先,使用Rstudio下载此包. install.packages("pscl") 该软件发表于 ...

  2. 计数数据分析模型:零膨胀负二项(ZINB)回归模型

    1.计数统计模型 4.4 计数数据模型 - 百度文库https://wenku.baidu.com/view/2b488e62561252d380eb6eac.html2.python中df.desc ...

  3. 回归分析(三)二项逻辑斯蒂回归模型

    回归分析(三)二项逻辑斯蒂回归   学了一段时间突然又遇到逻辑斯蒂回归,结果发现已经忘完了,所以今天重新梳理一下. (1)逻辑斯蒂分布   先看一下逻辑斯蒂分布函数F(x)F(x)F(x),其概率密度 ...

  4. 【Clemetine】基于二项Logistic回归的电信客户流失预测

    一.实验目的及要求 1.掌握Logistic回归分析的基本步骤.原理.软件实现.结果分析: 2.理解多重共线性的概念.原理及岭轨迹的软件实现: 3.了解高维数据分析的应用领域及分析方法. 二.实验仪器 ...

  5. UA MATH566 统计理论 一个例题 Hierarchical Model的统计性质

    UA MATH566 统计理论 一个例题 Hierarchical Model的统计性质 Y∣X∼Pois(X)Y|X \sim Pois(X)Y∣X∼Pois(X) and X∼Γ(α,β)X \s ...

  6. UA MATH566 统计理论1 充分统计量例题答案3

    UA MATH566 统计理论1 充分统计量例题答案3 例1.18 X1,⋯,Xn∼iidN(μ,σ2)X_1,\cdots,X_n \sim_{iid} N(\mu,\sigma^2)X1​,⋯,X ...

  7. UA MATH566 统计理论1 充分统计量例题答案2

    UA MATH566 统计理论1 充分统计量例题答案2 例1.12 找N(θ,1)N(\theta,1)N(θ,1)的最小充分统计量 计算样本的联合密度 f(x∣θ)=∏i=1n12πexp⁡(−(x ...

  8. UA MATH566 统计理论1 充分统计量例题答案1

    UA MATH566 统计理论1 充分统计量例题答案1 例1-3是直接法判断是否是充分统计量. 例1.1 X1,⋯,Xn∼iidBer(θ)X_1,\cdots,X_n \sim_{iid} Ber( ...

  9. UA MATH566 统计理论 Bayes统计基础

    UA MATH566 统计理论 Bayes统计基础 共轭分布 基于后验概率预测新的观测值 Bayes统计思想的基础是Bayes公式 P(Ci∣A)=P(A,Ci)P(A)=P(A∣Ci)P(Ci)∑i ...

最新文章

  1. 【从零开始的ROS四轴机械臂控制】(五)- 构建运动控制服务
  2. MobileNet 笔记
  3. workunit 的指的工作单元是什么_分频器是做什么用的?
  4. python 项目实战视频_腾讯视频 Python 爬虫项目实战
  5. ArrayList理解(1)初始化
  6. 今日上新:两个图像领域的现金奖励实时竞赛
  7. 华为私有云的搭建方案_华为云搭建word press
  8. 汽车租赁php参考文献,国内外汽车租赁文献综述
  9. Redis笔记5-redis高可用方案
  10. Ubuntu14.04开启wifi热点(亲测有效)
  11. php7 imagick扩展,php7如何安装imagick扩展
  12. bigdecimal计算开n次方_随笔:HashMap中容量为什么是2的次方数?
  13. 平均绝对误差python_机器学习回归模型的常用评价指标(8):均方误差MSE、平均绝对误差MAE、平均绝对比例误差MAPE、相关系数R2,方差,相关性...
  14. sql-server(模式创建)
  15. 内蒙古等保测评机构项目测评收费价格标准参考
  16. android camera慢动作,慢动作相机app下载-慢动作相机软件 安卓版v1.1-PC6安卓网
  17. 【实战】疾病-基因与图神经网络和图自动编码器的相互作用
  18. WEB前端关于SPA、MPA的区别
  19. 谷粒商城三阶段课件_谷粒商城分布式基础篇一
  20. “/”应用程序中的服务器错误的解决办法

热门文章

  1. Leetcode 179. 最大数 解题思路及C++实现
  2. GNU Radio ieee802-15-4、ZigBee 实现
  3. 如何复制一个含有随机指针节点的链表
  4. 1.9 函数-C++编程模块
  5. qlineedit文本改变时_行文本编辑框QLineEdit及自动补全
  6. Matlab读取文本数据
  7. Python 技术篇 - 通过paramiko库判断连接linux服务器的账号密码是否正确方法演示
  8. Python 缩进问题-inconsistent use of tabs and spaces in indentation.原因及解决方法
  9. MarkDown常用技巧总结
  10. C++中的c_str()函数用法