2020/11/11

为了便于计算,假设

之间相互独立,且

成立。令

由于指数分布是特殊的gamma分布,则由gamma分布的可加性知,

从而

的概率密度函数为

,则易得

的概率密度函数为

也可以通过定义求解

的分布函数,再求导得到其概率密度函数。从而

的期望为:

可以计算

的期望为:

从而,

的方差为:

表示样本均值,则样本均值的倒数为

,故样本均值的倒数的期望为

样本均值的倒数的方差为

整体思路就是,根据总体分布求样本和的分布,再求和的倒数的分布,计算出和的倒数的均值和方差,最后求样本均值的倒数的均值和方差。亦可用原概率密度函数直接对均值倒数求期望和方差,如有错误请指正~

期中考以后用蒙特卡洛模拟看看结果对不对

2020/12/3

回来更新啦~

一般情况:设样本的每个个体独立同分布服从于参数为

的指数分布,即

,也可写成

。则

,根据上述步骤,容易计算得到:

因此样本均值倒数的期望为:

方差为:

根据中心极限定理,通过蒙特卡洛模拟获取的期望和方差的样本数据,其样本均值的概率分布近似为正态分布,并且随着样本量(模拟次数)趋于无穷大,样本均值会收敛于期望值,因此我们可以通过样本均值估计理论值,并进行假设检验,验证理论值是否reasonable。原假设和备择假设分别为:

以及:

这里以

为例,模拟通过Python实现,代码如下:

import numpy as np

import random

from scipy.stats import norm

#生成服从指数分布的 x 总体

np.random.seed(0)

beta = 5

u = np.random.uniform(0, 1, 1000)

population = (-1/beta * np.log(1 - u)).tolist()

#初始化样本容量 n

n = 50

#通过 m 次抽样获得的目标值(样本均值倒数)的波动,用于检验方差

m = 100

#初始化模拟次数 M

M = 1000

#定义用于检验方差的函数,每调用一次这个函数,会返回一个方差估计值(基于 m 次抽取容量为 n 的样本数据)

def var_est(population, m, n):

data = [1/np.mean(random.sample(population, n)) for i in range(m)]

return np.var(data, ddof = 1)

#定义模拟函数,参数 target 用于选择要研究的统计量

def simulation(population, M = 1000, n = 50, target = 'mean'):

if target == 'mean':

theoretical_value = n * beta / (n-1)

data = [1/np.mean(random.sample(population, n)) for i in range(M)]

elif target == 'variance':

theoretical_value = n**2 * beta**2 / (n-1)**2 / (n-2)

data = [var_est(population, m, n) for i in range(M)]

return theoretical_value, data

#模拟两组数据,分别用于检验期望和方差

random.seed(1)

mean_theory, data_mean = simulation(population, M, n, target = 'mean')

variance_theory, data_var = simulation(population, M, n, target = 'variance')

#先看看期望和方差的理论值

mean_theory, variance_theory(5.1020408163265305, 0.5423087602387894)

#再看看样本数据的均值

np.mean(data_mean), np.mean(data_var)(5.080338272542856, 0.5403331158305243)

差异不大。

设定显著性水平为5%,分别计算两个假设检验问题的检验统计量和对应的p值:

test_mean = abs(np.mean(data_mean) - mean_theory) / np.std(data_mean, ddof = 1)

test_var = abs(np.mean(data_var) - variance_theory) / np.std(data_var, ddof = 1)

p_mean = 2 - 2 * norm.cdf(test_mean, loc = 0, scale = 1).round(3)

p_var = 2 - 2 * norm.cdf(test_var, loc = 0, scale = 1).round(3)

#输出 p 值

p_mean, p_var(0.976, 0.982)

两组假设检验的p值均大于0.05,因此没有充分证据表明我们的理论值是错误的~感兴趣的小伙伴可以调整样本容量,模拟次数和

python样本期望值_总体是指数分布,样本均值倒数的期望和方差如何求?相关推荐

  1. python样本期望值_用 python 做 z 检验,t 检验

    文章目录 1. z 检验 2. t 检验 Python 中的假设检验一般用到 scipy 或 statsmodels 包,需要注意的是,这两个包里面各种检验的置信度都是 0.05. 1. z 检验 对 ...

  2. python计算期望值_机器学习:计算方差时为何除以n-1

    小弟准备了数据结构.Java.大数据.AI.面试题.python等各种资料 需要领取等朋友麻烦 转发此文,然后私信[学习]即可获取 设样本均值为 ​,样本方差为 ​,总体均值为 ​,总体方差为 ​,那 ...

  3. python依照概率抽样_统计概率思维之总体与抽样

    统计概率思维--无偏差抽样及总体和样本的估计 一.进行无偏差抽样 1.如何进行抽样设计: 注意:抽样空间是样本的基础,但不是样本本身,它列出了总体中的所有独立单位,因为我们不会去抽取抽样空间中的所有对 ...

  4. python 概率分布模型_使用python的概率模型进行公司估值

    python 概率分布模型 Note from Towards Data Science's editors: While we allow independent authors to publis ...

  5. python 卡方分布值_重温统计学--抽样分布

    小文 | 公众号 小文的数据之旅 推断统计学的重要作用就是通过从总体中抽取样本构造适当的统计量,由样本性质去推断关于总体的性质.统计量是样本的函数,它不依赖于任何未知参数.常用的统计量包括样本均值.方 ...

  6. python 时间序列预测_使用Python进行动手时间序列预测

    python 时间序列预测 Time series analysis is the endeavor of extracting meaningful summary and statistical ...

  7. python定义距离_距离度量以及python实现(一)

    1.欧氏距离(Euclidean Distance) 欧氏距离是最易于理解的一种距离计算方法,源自欧氏空间中两点间的距离公式. (1)二维平面上两点a(x1,y1)与b(x2,y2)间的欧氏距离: ( ...

  8. Python 实例教学_ 03_列表

    Python 实例教程 Python 实例教学_ 03_列表 第十三课 [844. 比较含退格的字符串](https://leetcode.cn/problems/backspace-string-c ...

  9. 概论第6章_正态总体的抽样分布_样本均值的期望与样本方差的期望__方差的期望

    下面的定理给出 样本均值的期望, 方差的期望, 样本方差的期望, 它 不依赖于总体的分布形式. 一. 定理: 假设有总体X, 均值 μ\muμ, E(X)=μ\muμ, 有方差 σ2\sigma^2σ ...

  10. 【读书笔记->统计学】11-02 总体和样本的估计-总体比例、样本比例、根据总体预测样本比例概念简介

    总体比例与样本比例 假设一个情境:曼帝糖果公司再一次进行了抽样,以便利用调查结果预测:总体中有多大比例的人"可能偏爱曼帝公司的糖球". 结果发现,在40个人中有32个人偏爱他们的口 ...

最新文章

  1. aes前台加密后台解密
  2. udacity 项目3人脸检测
  3. comparator
  4. 加拿大高等研究院宣布新的科研计划,Bengio、LeCun 任 AI 项目负责人...
  5. mysql超时失效c3p0_解决c3p0和MySQL集成情况下,连接长时间闲置后重新使用时报错的问题...
  6. mysql求女生人数_在读女硕士110多万!为什么越来越多的女生选择考研?
  7. 计算机英语词汇论文,【计算机英语论文】计算机英语词汇教育思索(共2137字)
  8. 如何創建一個自己的 Composer/Packagist 包 (PHP)
  9. 无线AP和无线路由的Wi-Fi性能哪个更好?
  10. TPC,TPCC,TPMC(计算机性能衡量指标) -----
  11. 【量化分析】债券投资分析
  12. 【es】es界面化管理工具cerebro的安装和使用
  13. poj 2152 Fire - 经典树形dp
  14. android手机赚钱软件排行
  15. 线性变换的矩阵表示式
  16. 【unity】Google 登录和Google支付接入unity
  17. 2019暑假集训总结与记录
  18. 案例 | 深入了解捷尼赛思GV60的数字座舱
  19. 一篇文章把你带入到JavaScript中的闭包与高级函数
  20. Leetcode904

热门文章

  1. php导航自助收录源码,最近网上流行的导航网秒收录网站php源码
  2. SpringCloud蓝绿发布
  3. 家庭财务管理系统的设计与实现(Java毕业设计-Springboot)
  4. 基于 ClickHouse OLAP 的生态:构建基于 ClickHouse 计算存储为核心的“批流一体”数仓体系...
  5. 这7种类型的食物可能引起 “痘痘”
  6. 前端Pako.js 压缩/解压库 与 Java 的 zlib 压缩与解压 的互通实现
  7. 太可怕了!上海交大毕业的网易前员工曝身患重病后,被残酷裁员!
  8. 如何选择一款程序员理想中的显示器
  9. python绘图--由逐日风场数据计算月平均风场数据并绘制二维填色图
  10. Web—信息收集(非常全)