python样本期望值_总体是指数分布，样本均值倒数的期望和方差如何求?

2020/11/11

为了便于计算，假设

之间相互独立，且

对

成立。令

由于指数分布是特殊的gamma分布，则由gamma分布的可加性知，

。

从而

的概率密度函数为

令

，则易得

的概率密度函数为

也可以通过定义求解

的分布函数，再求导得到其概率密度函数。从而

的期望为：

可以计算

的期望为：

从而，

的方差为：

令

表示样本均值，则样本均值的倒数为

，故样本均值的倒数的期望为

样本均值的倒数的方差为

整体思路就是，根据总体分布求样本和的分布，再求和的倒数的分布，计算出和的倒数的均值和方差，最后求样本均值的倒数的均值和方差。亦可用原概率密度函数直接对均值倒数求期望和方差，如有错误请指正~

期中考以后用蒙特卡洛模拟看看结果对不对

2020/12/3

回来更新啦~

一般情况：设样本的每个个体独立同分布服从于参数为

的指数分布，即

，也可写成

。则

。

令

，根据上述步骤，容易计算得到：

因此样本均值倒数的期望为：

方差为：

根据中心极限定理，通过蒙特卡洛模拟获取的期望和方差的样本数据，其样本均值的概率分布近似为正态分布，并且随着样本量(模拟次数)趋于无穷大，样本均值会收敛于期望值，因此我们可以通过样本均值估计理论值，并进行假设检验，验证理论值是否reasonable。原假设和备择假设分别为：

以及：

这里以

为例，模拟通过Python实现，代码如下：

import numpy as np

import random

from scipy.stats import norm

#生成服从指数分布的 x 总体

np.random.seed(0)

beta = 5

u = np.random.uniform(0, 1, 1000)

population = (-1/beta * np.log(1 - u)).tolist()

#初始化样本容量 n

n = 50

#通过 m 次抽样获得的目标值(样本均值倒数)的波动，用于检验方差

m = 100

#初始化模拟次数 M

M = 1000

#定义用于检验方差的函数，每调用一次这个函数，会返回一个方差估计值(基于 m 次抽取容量为 n 的样本数据)

def var_est(population, m, n):

data = [1/np.mean(random.sample(population, n)) for i in range(m)]

return np.var(data, ddof = 1)

#定义模拟函数，参数 target 用于选择要研究的统计量

def simulation(population, M = 1000, n = 50, target = 'mean'):

if target == 'mean':

theoretical_value = n * beta / (n-1)

data = [1/np.mean(random.sample(population, n)) for i in range(M)]

elif target == 'variance':

theoretical_value = n**2 * beta**2 / (n-1)**2 / (n-2)

data = [var_est(population, m, n) for i in range(M)]

return theoretical_value, data

#模拟两组数据，分别用于检验期望和方差

random.seed(1)

mean_theory, data_mean = simulation(population, M, n, target = 'mean')

variance_theory, data_var = simulation(population, M, n, target = 'variance')

#先看看期望和方差的理论值

mean_theory, variance_theory(5.1020408163265305, 0.5423087602387894)

#再看看样本数据的均值

np.mean(data_mean), np.mean(data_var)(5.080338272542856, 0.5403331158305243)

差异不大。

设定显著性水平为5%，分别计算两个假设检验问题的检验统计量和对应的p值：

test_mean = abs(np.mean(data_mean) - mean_theory) / np.std(data_mean, ddof = 1)

test_var = abs(np.mean(data_var) - variance_theory) / np.std(data_var, ddof = 1)

p_mean = 2 - 2 * norm.cdf(test_mean, loc = 0, scale = 1).round(3)

p_var = 2 - 2 * norm.cdf(test_var, loc = 0, scale = 1).round(3)

#输出 p 值

p_mean, p_var(0.976, 0.982)

两组假设检验的p值均大于0.05，因此没有充分证据表明我们的理论值是错误的~感兴趣的小伙伴可以调整样本容量，模拟次数和

值

python样本期望值_总体是指数分布，样本均值倒数的期望和方差如何求?相关推荐

python样本期望值_用 python 做 z 检验，t 检验
文章目录 1. z 检验 2. t 检验 Python 中的假设检验一般用到 scipy 或 statsmodels 包,需要注意的是,这两个包里面各种检验的置信度都是 0.05. 1. z 检验对 ...
python计算期望值_机器学习：计算方差时为何除以n-1
小弟准备了数据结构.Java.大数据.AI.面试题.python等各种资料需要领取等朋友麻烦转发此文,然后私信[学习]即可获取设样本均值为 ,样本方差为 ,总体均值为 ,总体方差为 ,那 ...
python依照概率抽样_统计概率思维之总体与抽样
统计概率思维--无偏差抽样及总体和样本的估计一.进行无偏差抽样 1.如何进行抽样设计: 注意:抽样空间是样本的基础,但不是样本本身,它列出了总体中的所有独立单位,因为我们不会去抽取抽样空间中的所有对 ...
python 概率分布模型_使用python的概率模型进行公司估值
python 概率分布模型 Note from Towards Data Science's editors: While we allow independent authors to publis ...
python 卡方分布值_重温统计学--抽样分布
小文 | 公众号小文的数据之旅推断统计学的重要作用就是通过从总体中抽取样本构造适当的统计量,由样本性质去推断关于总体的性质.统计量是样本的函数,它不依赖于任何未知参数.常用的统计量包括样本均值.方 ...
python 时间序列预测_使用Python进行动手时间序列预测
python 时间序列预测 Time series analysis is the endeavor of extracting meaningful summary and statistical ...
python定义距离_距离度量以及python实现（一）
1.欧氏距离(Euclidean Distance) 欧氏距离是最易于理解的一种距离计算方法,源自欧氏空间中两点间的距离公式. (1)二维平面上两点a(x1,y1)与b(x2,y2)间的欧氏距离: ( ...
Python 实例教学_ 03_列表
Python 实例教程 Python 实例教学_ 03_列表第十三课 [844. 比较含退格的字符串](https://leetcode.cn/problems/backspace-string-c ...
概论第6章_正态总体的抽样分布_样本均值的期望与样本方差的期望__方差的期望
下面的定理给出样本均值的期望, 方差的期望, 样本方差的期望, 它不依赖于总体的分布形式. 一. 定理: 假设有总体X, 均值 μ\muμ, E(X)=μ\muμ, 有方差 σ2\sigma^2σ ...
【读书笔记-＞统计学】11-02 总体和样本的估计-总体比例、样本比例、根据总体预测样本比例概念简介
总体比例与样本比例假设一个情境:曼帝糖果公司再一次进行了抽样,以便利用调查结果预测:总体中有多大比例的人"可能偏爱曼帝公司的糖球". 结果发现,在40个人中有32个人偏爱他们的口 ...

python样本期望值_总体是指数分布，样本均值倒数的期望和方差如何求?

python样本期望值_总体是指数分布，样本均值倒数的期望和方差如何求?相关推荐

最新文章

热门文章