1.点估计

什么是点估计
设总体X的分布形式已知，但它的一个或多个参数未知，借助于总体X的一个样本来估计总体未知参数的值的问题称为参数的点估计问题

注意：

点估计的问题就是要构造一个适当的统计量（估计量），用它的观察值作为未知参数的近似值（估计值）
估计量的评选标准

无偏性
若估计量的数学期望存在，并且该期望等于总体参数，则称为无偏估计
无偏估计的实际意义就是："E(估计值) - 真值"的结果为0
不论总体服从什么分布，样本均值是总体均值的无偏估计；样本方差是总体方差的无偏估计

有效性
有两个无偏估计θ₁和θ₂,如果在样本容量n相同的情况下，θ₁比θ₂更密集在真值附近，就认为θ₁比θ₂更理想换言之，无偏估计以方差最小者为好
相合性
随着样本容量的增大，一个估计量的值稳定于待估参数的真值。满足此条件的估计量为相合估计量

2.区间估计

对于未知参数，我们不仅要得到近似值（点估计），还希望估计出一个范围（区间），并希望知道这个范围包含参数真值的可信程度。这种形式的估计称为区间估计，这样的区间称为置信区间
置信区间、置信水平
设(X₁,…,X_n)是取自总体X的一个样本，对于未知参数θ，给定α，0<α<1,如果存在统计量θ₁(X₁,…,X_n)，θ₂(X1,…,Xn)，使得P(θ1(X1,…,Xn)≤θ≤θ2(X1,…,Xn))≥1−α
那么，称[θ₁,θ₂]为θ的双侧1-α置信区间；称1-α为置信水平（也称作置信度或置信系数）。
注意：

对于置信区间和置信水平的理解：

固定样本容量n,若反复抽样多次，每个样本值确定一个区间，每个这样的区间要么包含θ的真值，要么不包含θ的真值
在这么多区间中，包含真值的约占100(1-α)%，不包含真值的占100α%
计算得到的区间属于那些包含真值的区间的可信程度为100(1-α)%，或“该区间包含真值”这一陈述的可信程度为100(1-α)%

3.求置信区间的步骤

较优的点估计应该属于置信区间，这是求置信区间的起始和基本思想

求未知参数的置信区间的步骤：

寻求一个样本X₁,X₂,…X_n和一个统计量W(X₁,X₂,…X_n;θ)，使统计量W的分布不依赖于θ和其他未知参数，统计量W的构造，通常可以从θ的点估计着手
对于给定的置信水平1-α，定出两个常数a和b，使得P(a < W(X₁,X₂,…X_n;θ) < b) = 1-α
求解出θ的不等式θ₁ < θ < θ₂，则(θ₁,θ₂)为θ的一个置信水平为1-α的置信区间

4.正态总体均值的置信区间（方差已知）

已知：总体X服从正态分布，且总体方差已知

求：均值的置信区间

5.正态总体均值的置信区间(方差未知)

已知：总体X服从正态分布，且总体方差未知

求：均值的置信区间

6.正态总体方差的置信区间(总体均值未知)

7.两正态总体均值差的置信区间(两个方差已知)

8.两正态总体均值差的置信区间(方差不等且未知)

9.Python实现均值估计（一个正态总体）

import numpy as np
from scipy.stats import norm, t, chi2 # 正态分布；t分布；卡方分布# 计算一个正态总体均值的置信区间函数（分为是否已知方差两种情况）
def mean_ci_est(data, alpha, sigma=None): # data是原始数据，alpha是置信区间，sigma是方差n = len(data) # 样本容量sample_mean = np.mean(data) # 样本均值# 方差未知if sigma is None:s = np.std(data)se = s/np.sqrt(n)# t.ppf(alpha / 2, n-1) 返回左侧面积alpha/2对应的t值t_value = np.abs(t.ppf(alpha / 2, n-1)) # 根据公式返回置信区间return sample_mean - se * t_value,sample_mean + se * t_value# 方差已知else:se = sigma / np.sqrt(n) # 标准差# norm.ppf(alpha/2)返回左侧面积为alpha/2对应的z值z_value = np.abs(norm.ppf(alpha/2))# 根据公式返回置信区间return sample_mean - se*z_value, sample_mean + se*z_value
salary_18 = [1484, 785, 1598, 1366, 1716, 1020, 1716, 785, 3113, 1601]
salary_35 = [902, 4508, 3809, 3923, 4276, 2065, 1601, 553, 3345, 2182]
# 样本均值是总体均值的无偏点估计，并调用函数计算均值的置信区间
print(np.mean(salary_18),mean_ci_est(salary_18,0.05))
print(np.mean(salary_35),mean_ci_est(salary_35,0.05))

10.Python实现方差估计(一个正态总体)

import numpy as np
from scipy.stats import norm, t, chi2 # 正态分布；t分布；卡方分布# 定义计算方差的置信区间函数
def var_ci_est(data, alpha):n = len(data)# 样本容量s2 = np.var(data) # 样本方差# chi2.ppf(alpha/2,n-1) 返回左侧面积为alpha/2的卡方值chi2_low_value = chi2.ppf(alpha/2,n-1)# chi2.ppf(1-alpha/2,n-1) 返回左侧面积为1-alpha/2的卡方值chi2_upper_value = chi2.ppf(1-alpha/2,n-1)return (n-1) * s2 /chi2_upper_value, (n-1)*s2/chi2_low_value
salary_18 = [1484, 785, 1598, 1366, 1716, 1020, 1716, 785, 3113, 1601]
salary_35 = [902, 4508, 3809, 3923, 4276, 2065, 1601, 553, 3345, 2182]
# 样本方差是总体方差的无偏点估计
print(np.std(salary_18),np.var(salary_18),var_ci_est(salary_18,0.05))
print(np.std(salary_35),np.var(salary_35),var_ci_est(salary_35,0.05))

11.Python实现均值差的估计（两个正态总体）

import numpy as np
from scipy.stats import norm, t, chi2 # 正态分布；t分布；卡方分布# 两个正态总体均值差的置信区间
def mean_diss_ci_t_est(data1, data2, alpha, equal=True):n1 = len(data1) # 样本1的容量n2 = len(data2) # 样本2的容量mean_diff = np.mean(data1)-np.mean(data2) # 两个样本的均值差（两个总体均值差的无偏估计）sample1_var = np.var(data1) # 样本1的方差sample2_var = np.var(data2) # 样本2的方差# 方差未知且相等if equal:sw = np.sqrt(((n1-1)*sample1_var + (n2-1)*sample2_var / (n1+n2-2)))t_value = np.abs(t.ppf(alpha/2, n1+n2-2))return mean_diff - sw*np.sqrt(1/n1+1/n2)*t_value, mean_diff + sw*np.sqrt(1/n1+1/n2)*t_value# 方差未知且不等else:df_numerator = (sample1_var/n1 + sample2_var/n2) **2 # 自由度分子df_denominator = (sample1_var/n1)**2/(n1-1) + (sample2_var/n2)**2 /(n2-1)# 自由度分母df = df_numerator / df_denominator # 自由度t_value = np.abs(t.ppf(alpha/2,df))return mean_diff - np.sqrt(sample1_var/n1 + sample2_var/n2) * t_value, mean_diff + np.sqrt(sample1_var/n1 + sample2_var/n2) * t_valuesalary_18 = [1484, 785, 1598, 1366, 1716, 1020, 1716, 785, 3113, 1601]
salary_35 = [902, 4508, 3809, 3923, 4276, 2065, 1601, 553, 3345, 2182]print(mean_diss_ci_t_est(salary_18, salary_35, 0.05, equal=True))
print(mean_diss_ci_t_est(salary_18, salary_35, 0.05, equal=False))

12.Python实现方差比的估计(两个正态总体)

import numpy as np
from scipy.stats import norm, t, chi2, f # 正态分布；t分布；卡方分布 f分布# 定义一个实现方差比置信区间的函数
def var_ratio_ci_est(data1, data2, alpha):n1 = len(data1)n2 = len(data2)f_low_value = f.ppf(alpha/2, n1-1, n2-1) # 左侧临界值f_upper_value = f.ppf(1-alpha/2, n1-1, n2-1) # 右侧临界值var_ratio = np.var(data1) / np.var(data2)return var_ratio / f_upper_value, var_ratio/f_low_value
salary_18 = [1484, 785, 1598, 1366, 1716, 1020, 1716, 785, 3113, 1601]
salary_35 = [902, 4508, 3809, 3923, 4276, 2065, 1601, 553, 3345, 2182]print(var_ratio_ci_est(salary_18, salary_35, 0.05))

5.参数估计——点估计与区间估计概念，置信区间的公式求法与Python实现求出结果相关推荐

[数理知识]参数估计：点估计、区间估计及置信区间
文章目录 Preliminaries 数学期望.方差与协方差常用概率分布及其期望.方差参数估计问题一.大数定律及中心极限定理 1 切比雪夫不等式(Chebyshev) 2 大数定律(Law of ...
统计学3：中心极限定理、参数估计：点估计和区间估计（置信区间）
1.中心极限定理 (Central Limit Theorem) 1)中心极限定理(就是描述样本均值的分布情况) 随着样本容量(Sample size) n趋于无穷, 样本均值(Sampling Di ...
【统计学】参数估计、点估计、区间估计、置信区间
本文着重讲解概念,公式大家在网上都很容易查到,这里就免了,理解和融会贯通最重要. 1.统计量: 说到统计量说的一定是样本,是由样本构造的一个函数,例如我们常说的样本均值.样本方差等. 2.参数估计: ...
参数估计之点估计和区间估计
作者 | CDA数据分析师参数估计(parameter estimation)是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法.人们常常需要根据手中的数据,分析或推断数据反映的本质规律.即 ...
点估计和区间估计——统计学概念
概念简介: 点估计和区间估计是通过样本统计量估计总体参数的两种方法.点估计是在抽样推断中不考虑抽样误差,直接以抽样指标代替全体指标的一种推断方法.因为个别样本的抽样指标不等于全体指标,所以,用抽样指标 ...
参数估计：点估计和区间估计
参数估计就是根据样本统计量的数值对总体参数进行估计的过程.根据参数估计的性质不同,可以分成两种类型:点估计和区间估计. 点估计点估计就是用样本统计量的某一具体数值直接推断未知的总体参数.例如,在进行 ...
最大值减最小值等于区间长度_数理统计第19讲（区间估计概念，枢轴量法）
第四章.区间估计 4.1区间估计基本概念 4.1.1区间估计参数估计分为点估计和区间估计,第三章中我们已经对众多点估计方法有了比较详细的介绍.而现在我们思考下,用点估计量来估计参数,估计正确的概率是 ...
【统计类知识】区间估计（置信区间）、假设检验（两类错误、P值）
统计推断的三大基本形式: 抽样分布参数估计(点估计.区间估计) 假设检验(参数检验.非参数检验) 一. 置信区间在实际中,我们通常得不到总体在某方面的真值,比如总体均值.或者说,如果我们现在要估计 ...
数据科学 6 参数估计与统计推断（概念）
数据科学 6 参数估计与统计推断 6.1 参数估计 6.1.1 概念 1.总体与样本 2.参数和统计量 3.点估计 4.置信区间 5.均值的标准误差 6.均值的置信区间 7.中心极限定理 6.2 假设 ...

5.参数估计——点估计与区间估计概念，置信区间的公式求法与Python实现求出结果