独立样本与配对样本的区分:

独立样本:指的是两组样本的数据来源互不干扰,例如两组不同的人或者两组不同的实验数据。

配对样本:指的是两组样本的数据是成对出现的,例如同一组人在不同时期或在不同条件下的实验数据。

选择检验方式的区别:

独立样本:大样本用z检验,小样本用t检验;

配对样本:都用t检验。

在计算p值的时候的区别:

独立样本t检验:关注重点是两组数据均值的差;

配对样本t检验:先求数据的差值再进行单样本t检验。

举个例子:

独立样本的均值差的检验案例:为了检验男生和女生的数学成绩有没有差异,某学习随机抽了20名学生。由于样本量小于30,属于小样本的假设检验,而男女两组样本数据属于 独立样本,因此小样本的独立样本的均值差检验应该 选择t检验。

处理样本数据:

# 导入数据
students_data = {
'name':['A','B','C','D','E','F','G','H','I','J','K','L','M','N','O','P','Q','R','S','T'],
'gender':['male','male','female','male','female','male','male','female','female','female','male','female','male','male','female','male','female','male','female','male'],
'grades':[76,82,86,82,35,77,76,91,76,91,96,88,96,78,86,78,67,91,76,89]}
# 转换格式
students_test_data = pd.DataFrame(students_data,columns=['name','gender','grades'])
# 筛选两组样本的值
male = students_test_data.query('gender == "male"')["grades"]
female = students_test_data.query('gender == "female"')["grades"]
# 转化为数组型
male = np.array(male)
female = np.array(female)
print(male)
print(female)

代码详解:

导入数据采用的是字典,{}表示的是字典格式。以键值对的形式呈现,键和值中间用冒号分隔:{"name": "Tom", "age": 18}。

DataFrame()可以把数据转为DataFrame 格式,columns参数则指定了数据框中每列的名称。

query()表示从DataFrame中选择符合特定条件的行,括号里的'gender == "male"'表示筛选gender的值为male的行。query()[]表示筛选行和列,筛选gender的值为male的行对应的grades列。

计算t值和p值:

stats.ttest_ind(male, female, equal_var = False)

计算出的p值0.34远大于0.05,说明两组样本并没有差异。结果是男女成绩并没有差异。

Python统计学:独立样本t检验~均值差的检验相关推荐

  1. 【Python】单样本、独立样本、配对样本的t检验

    t检验通常分为三种,分别是单样本t检验.两独立样本t检验和配对样本t检验. python中经常使用scipy模块中的t检验相关函数进行t检验. 单样本t检验使用ttest_1samp()函数. 独立样 ...

  2. 统计学的那些冷门思考(各种检验+中心极限)

    为了准备拼多多的数分岗,专门问了前讯飞同事关于统计数学中的一些冷门知识. 确实我当初和她讨论过,不过当时就忘了.今天专门写个博客以此纪念下来,人家可是老美数学出身,感觉学东西比我灵活,不那么死.今天把 ...

  3. 线性回归—投资额(python、OLS最小二乘、残差图、DW检验)

    线性回归-投资额(python.OLS最小二乘.残差图.DW检验) 一.问题描述:     建立投资额模型,研究某地区实际投资额与国民生产值(GNP)及物价指数(PI)的关系,根据对未来GNP及PI的 ...

  4. python实现D‘Agostino‘s K-squared test正态分布检验

    python实现D'Agostino's K-squared test正态分布检验 测试数据样本是否具有高斯分布. 假设条件 每个样本中的观察结果都是独立且均等分布的(iid). 解释 H0:样本具有 ...

  5. R语言使用t.test函数进行t检验、使用配对的t检验(paired)检验组间不独立数据的差异是否有统计学意义

    R语言使用t.test函数进行t检验.使用配对的t检验(paired)检验组间不独立数据的差异是否有统计学意义 目录 R语言使用t.test函数进行t检验.使用配对的t检验(paired)检验组间不独 ...

  6. python 白噪声检验-时间序列 平稳性检验 白噪声 峰度 偏度

    时间序列 简而言之,时间序列就是带时间戳的数值序列.股票,期货等金融数据就是典型的时间序列.量化的过程,很多时间都是在分析时间序列,找到稳定赚钱因子. 平稳性定义 所谓时间序列的平稳性,是指时间序列的 ...

  7. 关于两个正态总体均值差μ1-μ2的置信区间

    关于两个正态总体均值差μ1-μ2的置信区间 六.(本题 13 分)为了提高某一化学生产过程的得率,试图采用一种新的催化剂&

  8. 股票预测(数据为招商银行在A股的数据,模型为MSCNN_Bilstm_Attention,python,代码和数据均在压缩包里,可以直接运行,并使用MAE/MSE/MAPE/涨跌准确率作为指标)

    1.数据介绍(考虑开盘价格,最高价格.最低价格,收盘价格等因素,预测未来的每天收盘价格): 2. 模型(MSCNN_Bilstm_Attention模型) 3.测试集的预测值和真实值 指标: 4.与另 ...

  9. t检验(独立样本t检验 配对样本t检验 非参检验 多余两组的比较 方差分析 非参检验)

    文章目录 独立样本t检验 配对样本t检验 非参检验 多余两组的比较 方差分析 非参检验 独立样本t检验 library(MASS)t.test(Prob~So, data = UScrime,var. ...

最新文章

  1. c++连连看游戏_用Python玩连连看是什么效果?
  2. 自学python的书籍逐级推荐-近300本Python书籍到底哪家强,用Python告诉你
  3. apachectl startssl启动apache自动运行输入密码
  4. 亲历dataguard的一些经验问答题
  5. 微型计算机原理应用总结,微机原理总结
  6. 目录创建 android,创建目录浏览器  |  Android 开发者  |  Android Developers
  7. matlab cameraman,cameraman.tif 原图
  8. android高度混淆,android – TextView与ImageSpan混淆行高
  9. 吃西瓜 最大子矩阵 三维的。 rqnoj93
  10. 你还不了解Redis的发布/订阅功能与Redis的Stream吗
  11. linux鼠标滚轮不能上下滚动页面,解决办法:如果鼠标滚轮无法上下滚动怎么办...
  12. 【java笔记】Properties类
  13. Android编译过程详解(三)
  14. sql 查询所有子节点示例
  15. Logback文件详解
  16. 产品申请UL标志包括以下几个步骤
  17. 中国信息消费产业前景动态及未来发展趋势预测报告(2022-2027年)
  18. mysql | left join 出现的结果会重复的问题
  19. 1、Mac如何剪切文件
  20. linux 播放.ev4播放器,ev4文件怎么播放

热门文章

  1. java编程APP_用java编程的软件叫什么?
  2. 小心!如果遇到这些情况,你的流量可能被“劫持”了!
  3. 上市公司内控信息披露指数(2000-2018年)
  4. c++主线程和子线程
  5. 《阿凡达2》上映在即,3D渲染如何突破想象?
  6. Glove论文详解及代码分析
  7. lingo子模型——数学模型4.7 例1 广告投入
  8. h5实现上下滑动切页
  9. 几倍根号用学生计算机,几倍根号几怎么算不要网上抄的 祥细的 例如2√2 3√3 4√4 怎么算...
  10. 热电偶补偿导线的原理及必要性