【实操】看了太多公式概念?你该学会怎么用T检验了!
相信看到这篇文章的同学,一定搜了很多次下面的关键词
“T检验”、“Matlab”、“P值”、“T值”
网上公式一大堆,含义也都有解释,看完之后觉得T检验就是为我而生的。但是具体怎么用到自己的数据库中?代码到底怎么写?样本输入格式是啥?P值、T值怎么计算?好像并不是很懂,下面举个栗子,帮助大家实操T检验。
首先T检验是用来判断两个样本的差异性有多显著的。如上图所示,比如我们想告诉小猫怎么区分男生和女生,这里我们就需要用一个确切的特征(指标)来区分男生和女生。
比如说身高高于170的是男生,低于170的是女生。确定之后,小猫只需要问你多高就能判断你是男生还是女生。当然在人人一米八的现在,只用身高难免有点误判,所以我们还可以选取【年龄】【体重】【高数成绩】等参数作为特征来综合判断到底是男生还是女生。
当然,这些特征并不是每个都能很好的区分男生和女生。那么,怎么判断某个特征是否有区分能力,以及区分能力的强弱呢?这里就要有请T检验登场了!
如上图所示,只需要将同一特征下的两类样本数据输入到【T检验函数】中就可以获得结果(P值和T值)。这里用到的函数如下:
[h,p,ci,stats]=ttest2(x, y);
将特征年龄对应的两类样本数据输入到函数中看下结果。
函数输入如下:
这里输出两个参数是我们关心的,即P值和T值。
P_Value = p; % P值
T_Value = stats.tstat; % T值
同理,我们可以对其他三个特征都进行T检验,结果如下:
BCDE分别对应【年龄】【身高】【体重】【高数成绩】,可以看到【年龄】对应的P值最大是0.69,T值最小是0.40。这代表什么意思呢?
P值反映了两类样本差异性的置信度,也就是说我们都多大的把握相信这个特征下两类样本是具有差异性的。
通常P值有三个阈值0.05,0.01和0.001,如果 P值<0.05 ,我们则有95%的把握相信该特征下的两类样本是具有差异性的,若 0.01<P值<0.05 ,我们则有99%的把握,同理可推0.001。
这时,反观我们T检验的结果。如上图,C的P值小于0.001,我们有99.9%的把握相信【身高】是可以区分男女生的;DE的P值小于0.01,我们有99%的把握相信,【体重】【高数成绩】是可以区分男女生的;而B的P值为0.69,可以看到在目前的样本数据中并不能通过【年龄】来区分男女生。
最后,再分析下P值和T值的关系,从上图可以看到,P值是t分布曲线和直线 X=t 在右侧围成的面积。可以看到T值越大则P值越小,样本差异性越明显。
从我们的T检验的结果可以看到【体重】和【高数成绩】的P值相差无几,T值却接近于相反数。这是由于不管T值是正数还是负数,曲线和直线围成的面积都是一样的,如上图。
而且,在Matlab官方函数 ttest2 中,将两个输入样本顺序改变后,T值的正负也会随之改变,如下图。所以,如果要使用T值对两个特征进行比较的话,则需要比较 绝对值 大小。
为了方便大家使用T检验,我对T检验函数进行封装,只需要按照文中EXCEL格式编辑自己的数据库文件,不需要调任何参数,即可实现Matlab全自动导出P值和T值。效果如下图所示:
最后的最后,T检验用来筛选特征,那么筛选好的特征还是需要小猫去进行判断,能否用优选特征训练一个模型,之后模型自动输出分类结果?
【机器学习实操】待更~
猜你喜欢:
【实操】看了太多公式概念?你该学会怎么用T检验了!相关推荐
- GIS基础简介:基本概念、互联网坐标系、WebGIS实操
GIS基础简介:基本概念.互联网坐标系.WebGIS实操 01 | GIS基础知识-GIS概念 1.GIS是什么: 1)随着时代的发展我们几乎每天都能够与GIS接触.比如手机上的百度地图或者高德地图, ...
- 小微数字风控必学-冷启动开发风险评分(含实操)
新产品上线,往往只能使用规则进行审批与授信.能不能拦住风险是一回事,老板报以不信任的目光更使得风控从业人员倍受挫折.我们提供一个迁移学习风险评分开发方案,尝试在冷启动阶段就完成风险评分的开发. 假定某 ...
- 章节十五:项目实操:PK小游戏(3)
章节十五:项目实操:PK小游戏(3) 目录 章节十五:项目实操:PK小游戏(3) 1. 明确项目目标 2. 分析过程,拆解项目 3. 代码实现,逐步执行 3.1 定义Book类 3.2 类BookMa ...
- 从企业实操的角度谈深度学习(图像方向)的底层逻辑之概念普及
假作真时真亦假,无为有处有还无. 生意路,人生路 科技的本质本应该是这五个字:求实和求是 我时常在想,做人工智能的科技公司门槛到底有多低.理论界不能实操,实操界没有理论.茫茫多的论文,茫茫多的概念被各 ...
- 【Kubernetes】k8s的svc所有概念和实操详细说明(含镜像和代码)【2】【svc作用是端口转发相关】【含LB和ingress【反向代理】-部署使用】
文章目录 service[svc]所有概念 环境准备 端口映射常规测试 创建pod 主机端口映射测试 修改pod副本数并测试 svc[service] 关于Service 定义Service的意义 没 ...
- cam350怎么看顶层_厉害的人是怎么分析问题的?(实操干货)
"经常做一个方案,几十页PPT还没把问题讲清楚,老板一个问题就貌似发现了关键,这到底是一种怎么样的思维方式?" 我在职场这么多年,也遇到过很多次这样的问题. 在我初入职场时,经领导 ...
- [转载]你们要的GIF动图制作全攻略!看完就会做!(实操教程)
非常实用呀 原文地址:你们要的GIF动图制作全攻略!看完就会做!(实操教程)作者:木木老贼 来源:文案匠(ID:sun-work) 作者:一木(授权转载,如需转载请联系文案匠) 文章配图的GIF动图怎 ...
- 华为昇腾师资培训沙龙·南京场 |华为昇腾 ACL 语言开发实践全程干货来了!看完就实操系列...
自今年疫情以来,AI 技术加速进入了人们的视线,在抗疫过程中发挥了重要作用,产业发展明显提速,我国逐步走出了一条由需求导向引领商业模式创新.市场应用倒逼基础理论和关键技术创新的发展道路,AI 人才的争 ...
- 不同网段的局域网怎么互通_华为实操系列 | 交换机在局域网中是怎么应用的,看完你肯定懂了!...
编辑 | 排版 | 制图 | 测试 | ©瑞哥 此文用时0小时48分钟,原创不易,坚持更不易,希望我的每一份劳动成果都可以得到大家的一个[在看] 交换机在局域网中的应用 交换机在局域网中的应用分为两种 ...
最新文章
- 部署可扩展的目标检测管道:推理过程(上)
- linux下出现ping:unknown host www.baidu.com问题时的解决办法——ubuntu下局域网络的配置...
- 第二节 RabbitMQ配置
- eclipse安装hadoop插件及配置
- 牛客题霸 [顺时针旋转矩阵] C++题解/答案
- PHP商城数据库安全事务处理方法
- 参加2013中国大数据技术大会(BDTC2013)
- python循环结构高一信息技术有限公司_Python之循环结构
- xlua build时 报错处理
- 小强的HTML5移动开发之路(14)——Video标签详解
- python 爬虫 爬取糗事百科段子
- 采用WPF开发第二版OFD阅读器,持续完善中,敬请期待
- 倍福--实现和西门子的profinet
- 小白学测试入门之测试分析方法
- uniapp,小程序返回到指定页面以及到指定页面左上角的房型默认返回首页
- Android 5.0、6.0、7.0、8.0、9.0 新特性,DownloadManager踩坑记
- 怎样用手机照出证件照
- torch_points_kernels遭遇 ModuleNotFoundError: No module named ‘torch_points_kernels.points_cpu‘
- c语言将浮点变成字符串,c语言将浮点型数据转换成字符串
- 高精度计算Π的值(C语言)
热门文章
- Web前端必备-Nginx知识汇总
- 8月3日云栖精选夜读 | 阿里巴巴宣布 Sentinel 开源,进一步完善 Dubbo 生态(附PPT和视频)...
- Be Close To The Real World
- 利用python自带的包可以建立简单的web服务器
- linux下如何查看chm文件
- asp.net MVC的EF与easyui DataGrid数据绑定
- 查看windows下系统信息
- 让Visual Studio 2005 Team Foundation Server支持Wss3
- Windows Forms DataGridView 中合并单元格
- hdu 1281(二分图匹配+增广路)