定义:

重测信度(test-retest reliability),又称再测信度、稳定性系数(coefficient of stability),反映测验跨越时间的稳定性和一致性,即应用同一测验方法,对同一组被试者先后两次进行测查,然后计算两次测查所得分数的关系系数。该信度能表示两次测试结果有无变动,反映了测验分数的稳定程度。相关程度高,表示前后测量一致性高,稳定性好。重测的过程考虑了不同的条件(环境的、人的)带来的测量结果的误差,这种误差与两次施测的情境相关联。

简而言之,把同一被试者、同一个测验在不同的时间测量两次所得结果的相关系数称为重测信度。 重测信度侧重评估时间差异所造成的误差及其对测验稳定性的影响,评价重测信度时应注意重测间隔时间长短对重测相关系数的影响。

计算结果的代表含义

①如果相关值为1,则该测验具有完美无瑕的信度,表明被试在两次测验上得到了完全一致的分数,但这种情况在心理学和教育学的研究中基本不会出现。②如果两次测验的相关系数为0,则该测验完全不可靠,表明被试在第二次测验时得到了与第一次完全不一致的分数。在此种情况下,这些分数毫无意义。③如果两次测验之间的相关值为负值,则表明被试在第一次测验中取得的分数越高,在第二次测验中所取得的分数越低;反之亦然。即便出现这种意外情况,测验的信度也同样被认定为0。

时间间隔的影响

重测的过程考虑了不同的条件(环境的,人的)带来的测量结果的误差,这种误差与两次施测的情境相关联。因为在前后两种情境中施测的是同一个测验,所以重测系数不能反映测验题目样本不同所带来的误差。此外,两次施测的条件也和时间间隔有关,时间间隔越长,误差变异越大。因此,当第一次施测和第二次施测的时间间隔相对较短时(几天或几周),重测的稳定性系数会较大;反之,当第一次施测和第二次施测的时间间隔较长时(几个月或几年),该系数就会偏小。

优劣势

优点
用再测法估计信度能提供有关测验结果是否随时间而改变的资料,可作为预测受测者将来行为表现的依据。
局限
再测信度易受练习和记忆的影响,前后两次施测间隔的长短务必适宜。如果相隔时间太短,则记忆犹新,练习的影响较大;如果相隔时间太长,则身心的发展与学习经验的累积等均足以改变测验分数而使相关降低。
另外,第一次测试所发现的错误也可能导致第二次反应的变化而增加误差变异。
同时,再测信度只适用于测量那些不会随时间的变化而改变的特质。

重测信度评价方法

  • Bland-Altman分析:Bland 和 Altman (1986) 首次提出了 Bland-Altman 分析方法。它的基本思路是计算出两种测量结果的一致性界限,并用图形直观地反映一致性界限和两种方法测量差距的分布情况,最后结合临床实际经验,分析两种测量方法是否具有一致性。
  • 组内相关系数(ICC):衡量和评价观察者间信度(inter-observer reliability)和复测信度(test-retest reliability)的信度系数(reliability coefficient)指标之一。它最先由Bartko于1966年用于测量和评价信度的大小。ICC等于个体的变异度除以总的变异度,故其值介于0~1之间。0表示不可信,1表示完全可信。一般认为信度系数低于0.4表示信度较差,大于0.75表示信度良好,对于定量资料常常需要更高的ICC值。
  • 标准测量误差(SEm):是2014年公布的心理学名词,同一测验在同一被试上重复施测所得分数服从正态分布,其分布标准差的估计值

重测信度及常见评价方法相关推荐

  1. 任务态fMRI重测信度能有多低?

    Summary 任务态fMRI的重测信度对于个体差异研究至关重要,却往往被忽视.研究发现用广义线性模型中的β值作为个体脑活动的指标是不可靠的.寻找具有较好重测信度的指标,是以后努力的方向. The e ...

  2. 云服务器带宽测速那四种方法最常见

    服务器带宽测速的方法有下载测速.ping测试.第三方测速网站和路由追踪几种方法,服务器带宽网来详细说下服务器带宽测速方法: 服务器带宽测速 服务器可选传统IDC,也可以选择云服务器,如阿里云.腾讯云等 ...

  3. Ubuntu16.04 CUDA和GPU的最简最全安装方案及常见问题解决方法,GTX1080 Ti 和 RTX2080 Ti 亲测!

    Ubuntu 16.04 Nvidia Driver+tensorflow-gpu+cuda+cudnn 安装文档 本文采用 CUDA 一站式驱动安装方案,文末附有安装常见问题解决方法 RTX 208 ...

  4. 任务态fMRI测量的重测可靠性:新的实证证据和元分析

    在神经科学中,识别疾病风险的脑生物标记物日益重要.识别有意义的生物标记物的能力受到测量可靠性的限制;不可靠的测量方法不适用于预测临床结果.利用任务态功能磁共振成像(task fMRI)测量大脑活动是开 ...

  5. 飞机座舱布局工效综合评价与评价方法初探

    随着飞机性能的不断提高,飞行员的工作负荷及操作难度不断增大,经常导致误判和误操作.因此从工效学的角度开展座舱设计的工效学综合评价对提高飞行员工效.减少人为失误影响甚大. 座舱布局涉及到工效问题很多,如 ...

  6. 流媒体视频质量评价(单刺激连续质量评价方法)

    2019独角兽企业重金招聘Python工程师标准>>> Stefan Winkler等人在论文<Video Quality Evaluation for Internet St ...

  7. 机器学习的评价方法PRF

    目前学界主流是使用精确率(Precision).召回率(Recall)和 F 值(F-measure)来评价一个信息检索系统的质量的.这三个值通常放在一起进行考虑,因此也被称为PRF 评价方法. 假设 ...

  8. 图像质量评价方法综述

    图像质量评价综述 1.背景介绍 图像是人类感知和机器模式识别的重要信息源,其质量对所获取信息的充分性和准确性起着决定性的作用.然而,图像在获取.压缩.处理.传输.显示等过程中难免会出现一定程度的失真. ...

  9. WEB应用防火墙安全技术要求与测试评价方法

    信息安全技术  WEB应用防火墙安全技术要求与测试评价方法 范围 本标准规定了WEB应用防火墙的安全功能要求.自身安全保护要求.性能要求和安全保证要求,并提供了相应的测试评价方法. 本标准适用于WEB ...

最新文章

  1. Scrum看板工具Leangoo脑图实现影响地图
  2. 2017美国人工智能和机器学习行业种子投资首次下降
  3. c语言socket鉴权,建立套接字后进行socket.io身份验证
  4. mysql order by if()或order by in()条件排序
  5. 【HTML学习】——一个网页HTML编程的构成
  6. linux跳转乌班图服务器,Linux-Ubuntu环境安装Nginx和配置二级域名跳转
  7. 用for循环打印出九九乘法表
  8. linux32-bit是什么意思,怎么查看LINUX系统是32bit还是64bit
  9. Ural_1225 Flags
  10. eclipse汉化方法
  11. 打印服务Print Spooler自动停止解决方案
  12. 推荐的这22个高频 CLI 工具,确定不收藏吗?
  13. 读懂 互联网巨头 【中台之战】 以及 中台 发展思维
  14. C++初学者必练基础编程题【第一期】
  15. eNSP不同网段主机互联-static
  16. 关于条形码的属性与一些自定义操作
  17. Android屏幕适配(网易云音乐方案)
  18. unity UI 跟随3D物体移动
  19. 核范数与规则项参数选择
  20. 人体行为识别研究综述

热门文章

  1. 失业半年,HR女友教我简历作假顺利入职!
  2. MySQL及数据库相关
  3. centos开机启动后只是一条横杠
  4. 【电路设计】基于变压器的DC/DC变换电路(含Multisim仿真)
  5. 22-0002 天猫店铺搜索页面分析
  6. 成长杂志成长杂志社成长编辑部2022年第7期目录
  7. 虚拟机架设冒险岛服务器,冒险岛单机版V139虚拟机版+视频安装教程+139客户端+登录器...
  8. 【java毕业设计】基于javaEE+SSH+mysql+strust2的超市积分管理系统设计与实现(毕业论文+程序源码)——超市积分管理系统
  9. 全球存算一体技术研究及量产情况最新进展(收录于存算一体芯片赛道投资融资分析)
  10. 河南省历年高考人数(2004-2021)