第三节 信度系数的估计

平行测验的获得

  • 按照信度系数的定义,就是两平行测验上观察分数的相关。

  • 人们解决信度问题的能力取决于获得平行测验的能力。

  • 测验是否平行?需要作出检验。如何检验?根据式(2.8a)和(2.8b)所作出的平行测验定义,我们可以立即推出如下结论:

    当两平行测验对足够大的被试团体施测后,两平行测验的观测分数的平均数(期望值)和方差都会分别相等。也就会有,
    ζX=ζX‘ζX = ζX^` ζX=ζX‘

    σ2(X)=σ2(X‘)σ^2(X) = σ^2(X^`) σ2(X)=σ2(X‘)

  • 获取(大体)平行测验的方法和策略主要有:利用同一测验重复施测两次求取稳定性系数;精心编制两个平行复本求取等值性系数;将一个完整测验劈分成等值的两半求取劈半相关等。

重测法

求取重测相关是得到平行测验的一个最简单而又最可靠的方法。

  • 对主要用来起预测作用的测验,考察其分数的信度,就可使用重测法。 因为重测法允许在长间距后再测,着重突出稳定性。也正由于这一点,重测法求得的信度系数就叫稳定性系数。
  • 编出的两个或多个测验,其具体测试项目不同,但整体测验效能类似,可以看成从特定项目领域抽取到的“平行等值”样本。这样求得的信度系数,就叫等值性系数。
劈半法:
  • 劈半法是将应该考察信度的测验,以其构成项目为单位重新组合,将所有项目分成两组,成为测试功能平行等值的两半。

  • 全测验分成两半后求两个半测验分数的相关系数,跟全测验与另一(平行)的全测验求二者测验分数的相关系数,半测验相关所指代的测验项目数就少了一半。一个测验的信度跟他所包含的项目数是直接相关联的。(测验项目数越多,测验长度越大,信度系数取值就会越高。) ⟹\Longrightarrow⟹ 劈半后直接求得的相关系数,经校正后才能作为原来的全测验实有的信度系数。

  • 校正公式一般采用斯庇尔曼—布朗公式,即
    ρ11=2ρ12,121+ρ12,12ρ_{11} = \frac{2 ρ_{\frac{1}{2},\frac{1}{2}}}{1 + ρ_{\frac{1}{2},\frac{1}{2}}} ρ11​=1+ρ21​,21​​2ρ21​,21​​​
    其中,ρ11ρ_{11}ρ11​ 是校正后全测验信度系数,ρ12,12ρ_{\frac{1}{2},\frac{1}{2}}ρ21​,21​​ 是从两劈半测验上求得的相关系数。

  • 劈半法的优缺点:

    优点:劈半法实施起来简便,不需要重测。只测验一次。

    缺点:难于将测验项目劈成两个“平行等值”的部分。

单一形式测验信度

  • 按信度系数的定义,必须要拿两个彼此平行的测验向同一被试组实施,这样获得两批观察分数后,才能在事实上求出相关系数即信度系数。
劈半相关法
  • 劈半相关法使用单一形式测验实际只施测一次而求出信度系数。诀窍是在两个半测验上使用了平行测验的观念。

    这只是在思想上利用平行测验观念,而实际操作上只将单一形式测验施测一次求得的信度系数。

  • 这个单一形式测验信度系数 求法并不能广泛推行,因为它要求测验中所有项目要彼此平行,这是无法满足的苛刻条件。

领域抽样理论
  • 领域抽样理论更加强调在思想上而不是在实际操作中制作平行测验和进行随机抽样。

  • 领域抽样理论认为,既然我们在实践上已经编制出能最好地测察特定心理结构(特质)的测验,就不妨在思想上设想,还有一个与此测验完全平行等值的测验存在,并可认为这是从一个良好的由许多平行测验构成的总体中随机抽得的两个样本。这样,这两个平行测验间观察分数的相关系数,自然就是所求的测验信度系数。

  • 单一形式测验信度系数为:
    ρXX=α=KK−1[σX2−∑σXi2σX2]=KK−1[1−∑σXi2σX2]ρ_{XX} = α = \frac{K}{K-1}[\frac{σ^2_X-\sum σ^2_{X_i}}{σ^2_X}] = \frac{K}{K-1}[1 - \frac{\sumσ^2_{X_i}}{σ^2_X}] ρXX​=α=K−1K​[σX2​σX2​−∑σXi​2​​]=K−1K​[1−σX2​∑σXi​2​​]
    其中,ρXXρ_{XX}ρXX​为测验信度系数,σX2σ^2_XσX2​为被试测验总分方差,σXi2σ^2_{X_i}σXi​2​为项目分数方差,K为测验项目个数。

    这个式子计算上简便的多,这就是著名的克隆巴赫α系数

  • 倘若一个测验全由二值记分(1,0方式记分)的项目所组成,那么,上式中每个项目上的分数方差就会等于该项目上通过率p与未通过率q二者的积,
    KR−20=kk−1[1−∑piqiσX2]KR - 20 = \frac{k}{k-1}[1 - \frac{\sum p_iq_i}{σ^2_X}] KR−20=k−1k​[1−σX2​∑pi​qi​​]
    这就是库德–里查逊20公式,它是α系数在“全或无”记分方式测验上的特例。

  • 从劈半相关开始,到α系数和KR-20公式,这一大类单一形式测验信度系数,都在着力考察测验的组成成分,直至最基本的单位即项目之间的相关性。

    所以它们又都被称为内部一致性系数,内部一致性系数虽然在操作上采用了单一形式测验,但本质上仍然是求取平行测验间分数的相关,因此,跟稳定性系数与等值性系数一样,都是一种实现平行性要求的策略与方法。

信度系数的应用

  • 无论采用稳定性系数、等值性系数还是内部一致性系数的方法,在理论上,都是要去估计出某特定测验的信度系数,并通过信度系数去确定观察分数跟真分数的联系强度。
测验误差的来源
  • 测验误差的来源非常多,一般可将其分为:来自施测环境与条件(含施测手续的)、来自于被试的、跟测验内容结合在一起的、跟评分过程结合在一起的等。

  • 所测特质有偏于情境性的、动态的、也有偏于经常性的、静态的等。

  • 采用稳定性系数: 主要起预测作用的、测量被试潜在能力倾向的测验;

    采用内部一致性系数: 主要是测一时状态特性(如焦虑)的测验;

    采用等值性系数: 学业成就测验重视内容抽样,要把某种内容样本上的成绩推广到其他类似领域中去;

    有的测验事实上包含多个因素,就不宜采用 内部一致性系数;

    论文型测验、表现型操作测验,评分者偏好对评分结果影响显著,就要着重考察评分者信度。

    速度测验不宜使用劈半法,而应采用重测法。

估计评分者信度系数
  • 估计评分者信度系数,就是考察评分者间的一致性

    因此,也可采用α系数。
    ρXX=α=KK−1[σX2−∑σXi2σX2]=KK−1[1−∑σXi2σX2]ρ_{XX} = α = \frac{K}{K-1}[\frac{σ^2_X-\sum σ^2_{X_i}}{σ^2_X}] = \frac{K}{K-1}[1 - \frac{\sumσ^2_{X_i}}{σ^2_X}] ρXX​=α=K−1K​[σX2​σX2​−∑σXi​2​​]=K−1K​[1−σX2​∑σXi​2​​]
    不过,σX2σ^2_XσX2​为被试在所有评分者上所得总分的方差,σXi2σ^2_{X_i}σXi​2​为评分者分数方差,K为评分者人数。

经典信度理论的一大局限
  • 经典信度理论所求取的信度系数及测量标准误,一般来说,主要适用于纸笔方式的常模参照性测验,针对的是被试测验总分。
  • 因为一个测验只有一个信度系数,于是所有接受了同一测验的被试的总分,全都有一个相同的测量标准误。这是经典信度理论的一大局限,影响其实用效果。
差异分数信度系数
  • 人们常常不仅需要掌握单个测验的信度系数,而且需要了解被试在两个测验(非指平行测验)上的分数差数的信度系数。
  • 两测验分数差值的信度系数,并不单纯取决于两测验自身的信度高低,还受其他因素制约。

经典信度理论求出的测验信度系数,以及相应的测量标准误,是针对着整个测验来说的。它并不能说明测验中各个项目的信度以及其测量标准误的情况。

第二章:真分数理论(信度系数的估计)(三)相关推荐

  1. 计算机网络原理第二章笔记,计算机网络原理笔记 第三章 数据链路层(一)

    数据链路层(一) 3.1 使用点对点信道的数据链路层 3.1.1 数据链路层和帧 数据发送模型 数据链路层的信道类型 数据链路层使用的信道主要有以下两种类型:点对点信道.这种信道使用一对一的点对点通信 ...

  2. 第二章:Linux系统目录介绍+第三章:Linux系统文件类型和文件权限

    文章目录 二.Linux目录结构 1.Linux的文件目录结构图 2.常用目录介绍 3.相对路径和绝对路径 三. Linux系统文件类型和文件权限 1.文件类型 2.文件权限 3.如果修改文件权限 3 ...

  3. 网络安全技术 第二章----数据加密与PKI技术(三)

    (12分)多选题 2-30.在SSL握手协议中,客户端和服务器端交换3个随机数生成了协商密钥之后,又使用协商密钥对之前发送的消息进行了加密验证,请问这么做的目的是什么? A 服务器端验证客户端的真实性 ...

  4. 悟透delphi 第二章 DELPHI与WIN32时空

    第一章  DELPHI的原子世界 第二章  DELPHI与WIN32时空 第三章  多线程 第四章  接口 第五章  包 第六章  事件与消息 第七章  组织你的模块 第八章  探索数据库 第九章  ...

  5. Python基础——第二章:Python基础语法

    前言 本文是根据黑马程序员Python教程所作之笔记,目的是为了方便我本人以及广大同学们查漏补缺. 不想做笔记直接来我的频道.当然啦,自己的笔记才是最好的哦! PS:感谢黑马程序员! 教程链接:黑马程 ...

  6. 《Java Web程序设计任务教程》简要复盘:第二章 JavaWeb概述

    <Java Web程序设计任务教程>简要复盘:第二章 JavaWeb概述 第二章:Java Web概述 XML基础 XML概述 XML语法 HTTP协议 1.HTTP概述 HTTP介绍 W ...

  7. lua-protobuf 新手入门篇-第二章.Unity lua-protobuf 环境配置

    第一章.编译lua-protobuf支持库(Windows插件-Win10编译) 第二章.Unity & lua-protobuf 环境配置 第三章.二进制proto读取功能,与,lua-pr ...

  8. 第二章:真分数理论(经典的信度理论)(二)

    第二节 经典的信度理论 信度的概念 测验信度 :关于测验控制误差.抗干扰能力的量度,或者说对测验结果准确.可靠地传达真值信息能力的量度,就是测验信度. 按照真分数理论的数学模型,可以从三个角度来定义测 ...

  9. 机房专用空调培训资料(第二章——第三章)

    本文转载自艾默生<     机房专用空调培训资料(第二章--第三章)> 第二章               气流组织方式 空调的气流组织方式一般分为两种:上送风和下送风. 下送风形式的气流 ...

最新文章

  1. 蒙特卡洛算法及其实现
  2. Android 代码实现整数处理为小数,Android EditText限制输入整数和小数的位数的方法示例...
  3. python 全局变量使用报错没有定义_Python变量作用域代码解析
  4. Spring Boot整合批量文件下载功能
  5. JAVA8中Set排序四种写法
  6. c++中static的全部用法
  7. 数据结构上机实践第九周项目1 - 二叉树算法库
  8. 数据脱敏和加密_数据脱敏和数据加密的区别--工作需要,对其进行了简单的整理...
  9. SQL Server 2000中数据库质疑的恢复方法
  10. 2004-7-1+ 用户控件(动态加载)
  11. 用ODBC方式操作dbf文件
  12. MFC程序中使用QT开发界面
  13. iOS手势识别的工作原理
  14. DirectX支配游戏 历代GPU架构全解析
  15. jupyterlab使用配置
  16. 我的价值观和人才观(狭得不能再狭的狭义)
  17. 面试指南-----项目自我介绍
  18. Window XP驱动开发(二) 环境搭建(VS2008+WDK+DDKWzard)及示例源码分析
  19. 微信 checkbox修改样式
  20. 陆奇:奇绩创坛选项目不看赛道而是看人,本质上是一个创业者社区

热门文章

  1. Mac 修改开机登陆界面背景图, 替换沙漠背景图
  2. 江苏:创新管理方法 电动自行车交通事故同比下降40%
  3. AI轰鸣时代(一):苹果VS麒麟,今年的移动芯片究竟比什么?
  4. Speedoffice(excel)如何利用SUMPRODUCT函数求和
  5. 50种认知偏差要注意,这样才能做最好的自己
  6. Matplotlib.pyplot 常用方法
  7. Portraiture2023最新版本下载及PS磨皮的方法教程
  8. 时域特征提取_时域分析——无量纲特征值含义一网打尽
  9. 新版标准日本语初级_第三十课
  10. 小说更新太慢怎么办_小说:圣墟(挺好看的一部小说,现在更新非常慢)