第二章：真分数理论（信度系数的估计）（三）

第三节信度系数的估计

平行测验的获得

按照信度系数的定义，就是两平行测验上观察分数的相关。
人们解决信度问题的能力取决于获得平行测验的能力。
测验是否平行？需要作出检验。如何检验？根据式（2.8a）和（2.8b）所作出的平行测验定义，我们可以立即推出如下结论：

当两平行测验对足够大的被试团体施测后，两平行测验的观测分数的平均数（期望值）和方差都会分别相等。也就会有，
ζX=ζX‘ζX = ζX^` ζX=ζX‘
和
σ2(X)=σ2(X‘)σ^2(X) = σ^2(X^`) σ2(X)=σ2(X‘)
获取（大体）平行测验的方法和策略主要有：利用同一测验重复施测两次求取稳定性系数；精心编制两个平行复本求取等值性系数；将一个完整测验劈分成等值的两半求取劈半相关等。

重测法

求取重测相关是得到平行测验的一个最简单而又最可靠的方法。

对主要用来起预测作用的测验，考察其分数的信度，就可使用重测法。 因为重测法允许在长间距后再测，着重突出稳定性。也正由于这一点，重测法求得的信度系数就叫稳定性系数。
编出的两个或多个测验，其具体测试项目不同，但整体测验效能类似，可以看成从特定项目领域抽取到的“平行等值”样本。这样求得的信度系数，就叫等值性系数。

劈半法:

劈半法是将应该考察信度的测验，以其构成项目为单位重新组合，将所有项目分成两组，成为测试功能平行等值的两半。
全测验分成两半后求两个半测验分数的相关系数，跟全测验与另一（平行）的全测验求二者测验分数的相关系数，半测验相关所指代的测验项目数就少了一半。一个测验的信度跟他所包含的项目数是直接相关联的。（测验项目数越多，测验长度越大，信度系数取值就会越高。) ⟹\Longrightarrow⟹ 劈半后直接求得的相关系数，经校正后才能作为原来的全测验实有的信度系数。
校正公式一般采用斯庇尔曼—布朗公式，即
ρ11=2ρ12,121+ρ12,12ρ_{11} = \frac{2 ρ_{\frac{1}{2},\frac{1}{2}}}{1 + ρ_{\frac{1}{2},\frac{1}{2}}} ρ11=1+ρ21,212ρ21,21
其中，ρ11ρ_{11}ρ11 是校正后全测验信度系数，ρ12,12ρ_{\frac{1}{2},\frac{1}{2}}ρ21,21 是从两劈半测验上求得的相关系数。
劈半法的优缺点：

优点：劈半法实施起来简便，不需要重测。只测验一次。

缺点：难于将测验项目劈成两个“平行等值”的部分。

单一形式测验信度

按信度系数的定义，必须要拿两个彼此平行的测验向同一被试组实施，这样获得两批观察分数后，才能在事实上求出相关系数即信度系数。

劈半相关法

劈半相关法使用单一形式测验实际只施测一次而求出信度系数。诀窍是在两个半测验上使用了平行测验的观念。

这只是在思想上利用平行测验观念，而实际操作上只将单一形式测验施测一次求得的信度系数。
这个单一形式测验信度系数求法并不能广泛推行，因为它要求测验中所有项目要彼此平行，这是无法满足的苛刻条件。

领域抽样理论

领域抽样理论更加强调在思想上而不是在实际操作中制作平行测验和进行随机抽样。
领域抽样理论认为，既然我们在实践上已经编制出能最好地测察特定心理结构（特质）的测验，就不妨在思想上设想，还有一个与此测验完全平行等值的测验存在，并可认为这是从一个良好的由许多平行测验构成的总体中随机抽得的两个样本。这样，这两个平行测验间观察分数的相关系数，自然就是所求的测验信度系数。
单一形式测验信度系数为：
ρXX=α=KK−1[σX2−∑σXi2σX2]=KK−1[1−∑σXi2σX2]ρ_{XX} = α = \frac{K}{K-1}[\frac{σ^2_X-\sum σ^2_{X_i}}{σ^2_X}] = \frac{K}{K-1}[1 - \frac{\sumσ^2_{X_i}}{σ^2_X}] ρXX=α=K−1K[σX2σX2−∑σXi2]=K−1K[1−σX2∑σXi2]
其中，ρXXρ_{XX}ρXX为测验信度系数，σX2σ^2_XσX2为被试测验总分方差，σXi2σ^2_{X_i}σXi2为项目分数方差，K为测验项目个数。

这个式子计算上简便的多，这就是著名的克隆巴赫α系数。
倘若一个测验全由二值记分（1，0方式记分）的项目所组成，那么，上式中每个项目上的分数方差就会等于该项目上通过率p与未通过率q二者的积，
KR−20=kk−1[1−∑piqiσX2]KR - 20 = \frac{k}{k-1}[1 - \frac{\sum p_iq_i}{σ^2_X}] KR−20=k−1k[1−σX2∑piqi]
这就是库德–里查逊20公式，它是α系数在“全或无”记分方式测验上的特例。
从劈半相关开始，到α系数和KR-20公式，这一大类单一形式测验信度系数，都在着力考察测验的组成成分，直至最基本的单位即项目之间的相关性。

所以它们又都被称为内部一致性系数，内部一致性系数虽然在操作上采用了单一形式测验，但本质上仍然是求取平行测验间分数的相关，因此，跟稳定性系数与等值性系数一样，都是一种实现平行性要求的策略与方法。

信度系数的应用

无论采用稳定性系数、等值性系数还是内部一致性系数的方法，在理论上，都是要去估计出某特定测验的信度系数，并通过信度系数去确定观察分数跟真分数的联系强度。

测验误差的来源

测验误差的来源非常多，一般可将其分为：来自施测环境与条件（含施测手续的）、来自于被试的、跟测验内容结合在一起的、跟评分过程结合在一起的等。
所测特质有偏于情境性的、动态的、也有偏于经常性的、静态的等。
采用稳定性系数：主要起预测作用的、测量被试潜在能力倾向的测验；

采用内部一致性系数：主要是测一时状态特性（如焦虑）的测验；

采用等值性系数：学业成就测验重视内容抽样，要把某种内容样本上的成绩推广到其他类似领域中去；

有的测验事实上包含多个因素，就不宜采用内部一致性系数；

论文型测验、表现型操作测验，评分者偏好对评分结果影响显著，就要着重考察评分者信度。

速度测验不宜使用劈半法，而应采用重测法。

估计评分者信度系数

估计评分者信度系数，就是考察评分者间的一致性

因此，也可采用α系数。
ρXX=α=KK−1[σX2−∑σXi2σX2]=KK−1[1−∑σXi2σX2]ρ_{XX} = α = \frac{K}{K-1}[\frac{σ^2_X-\sum σ^2_{X_i}}{σ^2_X}] = \frac{K}{K-1}[1 - \frac{\sumσ^2_{X_i}}{σ^2_X}] ρXX=α=K−1K[σX2σX2−∑σXi2]=K−1K[1−σX2∑σXi2]
不过，σX2σ^2_XσX2为被试在所有评分者上所得总分的方差，σXi2σ^2_{X_i}σXi2为评分者分数方差，K为评分者人数。

经典信度理论的一大局限

经典信度理论所求取的信度系数及测量标准误，一般来说，主要适用于纸笔方式的常模参照性测验，针对的是被试测验总分。
因为一个测验只有一个信度系数，于是所有接受了同一测验的被试的总分，全都有一个相同的测量标准误。这是经典信度理论的一大局限，影响其实用效果。

差异分数信度系数

人们常常不仅需要掌握单个测验的信度系数，而且需要了解被试在两个测验（非指平行测验）上的分数差数的信度系数。
两测验分数差值的信度系数，并不单纯取决于两测验自身的信度高低，还受其他因素制约。

经典信度理论求出的测验信度系数，以及相应的测量标准误，是针对着整个测验来说的。它并不能说明测验中各个项目的信度以及其测量标准误的情况。

第二章：真分数理论（信度系数的估计）（三）相关推荐

计算机网络原理第二章笔记,计算机网络原理笔记第三章数据链路层（一）
数据链路层(一) 3.1 使用点对点信道的数据链路层 3.1.1 数据链路层和帧数据发送模型数据链路层的信道类型数据链路层使用的信道主要有以下两种类型:点对点信道.这种信道使用一对一的点对点通信 ...
第二章：Linux系统目录介绍+第三章：Linux系统文件类型和文件权限
文章目录二.Linux目录结构 1.Linux的文件目录结构图 2.常用目录介绍 3.相对路径和绝对路径三. Linux系统文件类型和文件权限 1.文件类型 2.文件权限 3.如果修改文件权限 3 ...
网络安全技术第二章----数据加密与PKI技术（三）
(12分)多选题 2-30.在SSL握手协议中,客户端和服务器端交换3个随机数生成了协商密钥之后,又使用协商密钥对之前发送的消息进行了加密验证,请问这么做的目的是什么? A 服务器端验证客户端的真实性 ...
悟透delphi 第二章 DELPHI与WIN32时空
第一章 DELPHI的原子世界第二章 DELPHI与WIN32时空第三章多线程第四章接口第五章包第六章事件与消息第七章组织你的模块第八章探索数据库第九章 ...
Python基础——第二章：Python基础语法
前言本文是根据黑马程序员Python教程所作之笔记,目的是为了方便我本人以及广大同学们查漏补缺. 不想做笔记直接来我的频道.当然啦,自己的笔记才是最好的哦! PS:感谢黑马程序员! 教程链接:黑马程 ...
《Java Web程序设计任务教程》简要复盘：第二章 JavaWeb概述
<Java Web程序设计任务教程>简要复盘:第二章 JavaWeb概述第二章:Java Web概述 XML基础 XML概述 XML语法 HTTP协议 1.HTTP概述 HTTP介绍 W ...
lua-protobuf 新手入门篇-第二章.Unity lua-protobuf 环境配置
第一章.编译lua-protobuf支持库(Windows插件-Win10编译) 第二章.Unity & lua-protobuf 环境配置第三章.二进制proto读取功能,与,lua-pr ...
第二章：真分数理论（经典的信度理论）（二）
第二节经典的信度理论信度的概念测验信度 :关于测验控制误差.抗干扰能力的量度,或者说对测验结果准确.可靠地传达真值信息能力的量度,就是测验信度. 按照真分数理论的数学模型,可以从三个角度来定义测 ...
机房专用空调培训资料(第二章——第三章)
本文转载自艾默生< 机房专用空调培训资料(第二章--第三章)> 第二章气流组织方式空调的气流组织方式一般分为两种:上送风和下送风. 下送风形式的气流 ...

第二章：真分数理论（信度系数的估计）（三）

第三节信度系数的估计

平行测验的获得

重测法

劈半法:

单一形式测验信度

劈半相关法

领域抽样理论

信度系数的应用

测验误差的来源

估计评分者信度系数

经典信度理论的一大局限

差异分数信度系数

第二章：真分数理论（信度系数的估计）（三）相关推荐

最新文章

热门文章

第二章：真分数理论（信度系数的估计）（三）

第三节 信度系数的估计

平行测验的获得

重测法

劈半法:

单一形式测验信度

劈半相关法

领域抽样理论

信度系数的应用

测验误差的来源

估计评分者信度系数

经典信度理论的一大局限

差异分数信度系数

第二章：真分数理论（信度系数的估计）（三）相关推荐

最新文章

热门文章

第三节信度系数的估计