观文析字---字母 S
发布时间:2011-02-21来源:国家教育考试评价研究院
分享到:

S,s

Ÿ  sample(样本)

从被称为“总体”(或“总群体”)的较大的一组潜在成员中选择有限的被称为“取样单位”的一组成员(如受测者、试题等等)。随机抽取的是随机样本,即任一成员的选取与其它成员无关。分层随机样本是一组随机样本,其中每个样本都有规定的大小,来自数个不同的层次, 因此被视为是总体的各个不同层次。

 

Ÿ  scale(量表/量尺)

1. 指一个测量体系及其测量单位,并据此报告某个测量维度的数据。如长度既可以在英制中报告为英尺和英寸,在公制中报告为米和厘米。

2. 在测试中,量尺指用于测量的一组试题或一组单元测验。它与一个考试在所测量的特征类型上不同。例如,在谈到语言能力时,一个人可能说“一个语言能力测验”;但在谈到检测考生属内向型还是外向型时,却说“一份内向外向检测量表”。

 

Ÿ  scale score(量表分数)

参看“导出分数”。

 

Ÿ  scaling(标定)

建立一个量尺或量表分数的过程。标定过程可以通过将来自不同测验或不同测验试卷的分数放在一个共同的量尺上来加强分数的解释;也可以通过设计一个量尺分数以支持标准参照性或常模参照性的分数的解释来加强分数解释。

 

Ÿ  scoring rubric(评分规则)

在对每个试题或一组试题的解答评分时建立的一些准则,包括规则、原则和演示。这一术语通常用于非选择题的情况,评分过程需要对受测者所做练习的解答做出评价。影响评分规则的因素很多,包括需要做出判断的程度、所定义的可以区分考生水平的等级数目、评分员是否可以给半分(或小数点分数)、或其它因素等等。

 

Ÿ  screening test(筛选测验)

在选拔决策或诊断过程中,用于对受测者进行初步粗略分类或摸底的测验。

 

Ÿ  Spearman-Brown formula(斯皮尔曼-布朗公式)

根据经典测验理论导出的一个公式,从一个特定长度的考试的信度推导出一个较短或较长的测验的信度。

 

Ÿ  split-halves reliability coefficient(分半信度系数)

通过将一个考试的试题一分为二为独立的两部分之后计算两部分得分之间的关联系数而得到的测验内部一致性信度系数。这两部分半个考试的分数之间的关联系数经过斯皮尔曼-布朗公式的调整,可以作为原测验的替换试卷信度的一种估算值。

 

Ÿ  standard error of measurement(测量的标准误)

通过在相同条件下重复施测同一测验(或测验的平行试卷)而得到的考生观察分数的离差分数。由于这一数据通常很难获得,一般得通过群体数据(group data)来估计测量标准误差。

 

Ÿ  standard score(标准分数)

一种导出分数,其分布对一个特定的总体已有现成方便的平均数和标准差。这一术语有时专门用于那些平均分为0.0、标准差为1.0的分数分布。

 

Ÿ  standardization(标准化)

1. 在施测过程中保持不变的测验环境,根据详细的测验规则和说明施测,以保证测验条件对所有受测者都是相同的。

2.在测验制作过程中,建立分数常模的过程。这种常模是建立在受测者群体的代表性样本的表现水平之上的。

3.在统计分析中,对变量进行转换的作法,使其对特定样本或总体的分数标准差为1.0。参看“标准分数”。

 

Ÿ  standards-based assessment(基于标准的评价)

旨在反映受测者是否已掌握经过系统描述的内容和能力表现标准的评价。

 

Ÿ  stratified coefficient alpha(分层阿尔法系数)

对阿尔法系数所做的修正,使其更适合多因素测验(multi-factor test)。其做法是将测验的总分定义为是由多个单因素的测验部分(single-factor part-tests) 合成的。

 

Ÿ  systematic error(系统误差)

与测验表现无关的一种稳定的(通常需要通过间接观察来了解的)分数构成部分。