托福考试真的靠谱吗?

 

读完此文后相信每个读者心中已有了自己的答案...





尺子,作为测量物体长短的工具,已应用于人们生活的方方面面,然而当你拿一把尺子测量书本长度的时候你会怀疑这把尺子准不准吗?是否隔几天再测结果还一样?如果不一样,这把尺子就是不靠谱的!

考试其实也是一把尺子,只不过测的不是长度而是人的能力,托福考试也不例外,它是用来测量考生英语听说读写的综合能力。当 ETS 用托福考试测量考生英语能力的时候,你是否怀疑过这把尺子有问题?它是靠谱的吗?作为研发机构的 ETS 又是如何证明他们的托福考试是靠谱的呢?今天我们来一探究竟。

教育测量学中用信度(reliability)这一概念来表示考试的可靠性,信度就是测验分数的稳定性和一致性程度。当我们用一个考试,对同一组考生反复施测时,我们希望所得的分数都是一样的;当用同一考试的不同试卷对同一组考生施测时,我们希望考生在各份试卷上的得分都一样。如果考生的分数表现出很高稳定性,我们就说该考试的信度很高,反之,该考试的信度就不高。

信度的原理是什么?



任何一个考试都是有误差的,考生的分数中必然包含着误差,这种误差来源于考生、试题、阅卷人等等,因此,每一个考生的分数都应该看成是由两部分组成的,一个是稳定的部分,代表他的真实能力,另一部分代表误差,前者叫" 真分数",后者叫" 误差分数"。

信度研究的核心就是看" 误差分数" 有多少?教学测量专家张凯教授对信度的论述有个很经典的比喻:我们不妨把测验分数看成是一个包子,包子馅儿是真分数,包子皮儿是误差。包子馅儿大,皮儿就薄;皮儿厚,馅儿就小。如果我们知道了馅儿有多大,也就能够推测皮儿有薄。

事实上一个人的真实能力(真分数)是永远无法通过一个考试来确定的,信度越高的考试考生所得分数越接近于 ta 的真实能力(真分数)。那么问题来了,我们如何知道一个考试的信度?

如何测量信度的高低?



假设有一批人,他们做了两份考察内容完全一致的 AB 卷,考试之后他们会得到两个分数,但是这两个分数都不能代表他们的真实能力(真分数),这两个分数只是在他们真实能力(真分数)上下波动,上下波动的部分其实就是误差分数。教育测量学中用 SEM(标准误)来表示这种上下波动的大小。SEM 越大,误差分数越大,考试的信度越低,SEM 越小,误差分数越小,考试的信度越高,这是从反面来看信度的大小。

从正面来看,我们还可以用信度系数表示信度的高低,它指考生在 AB 卷分数间的相关,信度系数区间为 0~1,信度系数越大,考试越稳定、越可靠,普遍认为信度系数在 0.7 以上的考试,其可靠性较好。综上,我们可以通过计算某考试的 SEM 和信度系数来了解该考试的信度。

托福考试的信度如何?



托福官方曾在 2011 年公布了其 2007 年试卷的信度分析报告,具体如下:



由上表可知:托福考试的各分测验信度均高于 0.7,SEM 值较小,表明托福考试成绩接近考生真实能力(真分数),所以托福考试的信度较高!不过,写作部分的信度相对较低,官方认为这和托福写作考察形式少、题目数量少、考生作答时间短等原因有关。

所以,托福官方用数据回答了人们对托福考试的质疑,托福考试真的靠谱吗?读完此文后相信每个读者心中已有了自己的答案。
————— END —————
扫码关注公众号 
朗 播 托 福
模考 | 真题 | 资料 | 课程全打包
考 托 福,一 个 公 号 就 够 了


    关注 朗播网


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册

信度 相关文章