新祥旭考研官网欢迎您!

预约报名

考研心理测量汇总(十一)

【新祥旭考研】 / 2015-10-19

   第四章 心理测量的误差

  前面我们已经讨论了什么是测验,以及如何编制测验,现在转入研究什么是一个好的测验。

  无论何种测量工具,我们对它起码的要求是稳定,准确。用心理测量学的术语来说,就是要可信和有效。所谓可信是指多次测量的结果是一致的,所谓有效是指正确地测量了所要测的东西。信度是测量一致性程度的估计,效度是测量准确性程度的估计。

  关于测量的信度和效度问题,下边有专章分别讨论。为了考察测量的信度和效度,首先要了解测量的误差。

  第二节 误差的来源

  一个测验要准确可靠,必须控制各种误差,为此首先要了解误差的来源。

  根据误差定义,任何变因只要与测量目的无关,并使得结果不准确、不一致,便可认为是一种误差因素。在心理测量中,

  常见的误差来源于三个方面:测验内部,施测过程,受测者本身。

  一、测验内部引起的误差

  测验内部的误差主要来源于题目取样:当测验题目较少或取样缺乏代表性时,被试的反应受机遇影响较大,(譬如一次考试碰巧准备到或没准备到某题),当几个测验复本不等值时,接受不同的题目,就会获得不同的分数。

  除题目取样不当可引起误差外,其它一些因素,如题目用词的模棱两可,对反应步骤说得不清,题目过难引起猜测,时限短使被试仓促作答等,也都可能成为误差的来源。

  二、由施测过程引起的误差

  在三种误差来源中,与施测过程有关的误差可能是最容易控制和检验的。通过长期实践,测验的标准化水平越来越高,大部分施测条件能够得到控制。但由于心理现象的复杂性,许多意想不到的偶然因素仍可能影响测验分数,使人防不胜防。

  (一)物理环境

  施测现场的温度。光线,声音、桌面好坏,空间阔窄等皆具有影响。

  (二)主试者方面:

  主试者的年龄、性别、外表,施测时的言谈举止、表情动作等均能影响测验结果。倘若不按照规定实施测验,如制造紧张气氛,给予特别协助或暗示,以及计时错误等,都会带来较大误差,特别是当测验具有复杂步骤和说明,或测验题本身是模糊不确定的形式时,当主试者在安排测验条件上有较多余地(例如个别施测)时,当测验是对幼儿,有情绪困扰者以及对测验程序不熟悉的人施测时,主试者的影响更大。

  (三)意外干扰:

  在测验环境复杂,特别是当受试人数较多时,容易发生出乎预料的干扰或分心事件。例如:停电、有人生病,有人作弊,计价表停了、临时发现题目或作答纸印刷不清或装订错误等,无论哪种情况都会引起不安和扰乱,导致成绩不准确、不一致。

  (四)评分计分,

  评分不客观以及计算登记分数出错等也是常见的误差。一般选择题的评分较为客观。而问答题、论文题等自由反应型的题目,评分标准很难掌握,加之阅卷者的偏好各不相同,因而难以保证分数的一致性.

  早在几十年前,国外就有人对旧法考试的评分误差做过研究。斯达奇(D•storch)和埃立奥特(E•C•Elliott)将一份英文考卷请142位英文教员评阅,所得分数从50分到98分应有尽有。某国教育界还有一件引为笑谈的事,1920年夏季,许多大学教授在评阅历史试卷时,有一位教授为评分便利起见,自己写了一份标准答案,不料和其它考卷混在一起,经另一位教授评阅竟然不及格。为慎重起见,由其它教授重复评定,结果所得分数以10分到90分不等。1961年美国教育测验中心由53个评判员组成专门小组。对大学一年级学生写的200篇作文按九个等级评分,结果有1/3的文章得到了九个等级,有60%的文章得到了七个或八个等级,没有一篇文章少于五个等级。一般理科评分要比文科客观些,但也不尽然。罗雪(Ruch)将—道地理题的解答请91位教员评阅,满分为20分,结果给17种分数,全距为2—20,给各种分数的人次见表4—1,斯达奇和埃立奥特将一份几何考卷请115位中学教员评立,所得分数为28—92分,全距60多分。

全方位权威辅导,考研复试效率高

面授一对一
在线一对一
魔鬼集训营
咨询课程 预约登记

以效果为导向    以录取为目标

填写信息获取考研一对一试听名额
姓名:
电话:
报考学校及专业:
北清考研定制 985考研定制 211考研定制 学硕考研定制 专硕考研定制 北京考研私塾
x