评建知识︱从本质上认识高校本科教学评估(三)何谓教学评估

 

从本质上认识高校本科教学评估(三)何谓教学评估教学评估与教育评估不是同一层次的概念,且二者的...

从本质上认识高校本科教学评估
(三)
何谓教学评估
教学评估与教育评估不是同一层次的概念,且二者的内涵在不同教育阶段也有区别,这里仅限于高等教育阶段进行讨论。

对高等教育评估的理解有广义与狭义两种。广义上讲,高等教育评估是一个上位概念,它包括了关于高等教育的所有评估活动;狭义上讲,它是指对高等学校的教育评估,包括对学校的人才培养、科学研究和社会服务等诸方面的评估活动。显然,前者指向高等教育系统内部,而后者指向高等学校内部。与高等教育评估不同,教学评估只指向高等学校内部。对教学评估的理解也有狭义和广义两种。狭义上讲,教学就是指教与学,在高校一般将教学与“教育”(学生工作)有所区分,因此教学评估一般不包括学生工作;广义上讲,教学相当于人才培养,它包括了“教育”与“教学”两方面,因此教学评估基本上是人才培养评估。前者(狭义)常用于学校内部的质量管理,范围比较窄;后者(广义)体现了“教书育人”的理念,基本上是对学校人才培养的全面评估。如无特殊说明,本文谈及的“教学评估”时是基于后一种理解。

教学与教育工作也是两个不能完全等同的概念,二者是一种“种属”关系(例如季节与春、夏、秋、冬之间的关系)。也就是说,教育工作具有教学的特征,同时也具有有别于教学以及与教学工作同层次概念的特征。在实践层面,人们往往将教学工作理解为是与“教”有关的工作,是学校、教师和管理人员的工作范畴,一般不包括学生的学习活动,也不包括学生工作。从这种意义上讲,“教学评估”比“教学工作评估”语意更贴切,内涵更丰富,内容更宽泛。

我国首轮评估采用“本科教学工作水平评估”的称谓,其中“水平评估”体现了“分等评估”的思想,核心还是“教学工作评估”。从国内数据库(包括中国期刊全文数据库,中国博士学位论文全文数据库,中国优秀硕士学位论文全文数据库,中国重要会议论文全文数据库,中国重要报纸全文数据库)的联合检索结果(1979-2008年)来看,“教学评估”是国内学者使用频度最高的术语,其认可度远高于“教学工作评估”(在文章题名中出现频度前者是后者的17.5倍,在全文中是12.4倍),也明显高于大家曾热议的“教学工作水平评估”(在文章题名中出现频度前者是后者的4.7倍,在全文中是5.2倍),甚至还略高于大家熟知和公认的“教育评估”(在题名中出现频度前者是后者的1.1倍,在全文中是1.5倍)。据此我们建议,新一轮评估可考虑将其名称改为高校“本科教学评估”。

对于首轮本科教学评估反响比较强烈的是“评估指标单一”。用一把“尺子”去量不同学校固然不好,但多几把“尺子”就未必能解决学校的个性化、多样化发展问题。这实际上涉及评估的目的性与评估方法论的契合度问题,如果二者的契合度很差甚至不契合,在评估实践中就会出问题。

按照教育评估理论,教育评估有形成性评估(Formative evaluation)和总结性评估(Summative evaluation)两种类型。形成性评估注重的是过程,目的指向是“改进”;总结性评估注重的是结果,目的指向“分等”。发展性评估是形成性评估的一种,它是以现代教育的科学发展观为指导思想,以“立足现在,回顾过去,着眼未来,促进发展”为基本理念,以满足人民群众对高质量的高等教育需求为出发点,以发展过程、进步幅度、发展潜力和发展水平为核心内容,注重个性和特色,以促进高校及师生自主地持续、快速、健康发展为根本目的的一种教学评估。首轮评估的目的是“以评促建、以评促改、以评促管”,但对评估结果设计了四个等级(优秀、良好、合格、不合格)。前者体现了发展性评估的目的,后者体现了总结性评估的结果,二者之间不契合。正是这种偏差,在评估实践中,被评学校在争取得到理想的评估结果上所花的精力远远大于评估目的“促建、促改、促管”的初衷。于是就出现了“优秀情结”。被评学校在各级教育行政主管部门、社会、学校教职员工、学生及其他利益相关者的重压之下,争取得到“优秀”的评估结果几乎成为别无选择的目的。

于是,大家深恶痛绝的弄虚作假、形式主义和腐败现象就有了可乘之机。为什么会“弄虚作假”,因为学校达不到某些评估指标的要求,但还要得到一个更好(甚至“优秀”)的结论。为了追求评估结果,在评估准备阶段,按照评估指标体系进行“建”、“改”、“管”,“建”不好的、“改”不了的以及“管”不到位的就“造假”。为什么在评估专家考察期间会出现“形式主义”,因为评估专家可根据自己看到的、听到的和感受到的对学校的本科教学工作水平做出判断,进而进行“分等”。为了使评估专家感受到学校对评估的“重视”,精心策划专家进校的“评估开幕式”,不惜成本准备“文艺演出”,周密安排各级政府“领导会见”;有的学校甚至对教室、食堂、图书馆、校园等主要场所进行了周密布置,对相关人员的言行进行了精心安排;有的高校还对规定的几个座谈会进行了多次“彩排”,什么人讲什么话都有精心设计。专家进校犹如“兵临城下”,“狼烟四起,只为一笑”。为什么会有腐败现象,因为学校能不能获得“优秀”,在很大程度上取决于评估专家的一票。这就使得个别学校将重视评估结果,取向于重视评估专家;将重视评估专家,取向于一些不正当手段。

关于教学评估的方法论问题,在新一轮评估设计时应予足够重视。分等评估(Assessment)偏重于“输出”(结果),比较的作用突出。这种评估模式最早在法国采用(1984年),后来荷兰、德国等也采用过。目前除了印度外,很少有国家继续采用。英国曾一度短暂地试行过分等评估,但由于遭到学术界和高等学校的强烈反对,很快就停了下来。主要批评意见认为,分等评估侵害了高等学校办学自主权,对学校带来很大压力,而对人才培养质量的改进却收效甚微。基于认证(Accredition)模式的评估(简称认证评估)偏重于“输入”,它不用作高校(或专业)之间的比较,而是对高校(或专业)设定了一个“门槛值”,起到“守门员”的作用。基于审核(audit)模式的评估(简称审核评估)偏重于“过程”,是一种发展性评估,其着眼点是教育质量,但不直接评质量,而是通过评估学校内部质量保证体系来对教学质量进行间接评估。审核评估基于两个观点:其一,如果学校建立了完善有效的内部质量保证体系,学校的教学质量就能得到保证,因而无需直接针对质量进行评估;其二,如果学校缺乏完善有效的内部质量保证体系,即使有优秀的教师、学生、管理人员和充足的资源,也难保证教学质量。审核评估的主要特点是:用自己的“尺子”量自己的“个头”。也就是说,审核评估没有统一的质量标准。这个标准由学校根据学校的质量目标自己制定,然后建立一个与之相适应的质量保证体系,保证标准所期望的质量。审核评估的重点是“三个怎么样”:质量保证体系建得怎么样、运行得怎么样、效果怎么样。具体地讲就是“三个符合度”:质量标准与质量目标的符合度、质量保证体系与质量标准的符合度、质量保证体系的运行效果与质量预期的符合度。审核评估结论不像认证和分等评估那样要对学校进行定量评价和等级划分,而是针对上述的“三个符合度”进行定性分析与判断,特别是要指出存在的问题和改进的建议与方向。审核评估可以有效解决评估分类的问题,因为从理论上讲,审核评估将每一所被评学校视作一个类。考虑到首轮本科教学评估的基础和我国高等教育实际状况,从逐步建立完善我国高等教育质量保证体系的角度出发,建议新一轮本科教学评估对于新建院校采用认证评估,对于已接受首轮评估的院校采用审核评估。
结束语
首轮本科教学评估尽管存在这样和那样的不足,但它对我国高等教育发展的作用和历史性贡献,一定会得到充分肯定。我们必须看到,国外高等教育评估制度已有百余年的历史,而我国的高等教育评估事业才刚起步。我们不仅在评估理论和评估实践上均存在差距,而且评估基础还比较薄弱,评估的法律环境和文化环境尚不完善。如何规划和设计好新一轮评估,绝非易事。我们不仅要认真总结首轮评估的经验,确定继承什么、改进什么,而且要跳出首轮评估的框框,明确发展什么、创新什么。要从构建我国高等教育质量保证体系的战略高度,做好新一轮评估的顶层设计。要认真把握高等教育规律和评估的本质特征,切实处理好评什么、怎么评、为什么评和由谁评等基本问题,设计出一个既有继承又有发展和创新的、既符合我国国情又体现国际先进水平的新一轮评估方案。

——来源于《中国高等教育》



    关注 微文阅读推荐


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册