【质量评价】教育评价的浮华与贫困

清华大学教育研究院 叶赋桂

发布时间:2019-04-17浏览次数:162

    今天可谓中国教育的镀金时代,教育评价上的表现尤为显著。从各方面看,近些年中国的教育评价日益增多,层出不穷,看似繁花似锦,风光无限。无论是评价实践、政策导向还是学术研究,评价都是追捧的热点,被赋予极高的地位和价值。但教育评价也引发了诸多的问题,有关评价的争议也日甚一日,无论是被评价的教师、学生还是研究教育和学术的学者都对教育评价的评价甚低,不断抨击其弊端。教育评价的问题和弊端的严重性已经引起党和政府的高度关注,国务院和相关部委接连发布了多个人才、科技、项目、学术、教育等评价改革的文件。习近平总书记已经就此作了多次重要讲话,指出要改革和创新评价制度。

由此可见,评价不当的危害是极端严重的,对教育评价进行改革具有高度普遍性的共识。那么,中国教育评价应该怎么改革呢?首先恐怕得找出和发现中国教育评价的问题到底出在哪儿?只有抓住这个要害,改革才能有的放矢,才会真正取得成效。

一、教育评价的浮华

目前,中国教育评价最突出的表现是数量繁多。各种教育评价名目纷繁,不胜枚举,无所不在,教育教学的所有场所、活动、机构和人都被要求和经受着各种各样的评价,且评价的次数和内容始终在不断增长。即使是同一项评价也不断扩张,分蘖增殖,花样翻新,弄得极其复杂。比如高考,以前是 “一考定终身”,至少高一、高二还有正常的学习和生活。现在则考了又考,从高一就开始考,没完没了地考,学生完全陷入了令人筋疲力尽的马拉松式备考和考试之中。高考不仅有没完没了的笔试,还有综合素质评价,学生要填很多表格,把自己的日常都变成表格中这种或那种素质的表现,好供老师和其他人来打分和评价。学生正常的学习生活、高中正常的教学秩序被彻底打乱了。本来高考改革的目的是 “扭转片面应试教育倾向”,要减少考试对正常教学的冲击,结果呢,新高考促进了 “全面应试教育”,一次又一次的考试、日复一日的评价完全凌驾和扰乱了常规的教学。最可笑的是,新高考改革实施中明显存在问题,各地的中考竟也模仿新高考来改革,然后中考也来选科。学生于是从初中就开始偏科了,全面发展在新的考试制度下彻底走向其反面。也许我们还缺乏基本的教育常识和政策常识———初中可是义务教育呀!义务教育是“普”及的,“普”意味着普遍、全面、整体、广泛,也意味着普通、一般、共同,越是普通的和一般的,越是共同的,普及教育即对国家所有公民推广共同的教育,既不因人群而差别对待,也不因教育内容而区分。极其反讽的是,中小学教育大搞选课选科,大学却热衷于通识教育。

高等教育的评价近些年变得尤为繁杂。对学生的评价本来就不少,课程、论文、学位、奖学金、推研考研等评价一直都存在,现在更有各种证书和各种外语考试。找工作也是各种形式的评价和考试,公务员要笔试和面试等,进企业也是被反复评价,每种考试都是一轮又一轮。学生被评得一点脾气都没有,更在评价结果的排名下经受着煎熬。大学教师以前被评价较少,现在却不得不接受种种评价的折磨。教师的道德、行为、活动及其结果都受到评价,教学、科研和服务等被校内外方方面面的人和机构来评判。这些评价既繁琐又无聊,形式主义大行其道,耗费教师大量的精力和时间,不但没有促进教育教学、科研和社会服务,反而严重削弱了教师在教育教学、科研和社会服务上的热情和奉献、投入和产出。

评价在数量增多的同时,评价的类型和方式也日益多样。在评价的对象上,以前基本上只评价学生,现在对教师、对学校的评价异军突起,成为学校内外特别是社会上追捧的热点。在评价的主体上,以前只有老师是评价者,现在管理者、政府、媒体以及各种社会机构成为最强有力的评价者,严重压缩和削弱老师作为教育教学评价者的主体地位。在评价的方法上,以前主要是考试、考查,基本上就是笔试,现在呢,测量、监测、鉴定、审核、认证、评级、排名等花样不断翻新,考试也变幻出笔试、口试、面试、个试、群试、实操考试等多种样态,考试结果的处理也不断“创新”,有原始分、附加分、标准分、等级赋分等。在评价的内容上,以前主要考查知识、能力、品行,现在新名目迭出,如智力测验、综合评价、效能评价、胜任力评价、绩效评价、合格评价、满意度评价,等等。在评价的动机和目的上,以前是为学生学习成效的检测、成长和选拔,现在很多评价的目的和动机都不纯,不是掺杂私利,就是有意折腾,或是商业化的。这导致民众对评价的科学性和公正性的怀疑,今天各种评价的公信力、权威性不断下降的原因就在此。

教育评价最引人关注的,其实还不是数量和类型的增多,而是评价所带来的光环和荣耀。伴随教育评价发展的是教育评价结果赋予的无限荣光和风光。今天教育和人才评价已上升为党和国家的战略,教育和学术的评价早已不是学校和学术共同体这个象牙塔内的自娱自乐,而演变为学生、教师、学校、地方政府乃至全社会的生存竞争。“双一流”建设是党中央、国务院的决策,“千人计划”是中组部的项目,“万人计划”是中组部、人社部的项目,“长江学者奖励计划”是教育部的项目,“杰青”“优青”是国家自然科学基金会的项目。这些都是国家级的政府项目,教师和学校只要在这些评价中脱颖而出,就是教师和学校最为自豪的光荣和辉煌。少数幸运儿马上就名至实归,各种资源、待遇、地位和利益滚滚而来。这进一步激发了越来越多的教师和学校追逐评价,跟着评价的要求、方向和标准走。在中央层次的评价项目之外,地方政府也蜂拥而上,学校当然也不甘落后,一时之间,各种一流、重点、创新、示范的项目,江河湖海、名山巨峰的学者,挤爆了中国教育和学术界,真可谓中华多士,人才济济。在各种官方和民间评价持续不断地证明和加持下,中国教育和学术看起来质量大好,一片辉煌。

二、教育评价的贫困

教育评价看起来繁荣兴盛,但若深入地分析,我们就会发现,今天中国的教育评价实际上极其贫困和孱弱。

首先是评价价值的贫困。很多评价只是为评价而评价,根本没有价值取向和追求,这在对大学和大学教师的评价中尤其突出,只是胡乱设一些指标,凑一堆数据,排一个名次。评价一词的含义就是评定其价值。没有价值设定的评价是彻底的胡言乱语,没有任何意义。不同价值下,同一事物的评定结果不同,甚至完全颠倒。教师发表一篇SCI论文,如果从研究产出的数量来说是有价值的,如果从培养人才来说可能是负的价值,因为教师把精力投到研究和论文上,在教学和对学生的投入上必然要减少。从学术成果传播来说,发在外文期刊对增加一个学者及其所在大学的国际学术表现是有价值的,但从政府公共投资的研究成果却不能方便免费地传播给国内学者和公众就是负价值的。高考改革更存在着不同的价值取向,是以公平为主,还是以优异为先,其评价的方案是有很大差异的。我们的学者、大学、政府普遍热衷于评价,却很少思考、更没有很好地把价值目标置于评价的中心。这样的评价只能是空洞的数字、没有意义的话语,不但不能提升、促进和引导教育的发展,反而把教育本质的追求、内涵的发展削弱和冲淡了。

其次是实质评价的贫困。今天虽然评价繁多,但基本上都是形式评价,大多简单地数一数发了多少篇论文,获得多少个项目,拥有多少经费;上了几门课,总共几多课时。复杂一些就计算一下发的几区的期刊论文几何,项目的级别如何,课程的类型为何。至于论文、项目的价值和贡献,课程的效果和作用却不评价。尤其可笑的是,几乎所有的评价都依赖他人的评价,把别人的评价结果拿来数数数就完事,自己却从不进行实质的评价。大学教师在职称晋升时,评审委员会或学术委员会的评委根本不阅读论文和评判教师的论文价值,只看教师提交的论文篇数和发文的期刊等级。而期刊的等级和质量也不是评委品读期刊论文所定的,而是根据各种期刊评价机构评价的结果。这些期刊评价机构更不会去评阅论文,而只看各种数据库统计的引用数,或加上转载数等,就把期刊排名了。至于教师的教学,评委更不会去听课评课,全看学生对教师课程教学的评价结果。于是,我们看到一个可笑而可怕的图景,对教师的评价看似不胜其多,但从评委到管理者,从院系到学校,从校内到校外,却从不做实质评价,根本不会直接评判教师的水平如何、论著的质量如何。当今中国,唯一做些实质评价的也就只剩下学术期刊了。我们的大学、教育管理者和学术领导者大力推进治理改革,但实质上却形成了一种懒汉治理模式。还有一种情况更不可理喻,教师的本职工作是教学,医生的本职工作是看病,工程师的本职工作是工程建设,但我们的评价却不是以基本的工作职责为主,而主要评价与本职工作无关的论文。这更是偏离实质的评价。

实质评价贫困的根本原因在于评价科学和技术的贫困。我们评价的科学性、专业性很差,而评价科学和技术的研究又一直不被重视,非常薄弱,应用也就无从谈起了。因此在评价实践中,很多教师和评委都不知道如何评价学生。大学也不知道如何评价挑选学生,前些年有的大学的自主考试题跟脑筋急转弯差不多。在对人、人性、人才、才性的认识、评价和选拔上,今天的大学连古代的水平都不如。评价技术包括考试测量的技术,也包括组织操作的技术。应该说,高考改革的理念和思路是正确的,而在省市的实施中出现很多问题在相当大的程度就是因为技术上的缺陷和薄弱。教育部考试中心在考试测量技术上还是较先进的,但面对不断改革的高考可能还需要不断努力。而浙江的高考改革问题有不少就是评价的组织能力和操作技术落后所导致的。

最后是评价伦理和评价功用的贫困。评价技术和能力本已低下,评价责任和伦理又相当缺乏,二者叠加,评价的公信力就大打折扣。这个问题此不展开,而主要讨论评价的功用。评价本身不是目的,评价对象和工作的改进和发展才是目的。但现今我们对评价的过度重视导致刻舟求剑,削足适履,为评价而评价,把关注点和大量的精力放在评价上,而忽视了本应重视的工作和活动本身。“双一流”建设就是典型,管理者、大学和学者全都在琢磨如何评价与如何应付评价,而不是真正地投入到一流大学和一流学科建设上。课题和奖励也是这样,没人关注成果是什么,只求怎么通过评审。很多评价都是赤裸裸的物化和功利化,追求及时和短期效用。竞争和评价从来都是存在的,不可避免,也无可厚非。但作为一个培养人的教育机构,竞争的形式和评价的安排应该是以人为本的,应该具有人文的关照和温情,应该有价值和道德的理想,这是一个社会和制度的文明所在。但我们的学生、教师和学校可以说不堪评价之扰,被弄得身心俱疲,且斯文扫地。很多评价的过程、方式方法根本缺乏对人的尊重和关爱,强烈地打击和摧残人的自尊、自信和自我认知。而这些评价又与学生、教师和学校的切身和重要利益关联起来,不是以改进和发展为宗旨,而以筛选和淘汰为目的,根本没办法超脱,也就难以摆脱了,因此就只能甘受煎熬和痛苦,动心忍性。但那种对教育和学术的真正兴趣与热情、追求与抱负其实也随着一次次的评价而黯淡了。中国教育和学术质量的下降与此有很大的关系。

三、教育评价的改进

教育评价的改革已势在必行。评价改革的首要任务是改变评价的目的,尽量少地运用评价结果直接作为人事的决策,而更多用于人的发展、机构的发展和工作的改进。通过评价的工具来发现问题,诊断问题,分析问题,进行激励、预测、规划,获得对人的个性品质、机构的特色等的深刻系统的认识,以便更好地实施有针对性的教育,培养有个性、有特长的人才,建设有内涵、有特色的学校。

评价要把价值放在第一位。先有价值,才有评价。如果没有清晰的价值追求,并将之体现在评价目的、指标、过程和方法上,就不得进行评价。不合乎教育价值的评价要坚决废弃,或置之不理。教育评价要坚持党和国家的教育方针,要坚守教育的理想。

为了使评价客观、准确、有公信力,就一定要遵循评价伦理,评价者一定要负起评价责任,真正做到和做好实质评价,对被评者的本职工作和实际贡献进行评价,同时要大力发展评价科学,广泛开发各种先进的评价技术和工具,以切实提高评价能力和水平。在信息化的背景和条件下,评价应尽量不折腾被评者,而充分借助和运用各种新技术和手段,广泛收集多方面数据和信息,真正形成科学、实证、真实、客观、精准的评价。这样,一方面可以从根本上减少评价,特别是政府组织的评价,把学生、教师和学校从评价解放出来,一方面可以扭转不科学的评价导向,从根本上解决教育评价指挥棒问题,使学生、教师和学校的重心真正落实到立德树人的根本任务上。



原文载于:《清华大学教育研究》第40卷第1期(20192月)