澄海怡美花园:高考试题难度的因素分析及难度控制Y

来源:百度文库 编辑:偶看新闻 时间:2024/05/09 09:29:29

高考试题难度的因素分析及难度控制Ý

 

  张警鹏    郑启跃

(北京教育考试院,北京,100081)

 

[摘  ] 高考试题通过设置问题情境及提出任务要求,实现对考生学科能力差异的测量;而考生对试题的不同反应,是因为个体掌握的学科知识、处理学科情境问题的经验以及心智操作等方面存在着客观的差异。主、客体之间的相互作用,形成了试题的难度。本文借助高考全样本数据统计分析的基础,以新的视角分析影响高考试题难度的因素并予以实证,提出控制试题难度的有关命题策略。

[关键词] 难度因素 学科知识 情境经验 心智操作 难度控制

[作者简介]

张警鹏(1948— ),男,汉族,北京教育考试院高考、高中会考、中考试题评价研究课题组成员,中央教育科学研究所访问学者,湖北省荆州市教育科学研究院研究员,主要从事考试评价研究。

 

“难度”是教育测量项目分析中常用的指标之一,其涵义是被试完成题目或项目任务时所遇到的困难程度。而定量刻画试题难度的量数,就叫难度系数、或称为难度值。实践中,难度系数的大小用平均得分率来表达。

每个试题难度的形成,都有各自具体的原因。但就试题总体来说,造成试题实际难度的直接原因,无非来自两方面:一是源于试题本身,即试题所设置的问题情境及作答任务要求,试题要求高、难度必然大;二是源于考生群体的实际水平,群体水平高、试题难度小。高考各科试题各有特点、考生情况也千差万别,但两者在考试中都归结到一点,即:试题所测量的和考生所表现的,都是学科能力的差异。试题实施对考生中学所学知识、知识的应用、处理学科问题情境的经验、以及心智操作等方面能力因素考查要求的高低,叠加形成了试题的预设难度;考生通过个体特定的心智操作,调动自己掌握的学科知识和所积累的情境经验对试题作答,考生能力的客观差异表现在答案上并得到相应的判分,综合总体得分状况就形成了试题的实际难度。本文以某市高考全样本数据统计分析为依据,探讨和实证分析影响试题难度的因素。

 

一、试题的教学体系知识考点及考生相应的知识掌握程度对试题难度的影响

中学阶段的基础文化课是学科教学体系课程,课程内容主要是学科基础知识和普遍原理,往往被理论化、条理化、抽象化。为了便于学生对知识循序渐进地理解,往往将研究的对象从复杂的背景中隔离出来进行教学分析,于是,本来连续的客观过程被划分成阶段来处理,完整系统的学科知识被分割为各个部分,教学内容与客观实际存在较大的距离。但是,中学教学体系的学科知识,是学生继续学习的必要基础,在高考中被列为重要的考查内容之一。

实证分析例一:2005年某市理科综合卷第II卷第31题:

试题设置为污水处理中培养和筛选能够高效降解某化合物的细菌实验情境,要求能对实验结果和现象进行解释、分析和处理。试题具体的考查点涉及到培养基的类型、微生物的营养与代谢、微生物的培养方法、计数方法以及试验安全等问题。

本题分6个小题设问,各题的难度值如下:

题号

大题

第1小题

第2小题

第3小题

第4小题

第5小题

第6小题

难度值

0.51

0.68

0.64

0.86

0.06

0.03

0.63

本题满分为20分,整体难度0.51,比较适中,第4、5小题得分率较低,使得大题的难度比预期难度大;从整体以及第1、2、3、6小题难度看,考生对微生物营养、代谢、微生物生长规律及微生物培养分离技术等基础知识的理解和掌握较好,对微生物代谢及培养相关的知识和实验操作的掌握情况也比较好。

但从第4、5小题的难度看,难度值过小,似乎试题要求过高。

第4小题设问为:“转为固体培养时,常采用____的方法接种,获得单菌落后继续筛选”。

第5小题设问为:“若研究‘目的菌’的生长规律,将单的菌落进行液体培养,可采用____的方法进行计数,以时间为横坐标,以____为纵坐标,绘制生长曲线”。

可以看到,4、5小题考查的知识是很具体的知识点,答案就几个字,分别为:划线;定期取样,细菌数目的对数。在中学生物课程教学中,基本没有条件做这个实验,学生根据教材学习实验及其操作。学生可能知道实验怎样去操作,可教材上却没有给出这些操作方法的名称。试题要求名词填空,将教学的内容换了一个提法,考生就作难了。

可见,那怕是一个很具体的教学知识点,如某一事实知识、或一个概念名词、或学科词语,如果它在教材、课程内容中是一个细微的、比较偏的知识,它也能够使试题的难度提高。类似的情况,例如2002年全国《文科综合卷》第19题,“20世纪50年代,著名话剧《茶馆》和《等待戈多》的上演均引起轰动。它们的共同之处是”,列有四个选项,主要考查考生的再认、再现历史事实、并通过中西现代文学特征的比较正确把握历史概念的能力。试题难度:0.44。《茶馆》和《等待戈多》的内容在教材上本来都是小字,未列入考试要求范围,多数学生没有关注和掌握这个知识点,尤其是对《等待戈多》较陌生。选项干扰大,考生在总体上表现出很强的随机选择现象。

我国的高考,是基于考生中学所学知识的基础上考查学科能力。所以,教学体系的知识,就是影响高考试题难度最基本的因素。一般来说,涉及低年级所学知识的试题难度来得较小,涉及高年级所学知识的试题难度来得较大。当然也不尽然(典型的例证:小学数学竞赛题对中学生也可能是高难度的)。

教学体系知识主要从两个方向上影响试题难度:一是知识在学科教学中是否常见:考查常见知识、难度较小,考查生僻知识、难度增大;二是知识本身的繁难程度:一般来说,考查“为什么”的知识往往比“是什么”的知识难度更大。

布卢姆从教学目标的角度将知识划分为三个层次,区分为9个类别:第一层次是具体的知识,包括术语的知识、具体事实的知识;第二层次为处理具体事物的方式方法的知识,包括惯例的知识、趋势和顺序的知识、分类和类别的知识、准则的知识、方法论的知识;第三层次为学科领域中的普遍原理和抽象概念的知识,包括原理和概括的知识、理论和结构的知识[①]。试题越是牵涉到对高级知识的考查,越要求考生的知识结构与其相适应。学生各自不同的认知特点和心理特征差异,使得同一试题对不同的考生形成不同的难易,从而形成总体的难度。

 

二、试题的科学体系知识应用考点及考生相应的知识应用能力对试题难度的影响

学习知识的目的是为了应用。应用知识解决实际问题,有时就突破了教学体系对知识划分的局限,一定要符合客观科学性要求。可见,高考试题对知识应用的考查,也就是对科学体系知识的考查。

实证分析例二:2005年某市高考理科综合卷第5题:

运动员在长跑比赛中,会出现呼吸极度困难、腿酸痛,甚至有不想再跑的念头,但是当听到震耳的“加油”声后,却能加速冲刺,其主要调节过程是

A.声音→神经系统→心血管活动增强→促进有氧呼吸

B.声音→神经系统→甲状腺素增高→促进无氧呼吸

C.声音→神经系统→甲状腺素增高→促进有氧呼吸

D.声音→神经系统→肾上腺素增高→促进无氧呼吸

试题设置为运动员长跑比赛背景,试题情境是考生熟悉的,提出问题的落脚点是机体活动中的主要调节过程是什么,要求能用生物学知识对这一运动过程的现象给予正确的解释。考查的知识涉及到:有氧呼吸与无氧呼吸的辩析;过程中是心血管活动增强、还是甲状腺素增高、或是肾上腺素增高。正确选项放在第一个,而且考生都有长跑的亲身经历和体会,可见命题者是不希望本题形成更高的难度。

但是该试题实测所表现的难度很大,难度系数为0.08,实属异常。有关数据及难度曲线如下,数表中分组,是以卷面总分从低分到高分将考生人数等分为1~7组。

 

从数据中可以看到,认定“有氧呼吸”的考生占57%,认定“甲状腺素增高”的考生占78%。选择正确答案A的考生只占8%,是四个选项中被选择最少的。主要问题是绝大多数考生将“出现呼吸极度困难”与“心血管活动增强”两者简单地对立起来。

解答本题应具备的知识背景复杂:当运动疲劳时,“加油”的声音刺激,引起交感神经兴奋,继而中枢神经系统的兴奋作用,使机体处于机警状态,反应灵敏。对呼吸、心血管系统的作用是:呼吸加强、加快,肺通气量增加,心跳加快,心缩力增强,心输出量增加,血压增高,血液循环加快,内脏血管收缩,骨骼肌舒张,全身血液重新分配,保证应急反应时重要器官有充足的血液供应;对代谢的作用是:促进肝糖原和脂类的分解,增加血糖和血浆中脂肪酸的水平,葡萄糖和脂肪酸氧化过程增强,增加组织耗氧量,提高基础代谢率,提供应急状态下对能量的需要。在中学教材中对如此复杂的生理学知识未作详细解释。考生受题干“运动员在长跑比赛中,会出现呼吸极度困难、腿酸痛”的迷惑,就轻易否定“心血管活动增强”,使试题表现得很大的难度。

可见,在科学体系的视野下,知识的应用必须符合科学性,这也是影响试题难度的重要因素。如果知识在科学知识体系中与其他相关知识存在广泛的联系,或者存在一个知识链条的内在逻辑关系,或者应用中必须符合客观的特殊要求、条件化的要求等,难度就来得较大。试题考查科学体系的知识,要求考生对这些知识的理解和应用必需建立在科学性的基础上,要清楚学科知识与实际问题的关系以及各个知识点之间的联系。

从人类科学发现史的进程看,一般来说,先期发现的知识难度来得较小,后期发现的知识难度来得较大。当然也不尽然,有些前沿的科学知识,包括获得诺贝尔奖的知识也可以入高考题。处理得当,其试题难度也不一定大。例如2002年全国理科综合第14题,L-多巴有机物就是牵涉获诺贝尔奖的,全国抽样的难度为0.818;第9题,涉及AG酸度,也是近期由荷兰化学家在美国化学教育杂志上才发表的,该题全国抽样的难度0.875。

费尼克斯曾对科学知识的层次做过分类。他兼用研究对象与研究方法、从量与质两个维度进行综合分类:单一事实的知识、单一形式的知识、一般事实的知识、一般形式的知识、单一规范的知识、一般规范的知识、概括性内容的知识、概括性形式的知识、概括性规范的知识[②]。试题考查的科学知识所表现的层次性,与试题难度正相关。

对不同的学科,由于研究对象以及研究方法的不同而形成不同的学科特征,其科学知识的内容及其形式也存在很大差异:可能更多事实描述性,或理论概括性;社会规则性,或自然实证性;客观实在性,或主观抽象性;事实推理性,或运算演绎性;研究对象边界明晰而使学科知识更显纯洁性,或研究对象边界模糊而使学科知识存在复合性。科学知识的内容及其形式特点,对试题难度有直接的影响。

 

三、试题的学科问题情境及考生的情境经验对试题难度的影响

考生的学科能力,受考生以往处理类似学科问题所积累经验的影响。所谓学科问题情境的经验,是指考生在过去的学习经历中,由主观感觉及体验而得到和积累的处理特定情境下学科问题的感性知觉。经验属于个人的缄默知识,不可言传及编码,但能够告诉考生在解决特定问题时该“怎么做”。

试题情境分为两大类:一类是学科理论性的问题情境,另一类是学科实践性的问题情境。一般而言,长期面对单一问题情境而建构的个体经验结构,将不容易接纳另一类问题情境经验的嵌入。正如存在这样的现象:长期禁锢于书本学习,其动手能力就差;长期通过机械训练来学习,其理性品质就差。

考生以往经历的实践类型越多、体验越深刻,应对当下试题情境的经验就可能越丰富。考试中,面对试题所设置的问题情境,激发考生已有的经验体系,丰富的经验被调动、再现或发生迁移,这有助于考生顺利答题。陌生的试题情境会促使试题难度增大,其主要原因是考生应对新情境的经验不足所致。

为了保证高考对全体考生的公平性,命题一般要避免押题或者非典型的陈题。其实,大多数高考试题设置的问题情境,在一定程度上总是新的,或者试题面孔新、或者所用材料新、或者联系实际新、或者提出任务要求角度新,等等。所以,对考生而言,或多或少都需要借助于经验或者经验迁移来应对试题新情境。经验丰富的考生,俨然象一个解题“专家”;经验单一的考生,就象“新手”一样不知如何下笔。试题也就通过情境设置而检测了不同考生在应对学科问题的经验所存在的个性心理差异。

实证分析例三:2003年全国高考《理科综合卷》的第22题:

本是以K介子衰变为p-、p0的试题背景,考查带电粒子在磁场中的运动和动量守恒的知识。考生选择答案的情况如下表。C为正确选项。

选项

1组

2组

3组

4组

5组

6组

7组

总人数

比率

平均分

区分度

未答

193

123

109

127

95

80

73

800

0.015

127.43

-0.04

A

2052

2853

3634

4260

4667

4490

2914

24870

0.478

146.76

0.10

B

1784

1553

1199

849

567

329

110

6391

0.123

114.02

-0.23

C*

2008

1966

1860

1716

1859

2409

4304

16122

0.310

154.68

0.19

D

1393

933

629

480

243

123

30

3831

0.074

106.62

-0.22

合计

7431

7431

7431

7432

7431

7431

7431

52018

1.000

141.94

 

本题的难度为0.31,属于较难的题。难度曲线表明,卷面总分在180分以下的正确率接近0.25,可以看成是随机选择的结果,从180分以上才摆脱随机概率。在高分层,正确作答的人数逐渐攀升,说明在高分段答题情况与学生学科能力正相关。但是,在第7组高分尖子层中,也有超出40%的学生出现错误,而选项正确的也不排除部分随机成分,还有73个学生没有作答。

应该说,动量守恒是物理中的主干知识,大多数考生是掌握的;本题的物理模型和学生熟悉的沿抛物线飞行的炮弹在最高点炸裂成与炮弹原速度同向和反向两块的模型很相似;学生对带电粒子在磁场或者电场中运动的题型也不陌生。但是,试题给出的基本粒子K及p-、p0是以新知识面目出现的新问题情境。绝大部分考生面对“K介子衰变”及p-、p0这一陌生知识背景下来处理问题,缺乏情境经验。即使一部分非常优秀的学生,由于缺乏这一特定的情境经验,他们面对新知识情境束手无策,影响正确作答,甚至无法思考,只能放弃。这一试题较抽象的新知识背景以及考生情境经验的欠缺,是促成试题难度增大的主要原因。

不同学科问题情境的特点,存在一定差异。例如,语言学科存在人际沟通界面,物理、化学以实验为基础,政治、历史联系社会情境多,生物、地理联系自然情境多,数学界面很抽象。人的个体差异也可能造成不同的经验缺陷。试题情境和考生经验两方面的综合作用,成为影响试题难度的重要因素。

在学习实践活动中,不同的学习情境以及不同的学习方式,会給学生带来不同的直接经验感受,形成不同的情境经验层次。笔者认为,至少可以划分为四个层次:一是对文本采取接受性学习的情境经验,二是对文本采取主动性学习的情境经验,三是采取理论联系实际来学习的情境经验,四是实践体验性学习的情境经验。

当前高考内容改革强调“命题立意要从以知识立意为主转向更加注重能力立意”,试题情境设置更加注重“命题内容进一步加强理论与实际的联系,特别是与现代政治、经济、科技、文化发展的联系”[③],对考生较高层次情境经验的要求更加凸显。以现实背景来设置试题情境,如果贴近学生生活实际,试题的难度较小;如果远离学生生活实际,试题难度较大;如果试题情境表现有区域性、局限性、非普遍性,对不同生活经历的考生会带来不同的难度,也使试题缺失公平。

 

四、试题的心智操作要求及考生相应的心智操作水平对试题难度的影响

考生答题,要通过一系列的心理反应和思维,才能获得解题思路和作答,需要进行“心智操作”。而试题设置本身,就暗含着对考生的心智操作的要求,即考生只有经历怎样的解题过程、实现何等程度的心理活动和思维,才能够形成合适的答案、达到试题提出的任务要求。试题对考生的心智操作要求及考生具有的心智操作能力,是直接影响试题难度的核心因素。

心智操作的智力因素,主要表现为考生的认知活动:个体对问题材料的观察、知觉、联想,展现个人对该问题的“现有发展水平”,形成“最近发展区”;由问题情境而激活自己的已有认知图式,通过对问题情境材料与个人知识的比较,经过一系列同化或顺应作用,产生个体认知结构的解构与建构,形成新的认知平衡;通过对问题信息与个人知识中的相关信息作比较,发生相互作用,形成新的信息组合,从而生成新的意义;在元认知的监控作用下,通过知识及经验的迁移,检索相关的认知策略,逐渐向问题解决的目标逼近。从某种意义上说,认知方面的心智操作与布卢姆提出认知领域的“理智能力与理智技能”有基本相同的涵义。布卢姆将“理智能力与理智技能”区分为五个层次:第一层次为领会,包括转化、解释、推断;第二层次为运用;第三层次为分析,包括要素分析、关系分析、组织原理分析;第四层次为综合,包括进行独特的交流、制定计划或操作步骤、推导出一套抽象关系;第五层次为评价,包括依据内在证据来判断、依据外部准则来判断。后一层次的目标,既可能利用前面各类别所确定的行为,又把它们作为基础。试题的难度与试题所要求的认知操作层次正相关。

心智操作的非智力因素,表现为考试心理状态,它对认知活动的正常进行起保证作用、促进作用;有时也起约束作用、干扰作用。

认知操作靠大脑思维活动实现。试题要求思维活动的链条越长,试题的难度愈大。试题还可能要求有不同的思维形式参与:有的要求更多形象思维,有的要求更多抽象思维;有的需要发散性,有的需要逻辑性;有的要对事实材料进行分析整合,有的要依赖对运算材料进行推理演绎。试题牵涉的思维因素越多、越复杂,其难度就越大。

实证分析例四:2005年北京高考语文卷第四、五大题:

第四、五大题都是考查现代文的阅读理解。第四大题各小题侧重以文本内词语、句子的理解为基础,以文中信息的确认、筛选、整合为手段,检测学生是否读懂了文章,考查考生的逻辑思维能力;第五大题侧重突出了表达技巧的鉴赏和作品思想内容的评价等高端阅读能力的考查,不仅考查考生的逻辑思维能力,还要求考生联系文本内容、通过一定的形象思维、进入文中描写的场景、对文中的母子关系形成情感体验。特别是第五大题的第19、20、21小题,都要求考生有主观意识参与作答,需要考生阅读后产生联想和想象,思维要进入文本表述的生活情境,考查学生读文本后对生活真实地感受、对母爱真切的感悟,对考生心智操作要求更高,试题的难度明显来得大,如下表所示:

题号

第四大题

第五大题

14题

15题

16题

17题

18题

19题

20题

21题

难度值

0.72

0.37

0.46

0.58

0.81

0.30

0.35

0.29

综上所述,试题通过设置问题情境及提出任务要求,实现对考生学科能力差异的测量。而考生个体在所掌握的学科知识、学科问题情境的经验、心智操作三方面都存在着客观差异,对试题表现出不同的反应。主、客体之间的相互作用,形成了试题的难度表达。影响试题难度的因素,既是命题必需考虑的,也是培养学生学科能力的教学过程中必需考虑的。

 

五、试题难度的控制技术

1、试题难度估计

试题难度受多种因素的影响,要求命题专家应该以自己的经验、善于从多个角度对试题难度给予估计。一般来说,大学教师比较善于从学科科学体系及学科发展趋势方面估计试题的难度;中学教师比较善于从学科教学体系、学生思维现状以及练习情况方面估计试题难度。

试题难度是多种因素的综合作用结果。特别地,对不同的试题,考生往往存在一个解题的最大障碍点,这个障碍点越不过去,对试题的应答就受阻。不同试题的解题最大障碍点的表现形式又各不相同,有的是知识点障碍、有的是经验障碍、有的是思维操作障碍;障碍点在解题过程中的位置也存在前端、中段、后端的差异;对选择题,考生有时还不能够意识到解题障碍点,以为自己选择正确、却恰恰是错误。对主观题,考生对解题的知识和思维障碍可能明确一些,但在表达上容易形成障碍。所以,命题者对试题的障碍点要估计准确,才能够准确地估计试题难度。

2、试题难度控制

在编制试题时,对试题难度的控制应注意以下几点:

一是注意试题在整个试卷中的难度定位。不同难度的试题,体现出对不同层次考生的筛选功能。多数试题的难度应该控制适中,入口要低,障碍点逐级设置,难度形成梯度;筛选高端考生,需要较大难度的试题,其解题障碍点可以设置在解题过程的前端;筛选中低端考生,难度应偏小,其解题障碍点可以设置在解题过程的后端;整卷应尽可能形成一个合理的试题难度分布结构,以整卷综合理想难度为中心,理想难度区间的试题比重要大,各级难度的试题都应该有,形成对称钟形分布。

二是根据试题的命题立意,选择合适的难度因素来设置解题障碍点。试题对学科能力结构中各能力因素的考查,应该有均衡合理的设置。比如作文题,主要是考查考生的写作能力,就不易在审题上设置过大的障碍。否则,由于作文试题词语的艰深难懂而影响考生写作能力的表达。

三是在控制难度因素时,要注意不同因素障碍的表现不同:

以学科知识因素为解题障碍点:学科知识因素往往容易成为首要的解题障碍点;比较生僻的具体知识,容易在解题过程前端形成解题障碍点;原理的知识可能在解题过程中段形成解题障碍点。

以学科问题情境的经验因素为解题障碍点:联系实际的经验,往往在解题前端形成解题障碍点,它影响考生对应用性试题的理解、解题建模、解题路径的形成;方法形态的经验可能的解题中段、或后端形成解题障碍点;如果试题牵涉到地域经验、性别经验,由于考生经历、体验的不同,将导致试题有失公平;考生经过练习而积累了的经验,不能形成预期的解题障碍点。

以心智操作因素为解题障碍点;与知识和经验相比较,以心智的认知因素来控制试题难度,是最容易准确估量的,其受偶然性影响更小;编制难度适中的试题,可以将思维操作适度设置在解题过程中,考生能够结合相关知识进行相应的心智操作,考生能力的差异性得以更充分展现;编制难度大的试题,可以延长思维链或者要求多种思维品质参与来实现;编制难度小的试题,取常见知识和试题情境,放低思维操作即可实现;卷面第1、2题的思维操作不宜过难;综合试卷在科目转换之间的试题也不宜设置过难的思维操作。

 

参考文献

[1]臧铁军.学生与考试的关系研究[J],教育科学,1997,3.

[2]臧铁军.综合科目考试与命题研究[M].北京:中国青年出版社,1999.

[3]张警鹏.高考试题对考生认知心理特征差异的测量[J].湖北招生考试(理论版),2004,10.

[4]张警鹏.学科能力建模之高考实证分析[J].湖北招生考试(理论版),2005,6.

[5]廖平胜.考试学原理[M].武汉:华中师范大学出版社,2003.

[6]漆书青.现代测量理论在考试中的应用[M].武汉:华中师范大学出版社,2003.

 



Ý 本文是臧铁军主持的全国教育科学“十五”规划重点课题《综合能力的测量学理沦与技术手段研究》的系列论文之一。文中实例参考了北京市高考试题评价研究课题组的评价分析,在此一并感谢。

[①]布卢姆.教育目标分类学(认知领域)[M].上海:华东师范大学出版社,1986.

 

[②]钟启泉.现代课程论[M].上海:上海教育出版社,1989.123. 

[③]中国考试杂志编辑部.教育部高校学生司司长林蕙青在2003年高考改革培训班上的讲话摘要[J].中国考试,2003,1:6-8.