当前位置：首页 > 涨幅分析 >赵婷婷　杨翊：大学生学习成果评价：五种思维能力测试的对比分析

赵婷婷　杨翊：大学生学习成果评价：五种思维能力测试的对比分析

2023-05-10 14:56:27

DOI:10.16298/j.cnki.1004-3667.2017.03.11　

摘要　

作为大学生学习成果评价的重要部分，思维能力测试近年来逐渐成为高等教育评价的重要手段之一。选取了目前影响较大、最具代表性的5种思维能力测试——EPP、CLA+、CAAP、HEIghtenTM、GRE，通过对它们的形式、内容、信效度等方面的对比分析，从可操作的研发层面对当今大学生思维能力测试的特点、问题与发展趋势进行研究，以期为研制适合我国大学生特点的思维能力测试提供借鉴和启示。

关键词

学习成果评价；思维能力测试；对比分析

一、问题的提出

　　近年来，大学生学习成果评价逐渐成为各国高等教育质量评价中的核心内容，其主要特色在于关注高等教育的“输出因素”——大学生的学习成效，因此学术界普遍认为它能更直接、深入、有效地反映高等教育质量。大学生学习成果评价的方法有很多种，按照评价主体大致可分为两类：一类是以学生自身为评价主体、主要通过调查问卷等自我报告的形式进行的大学生学习经历、学习投入、对教学的满意度等方面的调查；另一类是以第三方评估机构为评价主体、主要通过考试等客观评价方式进行的大学生学习成果测试，后者因其过程标准、结果客观、更适合院校间比较等特点，近年来逐渐得到高等学校的青睐，仅在美国，近5年参加大学生学习成果测试的高校就达到数千所之多。

　　目前比较有影响力的大学生学习成果测试大多考察学生的一般能力或通用能力（general ability），在这些能力中，思维能力是必考，也是最重要的部分。从1910年约翰?杜威提出“思辨思维”开始，学术界对学生思维能力的研究和测评方兴未艾，美国20世纪30年代开始的进步教育运动更是使思维能力培养的理念深入人心。现在，美国、英国、澳大利亚等国政府已经明确提出思维能力的培养是高等教育的主要目标，各大高等教育机构也都把思维能力列为高等教育最核心的学习成果之一。虽然思维能力培养得到了各方面的重视，但是思维能力的测量和评价却一直是困扰学术界的难题之一，其难点在于：第一，思维能力具有弥散性的特点，它广泛存在于个体的各种能力和行为当中，很难准确、完整地描述其内涵；第二，即便我们能对思维能力的内涵有明确表述，但是这一表述与将其准确测量出来之间，仍然存在着诸多的环节和转化过程。

　　国外在这一领域的研究和积累相对较多，尤其是自教育目标分类学被广泛接受以来，它关于教育目标（从学生的角度理解就是学习成果）分类的基本框架是各项思维能力测试研发的主要依据。在高等教育领域，目前，全球这类大学生思维能力测试已经达到了百余种。它们深具共性，又各有特色、各有侧重，满足不同层次、类型的高校用户和个人用户的需求。我国学者近年来对思维能力测试的关注度日益提高，都建颖、李旭、仲海霞等翻译了国外著名思维能力测试研究学者恩尼斯、费希万等的主要著作；罗清旭、杨鑫辉、赵婷婷等汉化、修订了一些国外著名思维能力测试，如加利福尼亚批判性思维倾向问卷（CCTDI）、EPP批判性思维能力测试等；还有一些学者根据学科特点，以国外著名思维能力测试为基础，改编、开发了一些有学科和行业特色的思维能力测试，如董文改编、开发的护士批判性思维能力量表；也有一些学者通过使用汉化的思维能力测试开展了一些关于教学、学习过程、评估方法等的实证研究。

　　总体来看，关于大学生思维能力测试的研究国内外差距很大，国外的相关理论研究和测试研发比较成熟，但国内的研究仍基本停留在相关理论和测试的引介阶段，还没有针对我国本土大学生学习成果评价的思维能力测试。然而，随着我国高等教育质量评价工作的推进和深入，随着对高等教育质量评价客观性的重视，随着大学生学习成果评价理念日益深入人心，本土大学生思维能力测试研发已成为必然趋势和客观需求。本研究正是基于这样的背景，希望能够从可操作的研发层面，对国际上影响力比较大的大学生思维能力测试进行形式、内容、方法等方面的对比分析，揭示当今大学生思维能力测试的特点、问题与发展方向，以期为推进我国大学生思维能力测试研发提供借鉴和启示。

　　在百余种大学生思维能力测试中，本研究选取了由美国教育考试服务中心（Educational Testing Service，简称ETS）、ACT股份有限公司（ACT. Inc，简称ACT）、美国教育援助理事会（Council for Aid to Education，简称CAE）等机构研发的5种大学生学习成果测试中有关思维能力测试的部分作为研究对象。这5种测试是：大学学习评估考试（CLA+）、ETS水平轮廓考试（EPP）、大学学业水平评估考试（CAAP）、HEIghtenTM学习成果测试组以及美国研究生入学考试（GRE）。其中，EPP和CAAP历史比较悠久，从20世纪70年代大学生学习成果测试兴起开始，这两项测试就已被推出，目前使用这两项测试的院校均有数百所，它们与CLA+一起成为美国院校自愿问责系统（Voluntary System of Accountability，简称VSA）指定的大学生学习成果测试工具；与EPP和CAAP相比，CLA+历史较短，但用户更多，CLA+是目前美国乃至全世界团体用户最多的大学生学习成果测试，在全世界范围内有超过700所高校使用该项测试监控教育质量，它还被经合组织（OECD）选为高等教育学习成果项目AHELO的通用能力的测试工具，而且CLA+全卷均为思维能力测试，其表现性测试部分独具特色；HEIghtenTM是ETS于2014年最新推出的大学生学习成果测试，其理念更新，测试题型也更为多样；如果说CLA+、EPP、CAAP和HEIghtenTM这4项测试主要用于高校教学质量的监测与评估，那么GRE则是另一类型学生学习成果测试的代表，它关注的是考生个体，主要用于大学生个人学习成果评测，与前4种测试相比，GRE是历史最久、参加人数最多的测试，作为美国大学研究生录取的重要参考，全球范围内每年都有众多本科毕业生参加这项测试。

　　本研究选择这5种测试进行对比分析，主要基于以下原因：首先，这5种测试或者是影响力最大，或者是考生人数最多，或者是最新研发，总之它们各有特点，各自满足不同的需求，也是大学生思维能力测试在不同发展时期的典型代表，因此对它们进行对比分析，有助于了解大学生思维能力测试的整体情况；其次，它们由目前国际上研究能力最强的几个高等教育测试研究机构研发，这些机构对思维能力的定义和理解不尽相同，各具代表性，因此它们之间的对比分析可以更好地描摹出大学生思维能力测试的不同点及共同特征，这必将有利于全面把握当前大学生思维能力测试的精髓，以便为我国的相关研究和实践提供坚实基础。

二、各测试的形式对比

　　测试形式是测试的外显特征，它包括测试主体、题目形式、考试形式、分数报告等。测试形式是由测试目的、测试内容等决定的，好的测试设计一定是目的、形式和内容的高度统一。

　　1. 测试面向。测试面向的定位来源于对测试需求的分析。目前，大学生学习成果测试主要面向两类群体：院校团体和学生个人。CLA+、EPP、CAAP和HEIghtenTM的测试主要面向院校团体，但也提供学生个人成绩；GRE主要面向学生个人，不提供院校团体成绩。测试面向的不同是由测试的不同用途决定的，很多大学生学习成果测试如CLA+、EPP和CAAP等最初的研发目的就是为高等学校提供整体办学质量和成效的证据，而不是考察学生个体的发展。

　　只针对院校团体的测试有其自身的特点：①这些测试虽然提供学生个人成绩，但测试结果并不具有选拔功能，对学生个体的意义不大，更注重通过群体表现反映所要评价的内容，因此，学生个体在测试中的参与积极性不高；②这种测试一般都要选取一定数量的样本以反映整体的情况，这会给测试的组织实施带来一定的难度，因此，这类测试在设计上应遵循简化、灵活等原则，而只针对学生个人的测试如GRE等所要关注的问题则截然不同，最突出的一点是，这种测试具有选拔功能，因此几乎不存在学生参与积极性的问题，甚至即便测试成本高昂，依然存在广泛的社会需求。因此，这类测试面对的挑战是如何提高测试的信效度和区分度，以及如何通过保证测试的整体设计过程、命题过程、甚至是组织实施过程的更加严密谨慎，而达到测试结果的可靠性。因此，每种测试在设计之初，一定要明确测试的面向和需求，这样才能有的放矢、抓住重点，提高测试的效率。

　　2. 题目形式。每种测试都由众多测试题目组成，测试题目本身由测试内容决定，但测试题目的呈现形式则要考虑多方面因素，既要受测试内容限制，又要考虑测试主体、测试的组织实施、被测的身心特点等因素。目前大学生思维能力测试的题目以客观性试题为主，其中EPP、CAAP和HEIghtenTM 3项测试只有客观性试题，CLA+和GRE既有客观性试题也有主观性试题。CLA+、EPP、CAAP几项测试中的客观性试题主要为单项选择题；HEIghtenTM、GRE的客观性试题种类更多，包括单项选择题、多项选择题、选词填空等，提问的角度也更为多样。

　　单项选择题是目前所有测试中使用最多的题型，它具有效率高、信度效度好、命题成本小、学生熟悉等优势。但是这种题型由于形式所限，考察的方式比较单一，提问的角度也有限制，这在很大程度上限制了考试的深度，因此更新题型、适当加入主观试题是今后大学生思维能力测试的发展趋势。

　　3．考试形式。纸笔测试、一般的计算机化测试、计算机自适应测试是目前在各种测试中经常使用的3种考试形式。纸笔测试是最传统的测试方式；一般的计算机化测试与纸笔测试接近，只是试题通过计算机呈现出来，被试需要通过计算机进行作答；计算机自适应测试是近年来新发展起来的一种考试方式，它与一般的计算机化测试不同，不仅通过计算机呈现试题，更可以根据被试者的作答情况为被试者选择合适的试题，直至对被试者的能力做出适当的评价为止。

　　在本研究讨论的5项测试中，只有GRE可以支持计算机自适应测试，EPP提供纸笔测试和一般计算机化测试两种形式，CLA+和HEIghtenTM只支持一般化计算机测试，CAAP只提供纸笔测试形式。大部分大学生思维能力测试未采用计算机自适应测试的形式，一方面是因为自适应测试对测试技术要求更高，另一方面也是因为这些大学生学习成果测试需要面向更广大的学生群体，而目前一些大学生还不熟悉计算机自适应测试的方式，这势必会对测试的效度带来一定的影响，从而影响对教育质量成效评价的客观性和科学性。

　　4．分数报告。CLA+、EPP、CAAP、HEIghtenTM和GRE均为标准化测试，其评分程序均遵循给出原始分、等值、转化标准分等步骤进行，因此同一测试不同试卷的成绩均具有相同的意义，可以互相比较。CLA+、EPP、CAAP、HEIghtenTM 4种测试均设有等级标准，考生的成绩可以根据分数所在的等级进行能力解释；GRE不设分数等级标准，考生可以根据成绩报告的百分等级以及ETS公布的平均分数衡量自己在全体考生中的位置。

　　为更准确地评价高校教育质量和成效，近年来CLA+、EPP、CAAP和HEIghtenTM还推出了高校增值分数（value-added）报告。所谓增值分数，是在控制了学生的入学分数后，该校的新生和毕业生在标准化考试上的平均分数差。也就是说，这种计算方法控制了学生入学时的差异，只关注学生在高校学习期间的成绩增值。增值分数是大众化时期高等教育价值增值质量观的具体应用和体现，近年来越来越被视为能直接反映高校教育质量的评价理念及方法。这些测试能够根据高等教育发展的特点和需求，不断更新自己的测试手段和方法，体现了较强的时代性。

　　综上所述，各项测试在形式方面的基本情况详见表1。

表1 大学生学习成果测试思维能力部分的测试形式对比

三、各测试的内容对比

　　测试内容是测试的主体，测试题目、考试形式等都是根据测试内容而设计的。概括地说，测试内容的核心就是回答“测什么”的问题，在确定了测试对象“是什么”以后，如想要测量思维能力、阅读能力、写作能力等，就要根据测试对象的内涵确定测试的考点大纲，如要通过哪些方面来测量学生的思维能力等，然后再请测试专家根据考点大纲设计测试题目，通过试测、修改等环节最终形成考试试卷或者试题库。因此，深入分析测试内容，有助于我们理解和把握各项测试的核心和关键所在。

　　1．测试内容简介。如果相同的测试对象有着不尽相同的测试内容，这首先意味着对测试对象内涵的理解存在差异，这也是大学生学习成果测试有百余种的原因。尤其对思维能力这种抽象的测试对象来说，测试内容的差异可能更大。以下简要介绍本文所提到的5种测试的主要测试内容。

　　EPP测试包括阅读、写作、数学和批判性思维能力4个部分，其中与思维能力有关的是批判性思维能力测试部分，它主要考察4个方面的内容：①在非小说文本中区分修辞与论断；②识别论断，根据提供的信息提出最合适的假设；③推断和理解变量间的关系；④根据所给信息得出有效的结论。

　　CLA+测试，所有部分均为思维能力测试。这项测试虽然没有给出明确的考点，但给出了各个级别的能力描述，从中可以看出这项测试的内容：①熟练级表现出的技能包括：提取主要、相关的信息，界定信息的重要性；识别逻辑缺陷；准确理解量化证据；分辨论断的有效性和信息的真实性；考虑进一步的研究和相反的论点。②精通级表现出的技能包括：从证据中提取相关的信息并做出推论；识别偏见，评估信息的可信度；给出原创和独立的论断；反驳相反的论点来加强论证。③进阶级表现出的技能包括：给出新颖的体现创造性的观点；介绍概念作为或者用以寻找新的证据；识别和理解逻辑和推理过程中的歧义；综合证据得出一个可信的、结构紧密的论证。

　　CAAP测试包括阅读、写作技巧、数学、科学、批判性思维和写作6个部分，其中与思维能力有关的是其批判性思维测试部分。这一测试对批判性思维能力所要测试的考点表述得比较概括和简略，具体为：分析论断中的各种元素、评估论断和扩展论断。

　　HEIghtenTM测试包括批判性思维、数量信息和写作交流3个部分，其中与思维能力有关的是批判性思维部分，主要考察考生的分析能力和综合能力。考察的分析能力主要包括：①评估证据和证据的使用，包括证据本身、使用证据的语境、证据与论断的相关性、证据出处是否合适、可能存在的偏见、证据对论断的支撑程度；②分析和评估论断，包括在不考虑证据的情况下，理解、评价论断的结构；③理解论断的语言表达形式，找出语言上的线索；④区分有效和无效的论断，包括找到无效论断中的结构漏洞。考察的综合能力主要包括：①理解意图和影响，包括识别没有明确阐述、原有论断之外的结论、意图和影响；②给出有效的论断，如展示好的、可靠的推理过程等。

　　GRE测试包括言语推理、数学和分析性写作3个部分，其中与思维能力有关的是言语推理和分析性写作。言语推理部分的主要考点为：①分析一段论述文字并推出结论；根据不完全的信息进行推理；识别作者的假设和视角；理解语言文字的多层次含义，包括字面意义，象征意义和作者意图等。②选出重要观点；区别主要论述、次要论述以及相关论述；总结全文；理解文章结构；③理解词、句和篇章的意义；理解词与词、概念与概念间的关系。分析性写作部分的主要考点为：①用贴切的事理和事例支撑观点；②考察/验证他人论点及其相关论证；③支撑一个有针对性的连贯的讨论。

　　2．测试内容的分析思路和方法。通过对5种测试内容和考点的梳理，可以看出，思维能力在各种测试中的考察内容既有差异也有共同之处。差异之处主要在于不同测试所关注的思维能力侧重点不同，如有的测试着重考察批判性思维能力，而有的测试则重点考察分析性推理、言语推理、综合分析等能力；共同之处则在于，当我们把目光落在具体考点上时会发现，无论把思维能力聚焦在批判性思维能力还是推理分析能力，在具体的考点上都存在着较多共同的表述。我们认为，出现这种情况的原因是，无论何种类型的思维能力，具体到测试的考点上，实际上是将这种思维能力进一步细化为具体的认知过程和技能。换句话说，“理解”“分析”“评价”等是最基本的认知过程，而它们的不同组合构成了各有侧重的不同类型思维能力。因此，如果可以把各项学习成果思维能力测试考点细化到认知过程和技能层面，就可以清楚地对比各项测试的相同及不同之处。

　　本研究采用布鲁姆教育目标分类框架修订版（简称布鲁姆框架）作为认知过程和技能的理论分析框架。概括地说，布鲁姆框架将认知过程维度的教育目标分为从低到高6个层次，它们是：记忆/回忆、理解、应用、分析、评价和创造，各层次下又细分为子类，我们将这6个层次18个子类作为测试内容的分析框架，然后将本研究选取的5项大学生思维能力测试的考点按照布鲁姆框架进行整理分析，以便能够更清晰地梳理出各项测试在内容和考点上的异同。

　　这一研究过程的核心工作是对各项测试的考点进行编码，本文的编码规则如下：考点中明确提及某认知过程，按该认知过程编码一次；没有明确提及但可能用到的认知过程，不编码；同一测试不同考点如考察相同的认知过程，按考点数编码；同一测试类似考点不重复编码；同一测试同一考点不同级别的描述只编码一次。当然，编码工作不能做到完全精确，一是受制于各项测试公布考点的详略程度，二是编码过程属于质性分析，会受到研究者对这些考点理解的影响。但即便如此，通过对结果的统计分析，我们仍然可以清晰地看到各项测试的共性与差别所在。

　　3．测试内容对比分析结果。根据布鲁姆框架对各项测试考点编码的结果分析如下：

　　第一，当前大学生思维能力测试的主要测试点集中在难度较高的认知过程和技能上，即高阶认知思维能力，在“理解”“分析”和“评价”三方面的考点最多（见图1）。具体看，考察最多的是“理解”中的“推断”，“分析”中的“组织”和“评价”中的“检查”；其次为“理解”中的“解释”，“分析”中的“归因”和“评价”中的“评论”；再次为“理解”中的“说明”和“分析”中的“区别”。“记忆/回忆”这一层级难度最低，因此各项测试都没有提及这一内容。

图1 各测试考点分布百分比

　　第二，各项测试都倾向于回避不易考察的内容。“创造”和“应用”虽然属于层级较高的思维能力，但是“应用”被定义为在给定的情景中执行或使用程序，而“创造”被定义为将要素组成内在一致的整体或功能性整体、将要素重新组织成新的模型或结构等，可以看出，这两项思维能力都是很难测量的，尤其通过客观性考试这种形式更难以完成。因此，各项测试都倾向于采取回避态度，“应用”各测试都没有提及，而“创造”也只是被简单提到。

　　第三，各项测试在考点覆盖面上存在很大差别（见图2）。其中，考点覆盖面最多的是GRE，其次为CLA+、HEIghtenTM，而CAAP的考点覆盖最少。GRE和CLA+之所以考点覆盖多，一是因为它们的测试内容更多，时间更长；二是因为有主观题这一形式，这类试题对各项认知能力的考察相对比较全面，特别是在最高层级“创造”上，只有这两项测试进行了考察。

图2 各测试考点数占考点总数百分比

四、各测试的信度、效度对比

　　测试的信度和效度是衡量测试质量的最基本标准，但是目前测试信度、效度的计算方法都极大地依赖参加测试的样本特征。因此基于不同测试样本得出的不同测试信度、效度值在进行对比时会在一定程度上影响对比结果。CLA+、EPP、CAAP是VSA选定的测量大学生学习成果的3项测试，为使参加VSA的院校更好地选择合适的测试，这3项测试的提供者——CAE、ETS和ACT对这3项测试进行了联合研究。在这项研究中，研究者严格地控制了样本的特征和数量，因此得到的信度、效度值也更具可比性。本文这一部分将主要结合这一研究的结果进行分析。另外对于HEIghtenTM和GRE这两项测试，由于HEIghtenTM是新研发的测试，ETS还没有公布其信、效度的研究结果，而GRE主要针对个人，考生人数和复杂程度远高于上述3种测试，可比程度不高，故此处只分析CLA+、EPP、CAAP这3项测试的信效度。

　　1．信度。信度指测验结果的一致性、稳定性及可靠性，是反映测验结果受到随机误差影响程度的指标。测验的信度有多种表示方法，如重测信度、复本信度、分半信度等，此处采用斯皮尔曼布朗分半信度（Spearman-Brown adjusted split-half reliability），信度值一般为从0到1的小数，越接近1代表测验信度越高，内部一致性越好。

　　CLA+、EPP、CAAP 3项思维能力测试部分的分半信度值见表2。从表中结果可以看出，各项测试信度良好，最高的为EPP批判性思维部分，它基于一年级学生样本的信度值达到了0.95；其次为CAAP的批判性思维部分；最低为CLA+的主观题部分，它基于四年级样本的信度值为0.64。总体来看，各项测试基于一年级样本的信度较高，基于四年级样本的信度略低；客观题信度较高，主观题信度略低。

表2 测试信度（院校层面）

　　2．效度。效度指测验能够准确测出所需测量事物的程度。ETS、CAE和ACT主要通过考察EPP、CLA+、CAAP三项测试的相关程度来考察它们的效度。这3项测试的思维能力部分设计比较相近，如果效度较好，那么测试间的相关程度也较高。相关值一般是从0到1的小数，越接近1说明相关程度越高。

　　从各项测试思维能力部分的相关矩阵（见表3）来看，各项测试的思维能力部分相关程度均很高，特别是EPP批判性思维部分、CAAP批判性思维部分以及CLA+客观题部分的相关系数达到了0.93；EPP批判性思维能力部分与CLA+主观题部分、CAAP批判性思维能力部分与CLA+客观题部分的相关系数也超过了0.8；最低的CAAP批判性思维能力部分与CLA+主观题部分的相关系数也为0.79。可见，各项测试思维能力部分相关性较高，效度较好。

表3 测试间的相关值（院校层面）

　五、结论与启示

（一）研究主要结论

　　通过以上对CLA+、EPP、CAAP、HEIghtenTM和GRE这5种测试的对比分析，本研究得出如下结论：

　　1. 各项测试对大学生思维能力的理解和评价不尽相同，既体现了这一研究领域的复杂性，也为未来这一领域的研究提供了广阔的空间。应该说，目前人类对人脑思维的研究还有很多未解之谜，人脑的思维过程仍然是个尚待开垦的“灰箱”，这给思维能力的评价带来了一些困难。但是，正像前面提到的那样，即便对思维能力有明确的认识，但要将其准确地测量出来，还需要进行深入研究。因此，我们不能坐等脑科学、神经科学等的研究结论，积极的态度还是要在现有基础科学研究成果的基础上，开展教育评价的研究工作，探讨思维能力评价和测量的理论、规律、方法及途径。不同国家、不同高等教育机构可以从自身对思维能力的理解出发，根据不同的测试目的、测试主体、测试实施条件等研发自己的大学生思维能力测试工具，提升对高等教育质量尤其是大学生学习成果评价的客观性和科学性。

　　2. 现有大学生思维能力测试的考点比较集中，在某些高阶思维能力的测量和评价方面相对比较成熟，但在另一些方面则尚需提升。依据布鲁姆框架，我们发现，本研究选取的这5种大学生思维能力测试的考点主要集中在“理解”“分析”和“评价”这3个方面，而对“应用”“创造”等涉及较少。我们认为，这主要和这些认知过程的特点、测试手段的特性等有关，如“理解”“分析”和“评价”等这些认知过程相对比较适合在以文本为载体的材料及活动中测量出来；而“应用”和“创造”则相反，这类认知过程很难通过文本测试来评价，它们更需要依靠实际的活动来展示。这也是目前以文本考试为主要形式的大学生思维能力测量方式固有的局限。因此，未来如何拓展思维能力测量的方式、如何在实践活动中评价学生的思维能力等问题，仍然需要进一步深入研究。

　　3. 大学生思维能力测试朝向更加灵活、更多考虑用户需求的方向发展。从根本上说，这是用户需求不同的体现。测试作为一种高等教育质量评价的手段，它的生命力在于用户的体验和认可，它具有市场性，应该分析用户的需求，激发用户使用这些测试工具的积极性。这也是近年来很多测试提供学生个人报告的原因，因为这种方法可以激发考生的考试动机，从而有效地降低学生动机不足对测试结果的影响；还可以切实帮助考生改善学习，为他们找工作和升学提供佐证。

（二）对我国的启示

　　1. 应树立科学、客观评价高等教育质量的观念，进一步加强大学生学习成果尤其是思维能力评价的研究。世界各国的高等教育机构早已形成共识：在知识爆炸的今天，培养学生的思维能力远比教授知识更为重要。思维能力是一个人的核心竞争力，提高大学生的思维能力是高等教育的主要目标之一。但是，思维能力的培养在我国高校中并没有得到应有的重视，随意性强，经常被忽视；同时大学生思维能力的评价更是一块尚未开垦的领域，教育教学是否促进了学生思维能力的发展等，更多依靠教师个人的经验判断，鲜有客观、科学的测量手段和工具。当前，我国高等教育质量评价正在向纵深化、客观化、科学化方向发展，大学生学习成果评价的理念日益深入人心，对大学生学习成果包括思维能力的评价研究势在必行。

　　2. 大学生思维能力评价和测试要基于本土高等教育及学生特点。由于人的思维过程离不开语言和文化，因此,研发本土化的大学生思维能力测试就显得十分必要。我们在EPP（中国）批判性思维能力测试的汉化过程中深刻地体会到，国外测试版本在本土存在着文化适应性问题。因此，我们认为，应提倡高等院校、高等教育研究机构以及第三方评估机构开发适合我国高等教育国情的大学生学习成果思维能力测试，以帮助高等院校了解自己的教学水平，也帮助学生对自己的能力有更清楚的认识，从而有针对性地提高教育质量。　　

赵婷婷，北京航空航天大学人文与社会科学学院教授，北京　100191；杨翊，北京航空航天大学人文与社会科学学院博士研究生，北京　100191

原文刊载于《中国高教研究》2017年第3期第49-55页

点击识别二维码订阅《中国高教研究》

点击识别二维码关注中国高等教育学会

赵婷婷　杨翊：大学生学习成果评价：五种思维能力测试的对比分析

大家在看

友情链接

赵婷婷 杨翊：大学生学习成果评价：五种思维能力测试的对比分析

大家在看

友情链接

赵婷婷　杨翊：大学生学习成果评价：五种思维能力测试的对比分析