教育研究国际

在这一页上

文摘介绍材料和方法结果讨论数据可用性的利益冲突作者的贡献确认补充材料引用版权相关文章

研究文章|开放获取

体积2021年| 文章的ID7767935| https://doi.org/10.1155/2021/7767935

比较短的在线测试的答案与单一最佳答案医学生在药理学课程一年

约阿希姆诺伊曼,¹ 斯蒂芬妮Simmrodt,¹ Holger Teichert,² 和乌尔里希Gergs ¹

学术编辑器: 克里斯托Troussas

收到了 2020年2月27日

修改后的 2020年6月17日

接受 2020年12月30日

发表 2021年1月12

文摘

最好的答案(单一选择,SC)是经典的工具用于医疗检查各级教育。相比之下,很短的答案(VSA)可能需要声音比SC先验知识和更深层次的学习,和VSA应提示、猜测是不可能的。因此,在一个基本的药理学课程,我们想比较SC和VSA格式直接最后的课程和一年之后。医学生(n= 211)有一个造型的在线测试。两组随机形成(A和B)。A组的参与者首先给出15单选择(5)药理学问题,此后15很短的回答问题(打开的问题被回答在线和半自动地评估)。非常相似的问题关于学习目标但以相反的顺序给b组。一年以后,大约一半的学生组再次因为同样的问题(AA)或(AB)相反的问题。同样地,B组再次测试的问题(BA)或(BB)相同。SC问题组,AA、AB, B,英航,BB总之比相应的问题容易回答的问题。重复测试一年后同样的学生保留正确的答案增加了1.5分。总之,VSA格式的直接比较的问题更困难的学生回答问题的SC格式,可以想象因为暗示和猜测是消除。知识保留存在重复同一在线检查格式。保留知识较高时开始VSA为随后的SC (B组)两种格式或一个问题格式。这些数据会说更多的使用问题格式至少在药理学考试。

1。介绍

最好的答案(单一选择,SC,一般称为选择性响应格式cf。1])是经典的工具用于医学检查。SC一直深入研究和评估公平地说,快,很便宜的,可靠的;他们觉得很容易站得住脚,在很多研究中,他们都是有效的。然而,SC格式肯定不镜子与某些患者的临床情况,例如,没有五不同药物的选择但一打药物必须选择从[2,3]。提示的是另一个缺点SC格式。此外,20%的正确答案在SC可以简单地猜到了,如果一个人回答五个答案是正确的。此外,SC格式的可靠性很大程度取决于干扰物的表面有效性(四个错误答案如果5给出答案)。可怜的干扰简化猜测甚至暗示,高达50%的正确答案可以猜到了。用另一种方式来评估知识是一篇(通常称为构造响应格式cf。1])。各种各样的论文已经被使用。一种可能性是使用短答案要求一个或三个词的答案(s)(很短的答案,VSA)。很短的答案直觉需要良好的先验知识和更深层次的学习,和VSA格式规则提示和猜测1,4]。此外,问题不需要追求强烈的干扰。因此,一个认为VSA更快、更容易编写医学教育工作者比SC格式(5,6]。从理论上讲,SC提供检索提示,正确的答案是作为一个选项(目标信息),和成功的应试者尽可能多的在熟悉的内容取决于活动内存检索(7]。他们显示使用短生物学文本心理学学生,VSA需要文本处理、真正理解的新文本,而SC可以回答主要基于之前的高中生物学知识(7]。有问题的假设形成性测试应促使学生深度学习,而SC会导致更多的表面或战略的学习(8]。大多数教育工作者可能需要使用测试,促进深度学习在未来的考生。另一个选择,深化学习,研究了自适应测试计算机和被用来提供个性化的测试问题。其他人在家庭医学临床诊断测试比较SC和问题(长串可能的答案是,uncued问题:缩写UnQ)但在纸上表(3]。基本上,他们报道同一主题的高度相关的结果格式:SC和UnQ。他们指出,UnQ总是更加困难,保留一年后是更好的3]。哈雷在我们大学有一个长期的学习兴趣和遗忘,赫尔曼艾宾浩斯,实验心理学的创始人,教导和执行研究在哈雷在记忆丧失和保留9]。其他人都指出了这一点,我们找到合理的测试和测试效果在医学教育应该采用,因为这“被迫”检索稳定或提高了存储的信息在大脑中,这有助于在临床病房,主动检索需要的工作(10]。生产测试(如VSA)导致更好的记忆力随着时间的推移,例如,一个月,比识别测试(SC格式)因为问题需要更多的努力在检索的信息比SC(从内存9,11,12]。测试在医学教育不仅可以被视为中立的工具测量也作为工具来促进知识的获取和保留(10]。

在这里,我们想测试SC和VSA格式交头接耳地在造型的在线考试在基础药理学。此外,我们问的问题一年后,这些相同的学生得到更好的结果,如果我们重复这些在线测试的问题。此外,我们问问题或SC格式更好准备后续的问题或SC格式。增加在内存中是一个有效的研究课题,详细建议,让我们看一看在医学教育10,13,14]。相关也来测试我们准备多好学生为SC因为大多数医疗许可考试SC格式(而不是问题)。

(QR)因此,我们的研究问题如下:QR1, SC格式总是比问题更容易为学生在基础药理学物品吗?QR 2, VSA格式提供了一个更好的准备后续问题以及基本的药理学的SC格式吗?本研究初步结果已发表在抽象形式(15]。

2。材料和方法

医学生(n= 211)的最后一个星期5^th学期(首次被教基本的药理学在这学期通过讲座)2018年2月被给予一个造型的在线测试(图1)。学生的数量大小适合最近工作需求评估研究(16]。我们给学生机会得到加分的在线测试的总结性测试一周后。这样做是,因为在一项研究[17),我们指出,自愿采取在线测试只有20%的符合条件的学生没有一个奖金计划和90%以上奖金计划。这里,87.6%(211)从241年合格的学生进入第一个在线学习,和77.5%(186)从240年在第二个在线测试合格的学生参加了一年之后。也存在同样的观察在形成书面测试,因此它可能是广义的奖金制度总是必要的学生在高等教育参与率的形成性测试(18]。学生们没有意识到同样的问题将得到一年之后(2019年2月)网上测试,因为在前几年,提供了不同的问题在第二个在线测试。这样做是为了保证可比性,为保持提供一种简单的方法来测试他们的知识,甚至测量一个改进的药理知识。我们预期的增加知识第二在线测试在随后的第六个和第七学期医学院药理学的学生暴露更深入地参与研讨会在基础和临床药理学和临床药理学的讲座。

图1

示意图说明研究设计。最初的在线测试(OT)包含30在线问题在冬季学期2017/2018 (WS 2017/2018)在医学院的医学生,Halle-Wittenberg(单一选择,SC或非常简短的回答,VSA)。A和B两组随机形成的。集团是在线提供15种不同SCs(标记为SC 1 - 15 #),然后随后15问题(标记VSA # 16 - 30)。在B组,对在相反的顺序形成:前15问题(标记然后VSA 1 - 15 #),然后随后15 SCs(标记然后SC # 16 - 30)。在冬季学期(WS) 2018/2019, 2018/2019的学生有同样的问题在不同的组合一样。我们写的考试。

两组随机软件形成的伊利亚斯5.1检查后进入学习环境软件(A和B,图1上)。参与者在A组第一次(即15单选择。五,有且只有一个答案是正确的,SC;参见图2样题)问题在基础药理学和此后十五很短的回答(VSA)问题;换句话说,开放式问题被回答在线和半自动地评估了约;小的拼写错误和有效的替代药物的接受,和典型的正确答案是存储在软件(伊利亚斯和StudIP),通过测试的设计者和加速修正测试一年后。为211年或186年学生参与本研究,需要手动评估问题(2018或2019)每年大约三个小时。

有时,不止一个问题的正确答案是可能的(样品图的问题2)。问题以相反的顺序给B组(图1)。测试是由学生家里没有监督。90秒最多在平均分配来回答一个测试项目。这样做是由于在之前的调查中,我们注意到,每项分配更多的时间大幅度增加的正确答案的百分比;我们曾允许六个小时的在线测试(从目前的测试不同的问题),和几乎所有学生回答正确,而相同的试题只允许90秒,只有约60%的测试项正确回答了(17]。如果所有问题都回答正确,没有进一步的统计分析是可能的,因此,本协议使用。在线测试的一个明显的优势所在,总时间为SC或者VSA存储为每个学生、从而可以另外在本研究进行分析。

在线测试的内容是课程的学习目标基本药理学前在线测试。通常,每个讲座建立了两个问题。延伸的内容在整个主题的基础和系统药理学,即药效学、药物动力学、抗糖尿病的药物,药物来减少和刺激甲状腺功能,抗高血压药物,阻滞交感神经的药物,药物,抑制肾素血管紧张素系统,正性肌力药物,抗心律失常的药物、抗生素、抗病毒药物,抗真菌的药物,抑制细胞生长的药物,药物,抑制凝血酶功能或凝固。

2.1。数据分析

平均值和扫描电镜使用Microsoft Excel 2016计算。参数和非参数测试,SPSS 25 (IBM、Ehningen、德国)使用。一个概率值(值)小于0.05被认为是重要的。个别问题的能力区别边际(坏的管理者)的好学生是由大会通过使用之间的歧视与点二列相关指数计算学生的成绩在一个特定的项目和他们的总分数。歧视指数可以秋天−1和+ 1之间,和歧视指数大于0.3表明,最好的学生能够正确回答这个测试项,但较弱的不19]。系数α可靠性估计(克伦巴赫α)计算来衡量学生的成绩的精度。系数α的范围可以从0到1,值越高表明学生的成绩更精确。值接近1表明每个学生可能会达到相同的分数如果readministered类似的测试,而重新测试得分值0表示将随机变化19]。

3所示。结果

平均时间测试中描述表1。所有学生在给定的时间内完成测试。测试时间不是正态分布使用SPSS中的Kolmogorov-Smirnov测试( )。例如,对于测试,2018年次的频率分布是绘制在图3。为了方便起见,我们在这里不过报告平均测试时间算术平均值(表1)。总测试时间是长在B组相比,A组(表1非参数检验:Mann-Whitney测试, )。正确答案的数量在所有组(A或B,图S1)和子组(AA、AB、BA、BB、人物S2)同样不是正态分布,但是按照惯例,为了方便起见,我们这里现在不过算术,但用于比较非参数测试(表1)。总数量的正确答案是不同的SC测试项目之间在A组和B组(图内4, )。同样,正确答案的数量问题组明显不同的群体内部,B, AA、AB,英航和BB(方差分析 )。此外,VSA问题集体更加困难在A组和B组相比SC(表的格式1)。此外,结合所有正确答案,结果更好地比较所有SCs和问题在A和B组AA、AB,英航和BB。

有趣的是,至少有两个影响是发生:当SC是最初(A组),结果是更好的( )比学生给出了SC下半年的测试(B组)。此外,SC测试给更高的分数而VSA测试( )(表1)。一些学习目标通常是正确的回答在A和B两种格式;至少在一个问题,几乎没有什么正确的答案(2%)获得在很短的答案格式,而伴侣最好的问题是正确的回答几乎所有学生(96%)(图4)。

量表的阿尔法措施可靠性总是高于SC格式(交流或B-SC)比VSA格式(A-VSA B-VSA;表1)。高总量表的阿尔法集团A或B相比,它的子组(ASC;A-VSA;或B-SC B-VSA),可能是由于高(30比15,表的项的数量1)。意思是项歧视(图S5)是更好的(高)在SC问题在初始测试(A和B组),在后续的测试中(AA、AB、BA和BB)。

直接比较,平均点(正确答案)在BB低于AA,而没有额外的差异(表获得意义1)。有趣的是,BB总比初始测试相同的设计(表1和数字S1和S2),也就是说,B组。

总分在最初的在线测试(结合A和B)超过第二在线测试(AA和AB和英航和BB)相结合,即达到21分和22.5点(正确回答问题),增加1.5点可以被解释为影响大小约为0.1,表明小尺寸效应。有趣的是,总时间花在问题是高总组(36:25)总共比B组(34:25),虽然得到了更多的点在总组B更密切的格式问题,事实证明,在A-SC组,需要更少的时间比B-SC,但是需要更多的时间比B-VSA组(表A-VSA组1)。一个可能的解释可能是,问题是如此要求的测试,这需要更多的时间来召集的问题比一个测试的开始。同样,在第二个在线测试,VSA部分总是超过SC部分(例如,AA-SC和AA-VSA表1)。BB集团是一个特例:没有改善BB-VSA与B-VSA;或许,学生们已经在他们最大的性能。

图4描述之间的直接比较相同的学习目标(# 1 - # 15),最初回答问题一样SC (A-SC)或(B-VSA)和补充图S3描述之间的直接比较不同的学习目标(15 # 1 - #和# 16 - 30 #)的同一组。SC总之比问题更容易回答,但是配对差异并不大除了问题# 2。事实上,在问题# 2(治疗药物中毒的问题)在SC格式,它只是要求其功能拮抗剂的药物组合需要最长的行为;的问题,明确要求什么时候维生素K至少需要抵消过剂量的phenprocoumon(接受答案,24小时或更多)。问题# 1,# 2,# 3,# 4,# 5,# 6,# 8 # 9 # 10 # 11 # 12 # 13,和# 15组之间有显著差异:从这些对,A-SC比成对B-VSA点# 1,# 2,# 3,# 4,# 6,# 8 # 9 # 10 # 11 # 13,和# 15。成对,B-VSA给更多的点只在问题比A-SC # 5和# 12,可能是因为答案选项分心的学生适当的SC格式。,# 5 VSA格式的主要威胁生命的副作用是询问thiamazole(粒细胞缺乏症)和# 12日有什么影响阿托品在AV节点传导速度(速度的增加)。对# 7之间没有明显差异(如何治疗糖尿病怀孕吗?胰岛素)和# 14(通过磷酸二酯酶抑制支气管扩张剂的行为吗?茶碱)。

直接比较两种格式(要求下半年的第一个测试中,人物116 - 30),其余的学习目标(#)如图4。在七(# # # # 16日18日19日21日# 22 # 23日和# 30)SC的15个问题格式(B-SC),学生获得更多积分比VSA格式(A-VSA)。五双(问题# 17 #,# 24日# 27日和29号),没有差异对指出。这种缺乏差异在某些情况下可以解释为大多数学生可以正确回答问题,他们显然是过于简单(# 20(无环鸟苷的作用机制是什么?抑制核酸合成)和# 27(环丙沙星的作用机制是什么?抑制促旋酶或拓扑异构酶),图4)。然而,在问题# 17 # 24日和# 29日中间困难的问题是,没有理由缺乏差异明显。这可能是由于学习目标(# 16 - 30 #)或疲惫的学生今年下半年的测试。有点出乎意料,问题# 25 (phenprocoumon治疗后凝固因素减少了吗?二世,七,九,X), # 26(由肝素激活蛋白是哪家?抗凝血酶III), # 28(名字青霉素衍生物值得一试β-lactams-forming葡萄球菌?新青二氟氯西林或双氯西林)更经常比SC正确回答问题格式的格式,可能因为干扰太强大了。在图4,我们策划组的问题在这两个部分(A-SC和A-VSA)发生在相同的后续订单:例如,第一个问题# 1 # 16,旁边是第一个问题问题的格式。的目标,例如,# 1和# 16是不同的;然而,很明显,许多问题在随后的格式获得较低的分数比第一个格式(图4)。这似乎与B组第一个格式通常不是比第二个格式要求在相同的相对位置(图4)。

一年之后,第二个测试(图1)给出了补充数据S4和S5。没有明确的SC的照片;在图S4A,很明显,甚至有一个小知识下降问题# 3和# 13增加问题。VSA格式,一年后有一个清晰的知识通常是成对比较显著下降(问题拒绝16 #,# 19日# 21 # 25 #,27日# 29日和# 30日图自己)。只有在问题# 17,增加分数;一年后,其他保持不变。所以问题格式SC后给定的格式在同一测试(A组,图1)不做充分准备VSA格式作为下半年再一年后(AA-VSA)。这可能是由于疲劳或不同的学习目标相比,在# 1 - # 15 # 16 - 30 #。

更高的知识中发现问题的格式如果第一SC格式,然后VSA格式(A组),一年之后,一个从SC(集团)的学习目标最初作为VSA格式(B组)。在这里,总之更好的回答同样的问题,现在对于许多成对的问题(图S4D)。有一个实质性的显著增长知识问题# 2和# 13,而其他人保持不变。显然,最初的问题(B组)准备好另一个SC格式(集团)。

然而,问题似乎,也准备好问题(图S4B)。BA组更好的问题# 5 # 7 # 19日# 11 # 12 # 13 # 14 # 15,但更糟糕的问题# 4,# 6和# 8 A-VSA相比,同样的问题,而没有差别在# 1,# 2,# 3。

问题似乎是重要的顺序;如果SC格式作为第二个格式(图1),这是一个很好的准备第二个答案SC(图S4G);问题# 17 # 28回答更好在测试一年后(BB-SC)比前一年(B-SC),而没有指出其他问题的差异。缺乏增加至少20 #和# 27是因为可以想象这个问题过于简单的放在第一位。然而,总体结果相比更好的问题# 1 - # 15 # 16 - 30 #独立的格式(数字4和S5)。因此,问题# 16 - 30 #可能更困难比问题# 1 - # 15。

VSA格式并准备在一年的时间间隔的原则问题,如果问题是第一个(图S4E)。在这里,作为一个整体,一个在一年后获得知识是一个明显。具体地说,一个增长的问题# 2但减少# 4,没有改变对剩下的问题是注意到。再次,缺少部分增加(但不是知识)的下降可能由于过于简单的问题。

最初给VSA格式,然后第二,SC格式首先,导致结果不是非常不同于第一次给SC然后VSA一年后,SC第二(AB-SC)。在这里,更高的分数被发现只有在问题# 17 # 28(图S4H)。如果最初的SC,一年后VSA (AB-VSA,图S4F),只有一个更高的分数一年后在问题# 7 # 14中,而另一些没有不同的或更低的问题# 1和# 4,一年后(图S4F)。

在图3,这是很明显的问题需要多少时间开始时SC(图3,A组)。这似乎是由于地位不像逆向问题的格式如图3组B组A或B的分布函数和所有子组(A-SC, A-VSA、B-SC B-VSA)如图S1。我们推测,A-SC很容易回答,但是A-VSA更严苛,因为高分很难达到(图S1)。相比之下,在B组,它似乎被逆转:VSA问题比SC(图正确回答S1)。歧视指数有时不同VSA格式、SC格式(图5)。在图5(一个)但不是在图5 (b)、歧视指数VSA明显高于在SC (χ²测试0.05)。在所有成对的问题,问题的歧视指数高于SC一个告诉的例外;问题# 2,正如上面提到的,这是至关重要的只知道氯吡格雷的活性代谢物抑制血栓的形成。这个事实是未知的几乎所有考生(见上图),因此,它不歧视但给随机数。

(一)

(b)

歧视指数在2019年考试给了相似的结果(数据未显示)。通常,歧视比AA-SC AA-VSA指数更高。类似的模式如果出现问题,然后给出SC BB。指数的差异歧视问题组之间AB和BB是重要的(χ²测试 )但不是AB和BA组。相比之下,没有明确的模式明显。对于一些问题,问题显示了更高的歧视指数和一些较低的问题。可以推测,在最初的一个问题,SC歧视更好,但随着衰减和疲惫,VSA歧视更好。除了问题# 13 # 14中非常困难的VSA格式、由不到10%的学生回答正确,这可能很容易解释歧视他们的良好指标。

4所示。讨论

我们觉得很值得注意,获得知识通过给两次的问题是惊人的小;在早期形成的研究(17),我们给医学生写同一SC测试30个问题(18正确答案是及格分数)在基本的药理学课程的开始,并在随后的总结性考试(15周后),这转化为发现进行预测的平均值达到11.5分,平均25.8分在期末考试,一个增加14.3点或124%。我们推测笔试的获得是由于压力更大更高环境:写论文检查,监督老师,所有的学生都在一个演讲厅,所有的学生都坐在中间空着的椅子,不允许学生合作,没有干扰,视觉干扰允许(17]。相比之下,这里的在线测试发生在家里,没有监督,因此,考试是在所有的概率减少压力。另一种解释是,第一个在线测试14周后给出了一个基本的药理学课程;因此,学生开始更好的结果和没有情感挑战失败的可能性比学生们为考试做准备。时间分配不能解释任何差异,因为它是相同的所有测试(每题的意思是90秒)。另一方面,另一些人指出相对小的增长学生的知识即使在较小的时间间隔;在重症监护临床学生旋转最初被给予同样的问题和4周后;32个参与者经历增加考试分基线(由4.6分(65.7)20.)抽象。其他后续设计用于心理学学生;学生被要求阅读电脑屏幕上的文本;然后,学生们首先给九开放性(VSA)问题同样的文本,然后,同样的学生受到九MCQ (SC的四分之一)测试;这里,SC是比问题更容易和量表的阿尔法在VSA高于在SC (7]。

实用的结论从这里我们可以得到什么工作?笔试很可能优越得多,作为造型的工具比在线工具问题获得的知识。然而,通常资源稀缺,因此,管理员喜欢低成本解决方案。因此,有一个小的好处网上测试应在临床教育。其他人尝试新工具来提高智能手机等移动学习适应性测试。可能相关的后续研究分配学生更多的时间进行最初的在线测试,因为时间的增加大大增加的数量正确回答测试(SC) (17]。一年后,一个能给同样的问题但只允许90秒回答。另一方面,测试效果可能是有关在这些条件下;有可能即将到来的第二次测试的知识改善记忆。其他人同样指出,问题所需的响应,如问题,导致更好的分数一年后在模拟医学考试比SC格式问题(21]。

给出的时间相同的学习目标,在两个不同的格式,显示更多的时间需要在第一SC然后VSA (A组)格式的问题。相比VSA然后SC (B组),在这里,两种解释是可能的:学习目标更加困难比B组,A组或VSA准备回答SC更快。这一发现是可再生的这种差异时也存在相同的测试一年后(比较A组和组AA或B组和组BB;图S4)。学生切换到一个不同的格式表现不同:从a组切换到AB的任务更加困难,因为一个长时间被学生回答问题(与AB)。然而,从最初的问题转向一个后续问题导致更少的时间要求(B与BA)和可能VSA准备两个问题、MCQ解释,这不是不合理的。问题的一个缺点是成本手动检查答案。已经有很大进步在自动评估问题(了22]),可能会增加成本,这种方法的有效性。

我们的工作证实了(和扩展工作6,23,24]。医学生总是回答我们nomenclature-SC比VSA问题[6,23,24]。然而,他们评估了所有临床学习目标(表1)(23),而我们在这里关注基本的药理学。在随后的研究中,山姆et al。6)使用类似于我们的方法;在第一组学生,他们给电子60 SCs然后在纸上,60个问题同样的学习目标,在第二组,按照相反的顺序。我们注意到与山姆et al。23),在一些问题,问题表现类似于SC。这种发散找到可以部分解释为不同的协议;我们在一组两组,开始使用SC和其他问题,而山姆et al。23]只用一组,给第一个问题然后SC。通过这种方式,学生们可能会预期SC的合适的回答前面的问题(这个解释已经讨论了在6])。这曾被指出4]。SC一致的反应比描述的问题已经使用纸质考试两种格式(25]。他们指出,更多的不称职的学生获得了大多数的SC型格式和很容易确定的问题类型的格式。使用这种方法,他们指出,结果之间的差异在SC匹配问题和问题拒绝与临床能力的增加,教务主任的差异比在医学生25]。一般的观察,SC的好处是容易,不称职的不是小说,而是可以追溯到赫德(赫德,1932)。然而,山姆et al。6,23,24)不执行后续在线评估在随后的学年像我们一样在当下的工作。我们问了30个不同的问题,而23)只给15个问题(给60 (6)首先是VSA然后SC一样的学习目标。在另一项研究中,他们比较药物处方技能在学生24]。他们想培养学生的PSA(处方安全评价)在英国考试。因此,他们模仿,PSA考试通过询问学生在线给具体的药物,剂量,路线的应用程序和相关的药物相互作用为50个不同临床场景使用VSA风格回答每个问题(2.5分钟)。此外,他们问在SC类型问题五决定哪些药物应用在这种情况下(每题1分)24]。他们指出,学生总是表现好SC的问题(24]。他们得出的结论是,VSA更加可靠、歧视比SC。此外,它们使错误答案的有效点问题可以通过教育者更好地理解,误解获胜,应该在解决剩余时间在医学院或至少接下来的摄入量医学生通过改变课程(19][24]。都支持这一观点的学生因为在的学生进行了一项调查研究中,山姆et al。6)报道,学生们认为问题比SC模拟更接近临床现实。多年前,学生也已经被视为问题更有用的准备比SC病房,当时纸考试进行了研究[25]。在临床设置(OSCE考试),类似的结果:学生表现得更好比书面书面SC问题;当在一个组,同样的学习目标首先测试SC然后问题和在第二组亦然1]。学生自己认为SC格式一样容易VSA格式(1]。

比较组B-VSA和BB-VSA(图1,S4和表1),没有得到正确的答案;这可能意味着学生们已经在他们最好的表演。然而,他们仍然远离正确回答所有问题,怀疑的假设问题准备最好的问题。当给VSA下半年的测试,有获得正确答案从7.73 (A-VSA) 10.1 (AA-VSA、表1),支持学习效果问题(如果从一个低的水平)。令人惊讶的是,SC重复减少正确答案的数量从13.2 (A-SC) 11.8 (AA-SC、表1)。这可能表明SC并非完美的方式来增加强烈的学习目标,但很容易记忆的知识。如果这是重复其他独立组织,这将深深问题我们目前使用的SC在医学教育。

我们研究的一个限制在于,我们不能排除我们的学生作弊。然而,网上给出的测试是所有的学生在同一时间。同时分配给每个测试项目只有90秒。我们不能排除他们使用其他学生的帮助(发短信),研究结果在教科书,或者在线。然而,如果他们这么做,他们很苛刻,转化为一个经典打开书本测试,深入研究并是一个有用的评估工具(审查27])。此外,时间分配太小或者他们的动机是有限的测试结果显示学生之间的巨大差异,也没有学生正确地解决了所有项目。因此,测试是歧视性的,如提供。关于动机的学生在手机测试中,一个有趣的新发明是使用游戏给学生带来测试。

它并非没有优先级,开放式问题可以回答如果标的物符合比SC格式;示例(5]。其他人指出,获得更好的成绩在考试最后一个MCQ如果以前,学习目标被测试在SC格式比简单的上下文无关的回忆MCQ格式(21),支持我们的数据。然而,这些研究人员(21]只有社会科学研究问题处理(人口健康、法律问题、组织问题,道德问题);然而,我们的小说贡献领域完全集中在药理问题和较长的时间尺度(一个月21)和一年(本研究))。其他人发现更高的SC临时相关问题比uncued之间SC期末考试(类似于VSA)和最终的SC期末考试;这个解释SC准备比问题更适合SC (19]。Uncued问题比MCQ更广泛,是由边际边际学生的知识19我们还要注意数据。他们还指出,中位数的值歧视指数更高uncued问题与MCQ类似于我们的发现。这些数据可能会进一步表明,VSA格式比多项选择测试确定边际更有用的学生需要特别的帮助和辅导,建议由其他人(19]。一个问题中使用问题时形成或总结性测试可能是在一个特定的医学院学生很少使用SC的全国委员会准备考试格式。这个问题不是从文献中得到证实。至少比较在一个美国医学院在随后的学术年全国决赛结果(USMLE),这些成绩并不差的学生准备uncued问题与MCQ [19]。

在家网上形成性考试给检测知识的增加他人已发表在医学教育;例如,儿科医生受到(在线)SC格式测试来提高知识保留为儿科医生(随后的研讨会28]。研讨会结束后,参与者被给定的(在线)同一MC问题[28]。结果,保留好(MC的性能测试后车间)如果一个预备考试相比,对照组(执行28]。与我们的研究中,只有五个SC问题是用于进行预测和五种不同的SC问题给出了知识测试时期(28]。改变目前的研究中,我们使用一个更长期时间间隔两个测试(一年)比早些时候的工作(在医学生的心理实验室或诊所),通常情况下,两次测试之间的延迟几分钟使用一个星期(综述(29日,30.])。

总之,我们可以回答的研究问题(QR)在以下方式:QR1,直接比较表明,在基本的药理学,SC比问题要容易得多。QR2, VSA准备比SC后续测试。我们推测,问题形成性测试是有用的为任何类型的考试准备学生在药理学和临床实践。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

作者的贡献

J.N.设计研究;轮,ug,和H.T, performed research; S.S., J.N., H.T, and U.G. analyzed data; U.G., and J.N. wrote the manuscript.

确认

作者感谢PD高山阿斯兰博士,心理学研究所Martin-Luther-University Halle-Wittenberg,哈雷,德国,帮助设计和解释的研究。

补充材料

图S1。点分布在第一在线测试WS 2017/2018组,A-SC, A-VSA, B, B-SC, B-VSA。图S2。点分布在第二个在线测试WS 2018/2019组AA-SC, AA-VSA, BA-SC, BA-VSA, AB-SC, AB-VSA BB-SC, BB-VSA。图S3。成对比较正确答案分布在A-SC组与A-VSA (A)和组B-VSA与B-SC (B)在冬季学期2017/2018。图S4。成对比较组间分布的正确的答案从WS 2017/2018从WS(第一次在线测试)和2018/2019(第二次在线测试)。(一)A-SC与AA-SC;(B) A-SC与BA-SC; (C) A-VSA versus AA-VSA; (D) A-VSA versus BA-VSA; (E) B-VSA versus BB-VSA; (F) B-VSA versus AB-VSA; (G) B-SC versus BB-SC; and (H) B-SC versus AB-SC. Figure S5. Comparison of the distribution of correct answers between all groups from WS 2018/2019 (second online test). (A) Comparison for questions 1–15; (B) comparison for questions 16–30.(补充材料)

引用

即德斯贾丁斯,c . Touchie d·普t . j .木材和s . Humphrey-Murto”暗示的影响在笔试的临床决策:一个案例研究中,“医学教育,48卷,不。3、255 - 261年,2014页。
视图: 出版商的网站 | 谷歌学术搜索
a . s . Elstein”除了多项选择题和论文,学习医学,卷68,不。4、244 - 249年,1993页。
视图: 出版商的网站 | 谷歌学术搜索
j . j . Veloski h . k . Rabinowitz m·r·罗伯逊和p . r .年轻,“ʼ病人不现在有5个选择,“学习医学,卷74,不。5,539 - 546年,1999页。
视图: 出版商的网站 | 谷歌学术搜索
l·w·t·Schuwirth c . p . m . Vleuten和h·h·l·m·Donkers“仔细看看暗示效应在多项选择题的问题,“医学教育,30卷,不。1,44-49,1996页。
视图: 出版商的网站 | 谷歌学术搜索
Damjanov, b . a . Fenderson j . j . Veloski和e·鲁宾”测试和开放式的医学生,uncued问题,“人类病理学,26卷,不。4、362 - 365年,1995页。
视图: 出版商的网站 | 谷歌学术搜索
a·h·山姆,s m ., c . f .衣领et al .,“Very-short-answer问题:可靠性、歧视和可接受性,”医学教育,52卷,不。4、447 - 455年,2018页。
视图: 出版商的网站 | 谷歌学术搜索
y Ozuru,盐水,c . a . Kurby d·s·麦克纳马拉,“比较理解以多项选择题和开放式的问题,“加拿大《实验心理学/ Revue法裔加拿大女子de心理学Experimentale,卷67,不。3、215 - 227年,2013页。
视图: 出版商的网站 | 谷歌学术搜索
d . i -纽贝尔和n . j . Entwistle”学习方式和方法:对医学教育、“医学教育,20卷,不。3、162 - 175年,1986页。
视图: 出版商的网站 | 谷歌学术搜索
h .艾宾浩斯超级das Gedachtnis: Untersuchungen苏珥Experimentellen心理学,Duncker, & Humblot,柏林,德国,1885年。
d·p·拉森,a·c·巴特勒,h·l . Roediger三世,“Test-enhanced学习在医学教育,”医学教育,42卷,不。10日,959 - 966年,2008页。
视图: 出版商的网站 | 谷歌学术搜索
a·c·巴特勒和h·l . Roediger III”测试改善长期保留在一个模拟的课堂环境,”欧洲认知心理学杂志》上,19卷,不。4 - 5,514 - 527年,2007页。
视图: 出版商的网站 | 谷歌学术搜索
m·a·麦克丹尼尔·h·l . Roediger和k·b·麦克德莫特”概括test-enhanced从实验室到教室学习,”心理环境通报与评论,14卷,不。2、200 - 206年,2007页。
视图: 出版商的网站 | 谷歌学术搜索
d . p . Kulasegaram a·c·巴特勒和h l . Roediger III”重复测试改善长期保持相对于重复研究:一个随机对照试验,”医学教育,43卷,不。12日,第1181 - 1174页,2009年。
视图: 出版商的网站 | 谷歌学术搜索
t .木头,“评估不仅驱动学习,它也可以帮助学习,”医学教育,43卷,不。1,5 - 6,2009页。
视图: 出版商的网站 | 谷歌学术搜索
j·诺伊曼,Gergs, s . Simmrodt a·阿斯兰和h . Teichert直接比较简短的回答和最好的医学院学生回答问题的药理学课程,医学教育协会在欧洲,维也纳,奥地利,2019年。
其子a.s.。奥宾,m .年轻、k·伊娃和c . St-Onge”考生群体规模和项目分析健康指导职业教育项目,“学习医学,卷95,不。1,p。151年,2020。
视图: 出版商的网站 | 谷歌学术搜索
j·诺伊曼,s . Simmrodt h . Teichert, Gergs,“问题”在药理学使用在线模拟考试时,医学教育工作者,27卷,不。1,p。S54, 2017。
视图: 谷歌学术搜索
a .丢掉了美国Gergs、j·诺伊曼和j·卢卡斯”量表措施在多项选择题:飞行员在药理学的研究,“教育研究国际卷,2018篇文章ID 8615746, 12页,2018。
视图: 出版商的网站 | 谷歌学术搜索
b . a . Fenderson Damjanov, m·r·罗伯逊j . j . Veloski和e·鲁宾”的美德扩展匹配和uncued测试作为替代多项选择题”人类病理学,28卷,不。5,526 - 532年,1997页。
视图: 出版商的网站 | 谷歌学术搜索
d .著名r·布里奇斯a . Goffi c·李,b . Mema和c·沃尔什附属专业的评估能力的居民急救护理临床推理:效度证据支持脚本的一致性测试,医学教育协会在欧洲,2018年在瑞士巴塞尔。
m·m·麦康奈尔c,位于圣鲁克,m . e .年轻,“学习后性能测试的好处,”健康科学的进步教育,20卷,不。2、305 - 320年,2015页。
视图: 出版商的网站 | 谷歌学术搜索
美国洞穴,i Gurevych和b·斯坦”的时代和趋势自动答案评分,“人工智能教育的国际期刊,25卷,不。1、60 - 117、2015页。
视图: 出版商的网站 | 谷歌学术搜索
a·h·山姆,s . Hameed j·哈里斯和k . Meeran”的有效性非常简短的回答与本科评估最好的回答问题,“BMC医学教育,16卷,不。1,p。266年,2016。
视图: 出版商的网站 | 谷歌学术搜索
a·h·山姆,c . y . Fung r·k·威尔逊et al .,“使用处方非常简短回答问题识别的用药错误来源:两个英国医学院的前瞻性研究,“BMJ开放,9卷,不。7篇文章ID e028863 2019。
视图: 出版商的网站 | 谷歌学术搜索
d . i -纽贝尔,A·巴克斯特,r . g . Elmslie”的多项选择题测试和自由反应测试比较临床能力考试”医学教育,13卷,不。4、263 - 268年,1979页。
视图: 出版商的网站 | 谷歌学术搜索
w·赫德,“比较简短的回答和多项选择测试覆盖相同的主题内容,“《教育研究》杂志上,26卷,不。1、28 - 30,1932页。
视图: 出版商的网站 | 谷歌学术搜索
s . j .二董t, t·拉特克利夫et al .,“比较开卷的,一无所知的考试。”学习医学,卷91,不。4、583 - 599年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
o·m·费尔德曼费尔南多,m . Wan m . a . Martimianakis和k . Kulasegaram“测试test-enhanced继续医学教育,”学习医学,卷93,不。11年代,S30-S36, 2018页。
视图: 出版商的网站 | 谷歌学术搜索
h·l . Roediger和j . d . Karpicke”的力量测试内存:基础研究和对教育实践的影响,“心理科学观点,1卷,不。3、181 - 210年,2006页。
视图: 出版商的网站 | 谷歌学术搜索
h·l . Roediger和j . d . Karpicke Test-enhanced学习”,心理科学,17卷,不。3,第255 - 249页,2006 b。
视图: 出版商的网站 | 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

1166年

下载

950年

引用