文摘
本文利用数据的定量研究高中学生的通用数学自我效能感、焦虑对数学,和他们之间的关系在数学成就。本文的主要目的是讨论可能会丢失的信息的类型,如果潜在的探索性因素分析的有效性和极端的多重共线性问题将解决只删除不做深刻的分析变量。我们还描述了一个方法,将李克特项目问卷的顺序可能代表底层连续变量的变量。我们的研究显示,例如,删除有问题的变量没有深刻分析导致丢失重要信息关于考试焦虑。我们问题的定性分析变量也导致一个意想不到的发现关于之间的关系一般数学自我效能感和数学动机值。
1。介绍
在社会认知理论中,自我效能信念发挥重要作用在学生的学习、数学教育研究已多次证明积极的感知数学自我效能感与数学成绩之间的相关性(例如,1- - - - - -3])。
大多数定量研究学生的数学分析自信使用探索性因素分析(脂肪酸)或类似的方法,通常是基于相关性。尽管如此,很难找到研究的文章,包括讨论的“可分解性”的相互关系。例如,极端的多重共线性是有问题的,特别是常见的数据来自社会科学等领域教育和教学法。然而研究往往缺乏分析多重共线性和可能的后果的严重性删除变量。足够的组间关联变量之间进行电弧炉是至关重要的。但也高度相关的变量(极端的多重共线性)电弧炉是一个问题,因为它让人无法确定每个这样的变量的独特贡献一个因素(4]。如果数据显示极端多重共线性的迹象,一种方法是使用一个量化标准等r> 0.80和删除一个或两个高度intercorrelating变量。另一个问题有关的“可分解性”与大量的组间关联变量的相关性低于0.30。移除这些类型的变量是同样重要的,因为他们将无法集群的因素(4,5]。
研究文章研究使用电弧炉,也讨论数据准备电弧炉,是罕见的,尤其是在相关研究领域自我效能信念。然而,一些研究文章突出的价值处理极端的多重共线性。例如,马什(6提出并讨论之前进行的一项研究[7),检查自我效能之间的关系,自我概念和数学成就。在提到的研究中,这是错误地声称,自我效能感可以预测性能最好。马什(6)解释为什么解释是不正确的指出,自我效能感和自我意识非常强烈相关,标准误差大,置信区间是宽。因此,没有理由认为自我概念和自我效能预测成绩最好的。他们得出结论,研究人员应该非常谨慎的解释结果当极端数据中存在多重共线性。
本文将数据从一个试点研究旨在调查普通高中学生数学自我效能感和焦虑对数学在瑞典在城市学校。数据收集使用问卷组成的一组李克特量表测量上述潜在变量。参与者的反应(N= 79)进行了分析使用,除此之外,电弧炉。
与这篇文章中,我们想要描述和讨论什么样的挑战准备data-especially相关数据的大小是典型didactics-for许多博士研究成功的电弧炉,包括,除其他事项外,面对可能的多重共线性问题,建构效度。更具体地说,我们想调查的优点包括确定问题的深入分析变量在电弧炉,而不是只使用一个量化标准。我们对本文研究问题如下:(1)什么样的信息关于学生数学的帮助下获得自信深入分析变量组间关联系数的低?(2)什么类型的信息对学生数学的帮助下获得自信深入分析高组间关联的变量?
正确地回答这些问题,我们首先开始回忆起最重要的先决条件使用电弧炉成功不久,描述一个理论框架来研究自信展示什么样的挑战研究员通常满足这样的框架内。此后,我们代表我们的方法详细的试验研究。然而,由于本文不是从试点研究报告的最终结果,我们只简要讨论我们最后的因素模型。这个讨论和最后一个因素模型中包含一段后,本研究的结果。
1.1。电弧炉的先决条件
在文献中,有许多好的介绍性文本如何成功进行电弧炉。也适合小型数据例子包括(8- - - - - -10]。此外,当“可分解性”相关问题的相关矩阵,如治疗极端多重共线性和冗余,可以找到一些推荐程序,例如,(5和等多元的教科书11]。然而,我们没有发现完整的指南如何进行共线数据的预处理,可能是因为许多的主观标准。例如,一个启发式是寻找相关性大于0.80和删除一个或多个高度相关的变量(4,5]。然而,这种启发式的问题是两个0.60的相关性可能有相同的效应之一0.80 [12]。除此之外,其余的解释变量理论上必须接地,这使得决定彻底消除相互依赖的变量尤为重要和值得研究。
相关矩阵的行列式评估数据的多重共线性。如果行列式小于启发式0.00001,极端的多重共线性数据是显而易见的,因此,一个高度相关的变量应该被删除。此外,巴特利特的测试可以用来测试如果整体相关性太小了。但是,即使测试统计上显著的,它仍然是必要的识别和移除变量有很多组间关联低于0.30。删除这些变量的动机是,他们可能没有足够的专注为潜在因素(4,5]。
电弧炉或类似方法相关性的基础。最常用的相关方法之一是皮尔逊相关性,这也恰好是最错误的用于社会和行为研究[13]。皮尔逊相关性假设变量(通常是李克特项目)是连续变量(指标)。然而,这preassumption值得商榷,因为序数变量从本质上最好是有序分类变量,使指标假设很有争议。
处理preassumption指标变量的一种方法是使用多分格相关,这是两个正态分布连续潜在变量之间的估计借助两个观察序数变量(14]。多分格相关系数的计算是基于频率表,这在某些情况下还包括零频率的细胞。不过,这个问题可以通过应用连续性校正处理,即。零,取而代之的是少数,如0.5。但存在许多这样的修正导致不稳定的相关性,并与小这个问题尤其常见的数据样本大小(15]。因此,应小心使用连续性校正数据与小样本大小。李克特对象之间的相关性有超过六个反应类别显示几乎相同的皮尔逊相关系数是否使用或多分格相关(16]。因此,使用皮尔逊相关性与普通数据可以讨论(出口的。17])。不过,电弧炉的方法论问题根据皮尔逊相关性顺序数据仍然是(13]。
有关研究小样本大小,例如,在教育和教学论领域,有一个持续的讨论必要的样本量进行足够的脂肪酸。一个普通的“经验法则”,至少需要10参与者/变量(4,5]。然而,教育仍有可能与小样本大小和合理的,因为可靠的评价因子模型,即。,if the factor model is a good recovery of the population solution, mainly depends on the communalities of the variables and the number of variables per factor [18- - - - - -22]。
1.2。理论框架
认为自我效能感被定义为个人的判断“认为一个可以执行的行动需要处理未来的情况”(23]。进一步,数学自我效能感被定义为一个人的信仰对他/她的能力在数学中,即,信心的力量在一个完成一个数学任务的能力。自我效能感的股票和与另一个相似和不同的心理构造,自我概念。自我概念是一个感知自己,自我的生理、心理和社会自我。当自我效能主要关注个体在完成特定任务的能力和关注面向未来的观念,自我概念有更强的社会环境和涉及到的自我判断past-oriented [24,25]。两个构造的一个重要组成部分的整体感知自我(2]。
2。方法
这个研究的数据收集在一个地方高中在瑞典,共有约400名学生。自我报告的问卷是管理在线学生在四个常规的数学课程。调查问卷包括共29五步李克特项目评估被调查者的一般数学自我效能感和焦虑的信念。参与学生16或17岁,他们正在研究在大学入学资格的程序。所有参与者自愿参与了这项研究。七十九名学生,其中包括第一、二学年的学生,选择参加这项研究。女孩的数量是57岁,男孩22岁的数量。
2.1。措施
底层结构的学生一般数学自我效能感和焦虑的信念进行评估之前使用瑞典适应问卷,数学自我效能感和焦虑问卷(MSEAQ)。
MSEAQ已开发的可能(26]。飞行员版本的原始问卷由项目根据研究文献和适应项目从之前的问卷调查旨在衡量数学自我效能感和焦虑对数学。最终版本的项目最终设计会议上承认收到的反馈和一群大学生在一系列访谈的飞行员。最后,可能(26)进行了一项基于数据从109名大学生。13学生采访帮助保留的解释因素。这个领导,例如,这种产品“我相信我可以像数学家一样思考”就是从数据中删除之前最后的足迹,因为学生的采访显示,学生们解释这个项目不一致。然而,在这项研究中,我们选择包括项目的问卷。其他28个项目的原始MSEAQ包括十三个自我效能量表(MSEAQ-SE)和15焦虑量表(MSEAQ-A)。原MSEAQ被认为是高度可靠的内部一致性:对于MSEAQ-SE,αMSEAQ-A = 0.90,,α= 0.91。这些可靠性的估计是基于61名学生的反应。
根据5月(26),进行电弧炉导致一个大五模型:数学自我效能感、焦虑、年级的未来,课堂焦虑,分配的因素。第一个因素代表了一般数学自我效能感(例如,“我相信我能得到一个”“当我在数学课程”),2因子与焦虑对数学成绩(例如,“我担心我将无法做数学测试”),3因素与焦虑有关未来的职业和数学课程(例如,“我感到紧张当我不得不使用数学以外的学校”),4代表课堂焦虑因素(如,“我害怕给一个错误的答案在我的数学课”),最后,5代表能力和焦虑因素来完成你的任务(例如,“我相信我可以完成所有的作业在一个数学课程”)。
表1介绍了翻译的MSEAQ与原来的斜体文字。每个语句之后,五点李克特量表(英语文字斜体):1 = aldrig (从来没有),2 = sallan (很少),3 = ibland (有时),4 =局长(经常),5 = vanligtvis (通常)。在原MEAQ,“没有响应”选项也可用。然而,在我们的研究中,选择是不包括因为学生被认为能够评估数学陈述关于他/她的自信。
当问卷翻译成另一种语言,总有可靠性下降的风险(27这甚至可能提高一个需要改变的因素模型。但是,这种风险可以被分析和解决可能出现的问题通过使用验证性因素分析(CFA)。在目前的研究中,一个相关的问题是可能的五因素模型26适合我们的数据。因此,足协进行了使用lavaan包0.6版本7 [28]在R版本4.0.2 [29日]。一般来说,李克特物品被认为是有序分类。因此,对角加权最小二乘(设计水线)与多分格相关系数和Satorra-Bentler校正实施估计模型参数。五因素模型适合相当(见[30.]截止值),0.989(0.978强劲TLI), TLI虽然RMSEA指数几乎是一个可接受的范围内为0.079(0.114强劲),90%可信区间(0.064,0.094),和健壮的CI (0.106, 0.122)。如果我们旨在报告最后的因子模型,可能的因子模型26会因此需要一些改进分类有一个不错的选择。然而,在这项研究中,上述指标足以表明,在这项研究中使用的物品是足够了。此外,低端(se)翻译数学自我效能感和数学焦虑次生氧化皮(一)被认为是高度可靠的内部一致性:对于自我效能感,α= 0.92,焦虑,α= 0.91。
2.2。数据分析
9%的样本包括缺失值和被认为是失踪完全随机。一个常用的策略是删除缺失值完全(listwise /成对),如果最多10%的缺失值。然而,这种缺失的数据策略常常导致损失统计力量和有偏见的标准错误,特别是如果删除一个大样本的一部分。另一个常用的方法是单一的归责(平均或回归),但这种方法往往导致差异的低估和高估的相关性31日]。处理缺失数据的一种策略是,然而,多个罪名,适用于这些数据使用老鼠版本3.8.0 [32]在R版本4.0.2[多项logit模型29日]。
所有使用统计软件进行统计计算R版本4.0.2 [29日]。高和低多分格组间关联变量选择。更准确地说,多分格相关系数计算使用心理包版本2.0.8 [33]在R版本4.0.2 [29日),和组间关联的相关矩阵是扫描|r|和| > 0.60r| < 0.30。这些物品都进行分析,以确定哪些这些项目的有效性和多重共线性问题。进一步进行定性分析,探索什么样的信息可能会丢失,如果发现有问题的项目从数据中删除。更准确地说,定性的分析集中于调查和比较每一项的内容哪些方面或潜变量之间的关系被覆盖或丢失这取决于项目将包含或者排除的因素模型。
3所示。结果与讨论
在下面几节中,我们目前的结果首先讨论之间的低和高组间关联变量和回答研究的问题,然后描述模型的最终因素。
3.1。低组间关联变量之间
表2介绍了相关矩阵,它表明变量an24有很多低|r| < 0.30变量之间的关联现象。然而,变量an24有一些温和的统计上显著的组间关联,例如,相关变量an6 (r= 0.46),变量an8 (r= 0.36),变量an25 (r= 0.45)。当学生评估an24的声明中,超过50%的学生报告说,他们从来没有或很少担心他们将无法得到一个“A”的数学课程。an24相比,超过50%的学生报告说,他们经常或通常考取好成绩担心,或担心在考试中做得很好。有关变量an25,此外,超过50%的学生报告说他们有时或更频繁地思考该声明“我担心我将不能学好数学课程。“这个结果表明变量an24解释不同取决于学生的抱负时,课程成绩。然而,这也可能是一个指标的学生在数学一般的自信,因为学生考取好成绩担心但不一样得到一个“a”级最高。因此,消除变量an24从电弧炉没有深入分析将导致重大损失的信息与学生数学的自信联系在一起。
表2还包含其他低或nonexisting相关性值得一提。例如,一个可能期望se13变量an24和变量之间的关系,“我相信我能得到一个“一个”当我在数学课程中,“(r= 0.16, )会是负的。变量an24有关数学焦虑,和数学自我效能感变量se13相关,先前的研究已经表明,构造强烈相关。然而,这些数据的相关性不显著。这可以被认为是一个重要的发现,然而将丢失如果变量an24只有标准基于|自动删除r| < 0.30。
然而,变量an24有点问题。因为声明的解释可以发生在许多不同的方式;一些学生不太关注他们的成绩但只有通过课程感兴趣。其他学生认为他们无法获得最高等级,即使他们想要。因此,大多数学生担心被一个年级,对他们来说是件好事,但不是必要的“a”。因此,解释变量an24模棱两可的结果。此外,增高无统计学意义关联变量an24和se13可能表明模棱两可的学生评估的声明:“我担心我将无法得到一个”“在我的数学课程”。因此,我们建议删除变量an24从电弧炉,但学生的观察的这句话含糊的解释有助于了解学生数学的自信。这一发现不可能一直没有深入的分析变量。
3.2。高组间关联变量之间
相应的相关矩阵的行列式是远低于上述启发式的临界值(0.00001),这表明严重的多重共线性问题。因此,相关矩阵是非常高的组间关联扫描。一些有问题的变量被确定,尤其是an24, se21, an22, an17, an2, an8和an26。
表3只显示了关联矩阵的相关性高于0.60。几双变量被确定有非常高的组间关联系数,例如,an26和an2 (r= 0.85),an22和se21 (r=−0.82),an22和an17 (r= 0.79),an2 an8 (r分别为= 0.75)。然而,做出适当的决定有关的变量需要深入分析。
变量an26高度an2和an8相关,因此,简单的过程应该是删除所有三个变量,除了一个。但是,因为所有这些变量是与特定的数学焦虑维度:考试焦虑,消除他们两个也会导致稀缺的描述数学焦虑。关于变量an2和an8,学生们似乎解释变量an2和an8以同样的方式,要求一样的,也就是说。,冗余的变量。当学生紧张的准备数学测试中,它似乎是合理的,学生还担心数学考试。此外,高组间关联an2和an26表明,如果一个学生之间的紧张或紧张的准备考试,他/她可能也担心考试。这些提到的问题在我们的数据显示多重共线性问题。虽然我们也冒着稀缺的考试焦虑的描述,我们建议取消的两个三个变量(an2、an8和an26),即变量an2和an8。
我们的数据表明,学生紧张的准备数学测试更容易担心数学考试,这显示了一个协会之间的感知数学焦虑在准备数学测试和实际采取的数学测试。此外,这可能为未来的研究提供一些线索关于学生考试焦虑的来源。因此,消除高关联变量没有深刻的分析将导致损失的信息学生的考试焦虑。
此外,关于变量an22,超过一半的学生回答说,他们有时或经常担心他们将无法理解数学。鉴于这一点,一个解释变量之间的共线性an22和an17 (r= 0.79)可能是如果学生能够理解数学的担忧,这意味着学生可能也担心是否他或她知道足够的数学成功未来的课程。这个观察可能表明变量an22和an17是冗余的变量。此外,学生可以报告不太担心在未来的课程如果他们正在研究去年强制性的数学课程,因为他们已经决定不参加。这个解释可以说明an17有效性低的变量。因此,连同这一事实与an22 an17高度相关,我们建议删除变量an17电弧炉。
类似的有效性问题,正如上面提到的,担忧变量se21:“我觉得我能够在未来的数学课程,“这也与变量se19(组间关联系数高r= 0.76)。不到一半的学生报告说他们有时或经常觉得自己可以在未来的数学课程。此外,变量se21and an22高组间关联系数(r=−0.82),它还支持的解释变量an17和an22冗余变量。因此,我们建议也可变se21应该从生态足迹。
然而,即使相关性很高,我们有时会得出这样的结论:没有变量应该被删除。例如,让我们考虑se28和se9 (r= 0.75)。此外,se9之间的相关性和se28是正的。现在,大多数学生报告说,他们从来没有或者很少相信他们可以像数学家一样思考,他们从不或很少认为自己一个人擅长数学。这两个项目代表不同维度的基础构造,因为一个人相信他/她自己的擅长数学并不自动意味着同一个人也认为她/他能像数学家一样思考。相关的变量se9和se28都通用数学自我效能感和测量不同维度的一个潜在的构造。尽管组间关联系数很高,我们认为不应该远离电弧炉的变量。这高度相关,而表明学生相信一个人是擅长数学的人也可以像数学家一样思考。因此,学生可能有偏见如何擅长数学,并显示学生对情报(静态的信仰34),因此学生无助的症状对获得优质的数学课程。
3.3。最后一个因素模型
对于读者的兴趣,我们也报告不久我们教育导致因子模型,这个模型如何被发现,考虑到数据收集的初步研究。
首先,已发现的有问题的变量an24、an17 se21, an2, an8从电弧炉。之后,Kaiser-Meyer-Olkin (KMO)测量验证了抽样充分性因子分析KMO = 0.86,这是根据文献“伟大”。所有物品KMO值超过0.74,远高于可接受的最低的0.50 [35,36]。此外,巴特利特球形的测试, ,表明相关性足够大了电弧炉。在这项研究中,并行分析和小石子阴谋被用于因素保留。
小石子图(见图1)显示了一些模棱两可的解释保留多少因素,然而,基于并行分析(见表4);四个因素被保留。以来第四个模拟,计算特征值与实际数据低于模拟数据的特征值计算。进一步,因为这些因素很可能是相关的,因为强大的数学自我效能感和焦虑对数学之间的关系,使用斜旋转。
此外,在因子分析两个变量被排除在外:an11 an3因为较低的公因子方差(0.40)(出口的。8])。重要加载截止0.55 (cf。4,10])。最后一个因素模型展示在表5是使用最小残差法和斜旋转(oblimin)。提出了相应的结构矩阵表6。最后一个因素模型中的保留四个因素可以解释方差的65%(见表5)。
适合衡量因素模型残差平方的总和除以相互关系的总和,而这个因素模型是0.99(值超过0.95表示一个不错的选择4])。除此之外,只有不到50%的因素残差绝对值大于0.05,和因子残差近似正态分布(见图2)。所有这些措施表明一个好的因素模型适合[4]。
物品装载在同一因素表明,因素1代表一般数学自我效能、因子2完成作业能力和焦虑,焦虑因素3对数学课堂设置,和焦虑因子4对评估,我们标签考试焦虑。前两个分量表有很高的可靠性α= 0.89,α= 0.84,课堂焦虑和考试焦虑量表”α= 0.77,α= 0.74。
4所示。结论
我们使用上面的定性标准把物品从电弧炉是基于冗余或低有效性的迹象。冗余问题变量解释同样的受访者,和较低的一个变量有效性似乎并没有测量的目的是什么。例如,变量an24,“我担心我将无法得到一个“一”在我的数学课程,“被撤电弧炉,因为学生们可能会以不同的方式评估项目根据年级他们设置为一个目标。因此,我们得出结论,项目有效性较低。此外,变量an24有很多相关系数低于0.30。因此,如果我们不是已经决定保留变量an24,它可能会麻烦加载到潜在变量。
我们的研究结果表明,重要的信息可以可靠地测量较小数量的物品。例如,尽管两个问题变量相关测试焦虑从电弧炉,考试焦虑是一种有意义的一些意想不到的因素,但可判断的载荷在最后的因素模型。项目“我在数学考试时感到紧张”有最强的加载测试焦虑的因素,但项目“我担心我将无法用数学在我未来的职业需要时”也在相同的加载因子和与学生数学知识的情况下进行求值。此外,项目“数学作业对我来说是紧张的工作”装上这个因素,这可能解释这样的学生主要从事数学作业时开始为考试做准备。
虽然在本研究中我们提出了一个适当的电弧炉基于小样本大小,我们承认,大样本大小通常有助于更好的普遍性(8]。关于目前的数据,更相关的问题是什么使一个样本容量足够的进行分析。答案似乎取决于许多变量代表每个因素和变量载荷和共通性的力量。由文献提到,数据必须强壮,即。,every factor has to be related to, at least, four items with high loadings and high communalities and there should not be any cross-loadings [8,22]。以上最后一个因素模型中提取的因素有项目高载荷。然而,只有前两个因素至少有四项高载荷和共通性。虽然有一些无意义的“cross-loadings”因素模型中,数据可以被认为是强劲的典型的可接受的因素模型。
多重共线性是常见的数据被收集在社会科学的研究。在大多数情况下,它不是作为一个大问题。研究人员只需要应付某种程度的多重共线性。减少多重共线性程度的方法之一是增加样本容量,在大多数情况下降低标准错误。不过,增加发现潜在变量的有效性,重要的是评估的严重性问题变量的多重共线性和作出深刻的分析。无论样本量,极端的多重共线性问题,在最糟糕的情况下可能导致一个模棱两可的因素模型(出口的。6]。)
深入定量研究通常包括使用电弧炉或另一种方法适用于构建和变量代表了潜在的变量。然而,在进行电弧炉,一个预处理的数据需要让数据更适合电弧炉。,包括一个深刻的分析变量之间的相关性和删除的可能有问题的变量。这个过程可以是一个复杂的过程,在许多情况下,需要决策,必须采取主观标准,例如:电弧炉的足够的样本大小是什么?什么量化标准适用于识别变量的来源极端多重共线性?我们在这项研究中表明,没有总目标对这些问题的回答,我们强调定性分析数据的重要性当我们做这种类型的主观决定。
数据可用性
匿名版在这项研究中使用的数据是可用的。
的利益冲突
作者宣称没有利益冲突有关的出版。