文摘
随着社会的发展和进步,发生了巨大的变化在教育观念和教学模式与过去相比。面对新的教育理念倡导多元化的教学模式,全面人才培养,传统的固定教学模式下的教学空间是不够的。数字媒体领域的教育是一种教育与信息技术的发展。本文的目的是找出教学空间的建筑形式在新的教育理念,适应社会时代的发展,应对不断更新和新兴教育理念和教学模式。过程如下:根据收集到的教育数据挖掘的具体因素,将影响教师应用能力的数字教育资源,建设多个机器学习回归模型使用这些目的和重要特性预测教师的评分数字教育资源应用能力。通过模型的比较和优化性能,发现了一个更合适的预测方法。MSE,梅、RMSE和日军作为绩效评价指标比较每个模型的性能。发现有多层线性回归<温和的梯度推进<极端梯度推进<随机森林在每个指标。两个集成模型,此外,装袋的想法所代表的随机森林比两个更适合这组梯度增加。
1。介绍
在全面信息化、经济一体化的21世纪,和平与发展是世界的主题。然而,这并不意味着不存在国与国之间的竞争(1]。相反,国家和地区之间的竞争与合作是发生在一个新形式(2]。在当今社会占主导地位的知识经济、人口结构和人口素质的一个国家或地区已经成为最重要的因素之一,限制或帮助其发展3]。人才将成为每个国家和民族的前途和命运是最重要的人力资源在未来的社会。它已成为世界共识(4]。最重要的指标来衡量一个国家或地区的综合国力是科学和技术发展的水平5]。科学和技术的发展是离不开人力资源储备6]。最重要和有效的方法培养人力资源和最大化人力资源睡觉是教育的发展(7]。因此,世界上所有国家和地区的高度重视国内教育的发展8]。虽然国家的发展水平不同,他们都需要教育极其重要的级别和优先发展9]。进入新世纪,国际环境和时代的背景变得越来越复杂和多样化,以及面临的机遇和挑战的国家更加严重(10]。教育和人才培养的重要性更加突出(11]。的轮廓国家中长期教育改革和发展规划指出“信息技术革命对教育发展的影响,必须高度重视。到2020年,我们会建立一个数字化教育服务体系覆盖各级各类学校在城市和农村地区,促进现代化的教育内容和教学手段和方法。“很明显,数字教学已成为当前学校教育发展的必然趋势。
本世纪初,世界上几个主要国家制定新的人才培养策略,以适应教育的未来发展,颁布一系列法律[12]。2002年1月8日,美国总统布什签署了“离开不让一个孩子掉队”的教育改革法案,同时增加了初级和中级教育的预算;澳大利亚联邦教育部还签署了“关于21世纪国家学校”对未来教育改革和教育目标的阿德莱德宣言;同时,对方两个主要的东亚国家面临大海。韩国已制定了“21世纪改革计划”和实施一系列的改革计划对不同教育阶段。教育部、文化、体育、科学和技术的《日本日本21世纪教育新生计划(13]。新教育政策提出的这些国家,显然,初级和中级教育,作为人的终身教育的基础阶段,从各个方面得到了越来越多的关注14]。而不是训练根据工业化大规模生产的需要,在上个世纪,它更倾向于培养全面的人才符合信息社会(15]。随着各种新的教育概念的出现和推广更先进的教学设备,教学方法和课程内容在世界各国也相应改变16]。全面,注重公平的种植,它还强调指导和培养公民的思想道德品质17]。评判学生的标准也更加多样化和目标,而不是盲目地指考试成绩,评价体系更加丰富,考试分数的重要性降低,更强调学生的其他能力超出他们的分数(18]。在当今世界,科技进步日新月异。现代信息技术,如互联网、云计算和大数据正在深刻地改变人们的思维方式、生产、生活和学习。教育工作者的主要任务是对信息技术的发展,促进教育改革和创新,建立一个网络化、数字化、个性化终身教育体系,建设学习型社会,在那里每个人都可以学习在任何地方和任何时间,和培养大量的创新人才。
的通信结构的特点“微时代”已经成为信息社会中的最重要的沟通方法(19]。新媒体的出现,直接影响了教学模式,学习方法,教学方法,以及实际链接的感受和经历在课堂教育从概念的角度和方法(20.]。因此,发生了巨大的变化,并将继续改进和创新的新时代的技术要求。媒体技术的快速发展加快了媒体融合的趋势,与传统媒体正在迅速转变成数字媒体。进入一个新的时代,虚拟现实技术和人工智能已经开始推动新一轮的技术革命(21]。新形势下,高等教育需要培养复合创新型人才满足社会的各种需求。自2006年成立以来,华中师范大学数字媒体技术部门进行了三个改革和创新人才培养和教学模式,以满足新时代的要求对数字媒体人才。在“教与学”的理论,奥苏贝尔,美国建构主义教育家,提出的教学模式“以技能训练为核心,建立面向项目,和任务驱动”(22]。然而,目前的研究表明,通常有明显的应用程序级别的差异教师数字教育资源。由于缺少教师自己的应用程序的能力,使用现有的基础设施和高品质的数字资源开展教育教学活动没有取得好的结果(23]。因此,有必要了解当前的教师水平的信息化应用,特别是有关影响因素的能力应用数字教育资源,并探索如何预测教师在该地区的应用现状,提供干预措施,提高教师的专业发展数字资源和解决区域间资源的应用程序(24]。差异需要考虑。因此,基于机器学习,本文主要分析新的教育概念和教师的能力应用数字教育资源在数字教育媒体。
现有的研究表明,教师会遇到两种类型的阻力将信息技术融入到教学中,即外部阻力和内部阻力。在使用信息技术支持教学的背景下,外部阻力是影响教师的外部因素的行为,比如上网,准备信息技术设备、带宽、技术相关培训,和其他外部环境因素。删除外部阻力时,教师不会有意识地将信息技术融入教学提高教学有意义的影响。这是因为因素与教师的教学理念和知识状态,如教师使用信息技术的态度,自我效能,意图,和其他内部阻力,将成为第二个障碍影响教师的教学行为,这些障碍被称为内部阻力。
2。材料和方法
2.1。新的教育理念在中国的发展
所谓的数字媒体教育是指利用多媒体和网络技术的主要信息资源数字化学校和实现数字信息管理和交流,以便形成一个高度信息化人才培养环境。中国现代教育始于20世纪初。经过100多年的发展,它为社会发展输送了大量的人才和国家建设。然而,由于特殊和复杂的国情,在中国近代以来的历史和社会原因,尽管一些地方试图改革和创新教育,当前中小学教育模型仍然是相对传统的应试教育,而教育水平相对落后。这导致义务教育阶段中的一些常见问题。例如,教学行为的主体仍然是老师,和他们中的大多数是以前填鸭式的教学模式,往往忽略了学生的思维和自主创新能力的培养。教学评价仍然是基于学生的考试成绩,学生的评价也是基于考试分数。因此,传统的教学模式和概念严重限制了我国教育的发展,和学生的合作能力、创新能力、学习能力和道德素质不能发达,他们应该。
在21世纪的全面信息化,社会有了一个新的对人才的定义的理解,和对人才的需求越来越高。传统的单一类型人才不再适合当今社会的发展。对学生素质教育的目的是传授知识,培养他们的综合能力,如学习认知和实践创新,并重视学生的全面发展。基于素质教育的概念,结合一些先进的国际教育模式和经验,中国学者也进行了一系列的研究和探索。到目前为止,各种新的教育概念出现在学校。现代化和开放的教学方法和教学空间也一个接一个地出现。大部分的教学行为所倡导的新的教育理念是教师和学生之间的沟通和互动,放弃以前的单向的知识转移。教学行为的过程中,双方的互动并不局限于教师和学生之间的互动,学生和学生之间的互动是同样重要。与此同时,教学方法也更多样化,更关注不同群体的独特心理状态的学生在不同的阶段。
2.2。数字媒体教育创新的必要性在新时代
与中国经济和技术的快速发展,大众对文化的需求正在增加。在国家“互联网+”战略下,信息技术的深度集成到各领域带来了文化创意产业的发展和机遇也提出了新的要求,在中国数字媒体教育的改革和创新。(1)行业发展的固有的对媒体的创新人才培养的需求。文化和创意产业的繁荣和发展,创新是核心竞争力。时代的“内容为王”,无论是电影和电视等传统媒体,或等新兴新视听媒体直播和在线视频,他们的操作主要依赖于高质量的内容和平台。从激烈的竞争中脱颖而出的高质量的内容来自于富有创造力的媒体人。高校的人才培养模式应该关注国家创新与发展战略和培养当代大学生的创新意识。在数字媒体技术专业作者的学校,除了传授学生的专业知识和技能,教学应进一步培养和打造学生的创新能力。在新的教育环境中,高校迫切需要探索如何整合课程资源构建人才培养模式与创新精神和能力,以适应时代的需求和关注开放、共享、深入和数字集成。(2)学院和大学驱动器的能力培养课程教学方法的变换。的主要内容斯坦福大学2025人计划包括四个方面,即“开环大学”“烙在轴”“适应性教育,”和“有目的的学习。“学术体制改革为重点,教学重点的转移,课程体系的重建,和学习的改革方法,提出了一个大胆的改革理念,强调学生的主体地位,实现个性化教育和独立的教育,整合多学科资源,和培养意识和能力来解决全球问题。学生主修数字媒体技术在华中师范大学成立了一个团队工作方法在学校阶段通过完成工作过程中学习、协作学习和解决问题的能力,锻炼和积累行业经验。此外,全面在课堂上与老师互动,课后通过项目实践有效地促进学生对知识的内化,提高他们解决问题的能力在实践的过程中。
2.3。的现状研究机器学习领域的教育教学
机器学习的研究目的是利用计算机来模拟人类学习活动。这是一个方法,计算机识别现有知识,获取新知识,不断提高性能,实现自我完善。机器学习的研究目标有三种:人类学习过程的认知模型,一般的学习算法,构建一个面向任务的特殊的学习系统的方法。爆炸的教育数据,如何使用大量的教育教学数据分析来达到准确预测和决策支持的新方向思考在人工智能的时代。作为一种重要的方法在人工智能领域,机器学习可以满足教育的需要大数据分析和预测。近年来机器学习教育基于实际数据的应用案例和相关研究在国内外不断进行,并致力于将机器学习技术引入到教育和教学活动。在政策层面,在5月和2016年10月,美国国家安全和技术委员会发布了两份报告,“准备未来的人工智能”和“国家人工智能研究和发展战略计划,”分别指出人工智能研究的实现和推广是必要的。核心技术是机器学习。中国政府也高度重视发展的人工智能技术,如机器学习。2018年4月,教育部颁布的“教育信息化2.0行动计划,”提出了“依靠新兴技术,如人工智能,促进教育的改革模式支持的新技术。“实用领域的研究,许多外国学者开始探索机器学习领域的教育,取得了一定的进步。 Although domestic researchers have begun to use machine learning technology to generate value in the field of education research relatively late but also achieved varying degrees of success. There are also practical applications of machine learning for the group of teachers in this study and the forecasting techniques to be implemented.
3所示。结果与讨论
3.1。常见的回归算法
回归的预测是基于现有数据的新数据。线性回归可以准确地描述数据之间的关系与一条直线,当出现新的数据时,一个简单的值可以预测。线性回归模型很容易理解,非常可判断的结果,有利于决策分析。多层线性回归是研究一个因变量和多个独立变量之间的回归问题,也是一个统计方法确定自变量和因变量之间的关系并给予解释。在回归分析中,当只有一个自变量和一个因变量,自变量将被用作的主要因素来解释因变量的变化,和一条直线可以用来近似的两者之间的关系。这种回归分析称为一元线性回归,和它的公式如下: 在哪里α和β回归系数和吗ε是随机误差项。当有多个独立变量和因变量之间线性关系,回归分析是一种多层线性回归分析,多层线性回归模型是优化的基础上,单变量回归模型,及其公式如下:
其中,n代表的数量解释变量,α和β(我= 1,2 .....n)偏回归系数,ε是随机误差项。
极端的梯度增加,也称为XGBoost,是提高算法的遗传算法,它是基于GBDT的一种改进算法。算法的目标函数如下:
其中,l(Ф)通常是损失函数,凸函数,衡量预测的值之间的差异y我和实际价值y我。损失函数的二阶泰勒展开得到如下:
的公式,一阶导数和吗h我是二阶导数。
这个公式表示如下:
如果叶子节点上的样本集j,然后得到以下公式:
当树结构问是已知的和叶节点的重量吗公式有一个封闭的解的目标函数如下:
XGBoost的好处是,一方面,它支持线性分类和回归,可以加快训练速度和模型训练提供一个快车道。另一方面,XGBoost集叶节点在创建树的学习速率,减少每棵树的成本。降低每棵树的影响的权重模型提供一个更好的学习空间。然而,XGBoost仍然需要遍历数据集的过程中节点分裂。在预分类过程中,不仅特性值,而且存储特性。有很多样品对应的梯度统计指数,所以相对较大的内存消耗。
模型融合,顾名思义,是融合多个模型,也称为整体学习。在解决实际问题的过程中,每一个算法模型都有自己的优点,但它也有一定的局限性。如果多个算法融合在一起,一个学习者比单一模型可以产生更好的性能,不仅可以承受不同算法的优势但也避免单个模型的一些缺陷。因此,在机器学习领域,模型融合的实践是很常见的。常见的模型融合策略包括投票方法,平均融合方法,和学习方法,和整体学习方法包括装袋,提振,叠加。
简单平均法是指直接求和所有多元回归模型的预测结果,然后,计算平均值。融合表达如下:
加权平均是给予不同的权重,通过一些方法不同的模型,然后结合权重与基础学习者的结果,然后计算平均值。融合表达如下:
需要选择有多种方法,根据实际的需要。因为这三个模型的影响,需要融合是接近,不适合选择最基本的“投票方法”融合。它更适合使用加权平均。虽然结果是相似的,总有差异。
随机森林执行根据随机抽样方法,可以建立一个决策森林满足需求,并有多个决策树在这片森林里。决策树是一个基本分类器,一般特性分为两类(决策树还可以用于回归)。构造决策树的树结构,可以视为如果那么规则的集合。模型的主要优点是可读的,分类速度快。因此,随机森林是一个集成由几个决策树分类算法。它的基础是决策树算法,其核心是如何使用随机化的概念来构造随机森林的多个决策树。合奏的算法,该算法的随机森林并不复杂,它是一个更常见的方法在处理二进制分类、multiclassification和回归任务。因为每一个决策树并行独立操作,它可以节省时间和计算开销,这被称为“代表整体学习技术水平的方法。“当然,随机森林也有缺点。随机森林不不断输出结果,如果训练集的数据超出范围,他们变得不可预测的,这有时会导致过度拟合,但没有进一步的研究是本文进行过度拟合的问题。
3.2。模型设置教师数字教育资源应用能力
在这项研究中,来自教师的影响(一级)并不被认为是完全独立的,由于嵌套的数据;即。,teachers from schools (Tier 2) share the school environment, and a two-tier linear model is used as the basic analysis tool. The first layer of equations contains teacher-level predictors, and the second layer contains school-level predictors. If a multilevel linear model is used to conduct cross-level analysis on research objects with multilevel and nested data structures, individual effects and external environmental effects can be separated, and then, the influence of variables at the two levels can be explored separately. Therefore, this paper will construct five models and use the multilayer linear regression model to explore the influence of the school level and the teacher level on the ability of teachers to apply digital resources. Figure1显示了影响因素的假设模型的应用数字教育资源为教师。
零模型如下:
Yij代表了数字资源应用能力的老师我在学校j,β0j代表平均值的数字资源应用能力的老师j学校,这是一个随机误差在教师层面,Yij代表教师的总体平均值数字资源应用能力,μ橙汁是学校的区别j,整体平均值之间的差异是一个随机误差在学校的水平。
每个因素的影响(坡)在模型1和模型2教师应用能力数字教育资源保持不变在学校,和协方差都属于随机效应模型: 在哪里β1j。β10j的偏回归系数的影响因素X1,X2…X10在Yj,分别。的背景模型的基础上,学校的地理位置和在职教师(模式3)都包含在第二级方程作为预测因子。学校信息化培训变量比例的教师校本培训作为预测模型(模型4)检查学校层面因素的影响教师运用数字资源的能力。模型3和模型4都属于非随机变异拦截模型。
4所示。结果分析和讨论
4.1。数据采集和预处理
研究中的实验数据来自两种类型的问卷调查,在“调查问卷的发展中小学教师信息化”和“问卷在中小学信息化”的发展中国家信息化研究行动。学校的决心,总共1579份问卷的中小学省被选中,和超过20000的信息作为本研究的数据集。使用这一系列的问卷调查,以下四部分有用的信息可以收集:第一部分是老师和学校的背景信息,包括性别、教育、教学多年,学校和教师的数量;第二部分是教师的能力应用数字资源,如教师的频率使用各个环节的信息化;第三部分是教师的培训参与,如培训参与的数量、时间、和数量模型;第四部分是培训学校的发展,如学校发展、校本培训的数量,和教师参与校本培训的比例。
在数据挖掘的实现技术,两种算法和目标数据有较高的要求,如果原始数据混合,很难满足实验的要求。通常,教育获得的数据是根据评价目标和评价对象。选择不同的场景和不同维度的数据。因此,它可能发生,最初收集的数据不能直接用于挖掘。因此,必须处理的数据在一定程度上,清洗干净。统一的数据形式,减少噪音,整合高质量的数据,降低开采成本,提高运营效率,获得良好的实验结果。具体的数据预处理过程如图2。
数据清理例程“清洗”的数据填写缺失值,平滑噪声数据,识别或删除离群值,和解决矛盾。主要实现以下目标:格式标准化,消除异常数据,误差校正,消除重复数据。数据集成是指集中所需的多个数据源的集成,形成一个完整的数据集,减少数据混乱和存储不一致,从而提高数据分析和挖掘的效率。在这项研究中,实验的数据提供了两种类型的问卷调查:老师和学校。每个老师填写的名字他工作的学校,每个学校也填写自己的详细名称。老师的个人信息、培训情况、信息化应用情况与背景相匹配和培训学校的工作,从而实现数据的集成。为了确保样品的高质量的数据和挖掘分析结果的精度高,教师未能成功的示例数据对应学校应该取消。
4.2。实验结果和分析
后解决了参数方程,并引入到测试集,性能如图3。预测结果的范围主要在12至16日,虽然上面的部分低于12和16不合身。这也是符合线性模型的特点,毕竟,其目标函数的几何意义是一条直线。
多层线性回归模型使用多层线性回归的优势;也就是说,它不浪费样品和研究个体差异同时确保错误独立性假设是没有违反。多层线性回归的缺点也最单一的机器学习模型的缺点。模型的学习能力远低于整体的学习,和其预测性能相对较弱。数据4和5显示了多层线性回归模型的评价指标。可以看出,整体价值不高,但日军是超过15%。结果表明,该模型的预测效果与最适合的有很大不同。
如果一个单独的整体模型也被认为是一个模型,经常有问题,如数据利用率和较低的预测精度不足,一般而言,融合模型的性能优于单一模型。因此,作者继续提出两个低误差模型融合方法基于机器学习对教师的数字教育资源应用能力预测,以提高预测能力的影响。预测模型的拟合效果和测试集如图6。可以看出,除了小差异,模型的预测结果相对较好。在日军指数方面,基于随机森林的多层组合模型具有最佳性能,所以它验证融合思想的正确性。自日军指示器代表之间的比较,它更接近模型预测价值和实际价值,其残余分布也是最小的,一般来说,基于随机森林的多层组合模型预测的最佳选择方案。
因为它是一个案例显示和分析教师的预测价值的应用数字教育资源应用能力,本文将选择两个培训指标为代表,分析准确识别的可行性低层次教师的培训需求的指标。所得分析结果提供了依据教育管理部门和学校培训项目的设计、人员的规模,确定名单。为了使识别效果更直观,本文可视化显示培训185名中产阶级和底层教师参与区散点图的形式。具体结果见图7。
根据图8可以看出,教师也更积极地参与信息化培训。政府参与和培训小时数的理论知识都是高于平均水平。尽管有轻微缺陷数量的校本培训,每年总时间和数量的模型,差距很小。如果这些方面可以改进,数字教育资源为教师的应用将会大大提高。功能可能会进一步提高。
因此,为了提高数字教育资源的应用,扩大覆盖面的数字教育资源、数字教育资源的内涵建设应该改进。其次,我们应该创造一个校园文化环境,支持教师整合和使用数字教育资源。最后,有必要进行能力培训教师整合数字教育资源,为教师提供一种自我效能在数字教育资源的使用。
5。结论
近代以来,中国的教育哲学一直深受西方国家。在早期的中华人民共和国的成立,教学形式的“课堂教学系统”的前苏联基本上是紧随其后。的基础上模仿前苏联的教育理念和教学模式取得了某些变化根据中国国情和调整。同时,受传统的“就业考试系统”,它发展成为具有中国特色的“应试教育”在以后的阶段。在传统的教育理念和教学模式,教师教学是教学活动的主体,主要是教师单向的集体教学的学生。该方法在教学过程中不是创新,教学内容只有关注学生的文化知识。在很大程度上,教学的目的是,确保下一阶段的入学考试。新的教育理念提倡教育的全面发展,注重学生的发展潜力,尊重个人的主观能动性。在这种教育理念的影响下,出现了大量的新的教学模式。这些教学模式的共同点是教学活动的主体已经从传统的教师学生; information has changed from one-way transmission between teachers and students to multidirectional communication between teachers and students. Among them, teachers’ ability to apply teaching resources becomes very important. Based on the collected educational data, this paper mines the specific factors that will affect the ability of teachers to apply digital educational resources and uses these objective salient features to construct multiple machine learning regression models to predict the application ability score of teachers’ digital educational resources. Through the comparison and optimization of the model’s performance, a more suitable prediction method for the research group was found. Using MSE, MAE, RMSE, and MAPE as performance evaluation indicators to compare the performance of each model, it is found that in each indicator, there is a multilayer linear regression < mild gradient boosting < extreme gradient boosting < random forest. In addition, in the two integrated models, the bagging idea represented by the random forest is more suitable for this group than two gradient boosting.
数据可用性
数据和数据用于支持本研究的结果都包含在这篇文章。
的利益冲突
作者宣称没有利益冲突。
确认
作者想表现真诚的感谢那些技术推动了这项研究。