文摘

针对高冗余和集成速度慢的问题在现有的教育资源数据集成方法,一种新的幼儿园语言教育资源整合方法基于元数据仓库的设计。元数据仓库设计,和综合数据库的优点进行了分析。在此基础上,幼儿园语言教育资源分类的样本数据的帮助下成本矩阵,和不同类型的约束分类的数据收集器集。幼儿园语言教育资源设置通过使用随机森林算法完成数据收集的学前语言教育资源。幼儿园语言教育资源的数据进行处理,并计算数据的融合边缘函数。在此基础上,幼儿园语言教育数据中的冗余数据资源特点与话语的帮助下,和冗余数据删除完成数据预处理的学前语言教育资源。我们确定维度之间的距离幼儿园语言教育资源数据和完成幼儿园语言教育资源数据的聚类集成的帮助下模糊均值聚类算法。实验结果表明,本文设计的集成方法可以减少集成数据的冗余,并集成速度快。

1。介绍

语言学习的早期阶段是人类语言的关键时期萌发。语言学习的习惯形成了这一时期将会影响人们的生活。作为人类交流的重要工具,资源数据在语言学习的过程中产生关键的影响。幼儿园语言教育资源是第一语言资源,孩子们接触到他们的学习。这些资源的表示和理解起着关键的指导作用在儿童的成长1]。数据在幼儿园语言教学材料的数量扩大随着电子信息技术的进步;然而,有各种数据类型,和鱼眼睛错误珍珠(2]。语言教育在早期阶段的重要性不能被夸大。因此,促进教学质量的材料有利于儿童的语言习得。因此,目前在这个领域的研究关注幼儿园语言教学的成功集成材料(3),删除不必要的信息从数据来增加它的实用性。不同的方法已经被测试,并取得了一些结果。肖(4)提出了一个基于智能数据采集和教育信息融合方法处理。这个方法首先代表相关的教育数据,然后根据不同特点的数据映射关系,构建教育门徒软件数据库的信息,最后有效地融合教育资源数据的语义信息。这种方法提高了教育资源的信息融合的速度,但数据的冗余,数据融合是不考虑。王等人。5)提出了一个基于机器学习为微型数据库并行集成解决方案的数据集。这种技术使用了贝叶斯算法来生成一个先天的独立假设相对无关的数据,然后分类有效的教育资源数据。它检查数据的波动性特征基于分类和利用MapReduce并行处理来完成教育的集成数据。这种技术有最小的综合数据冗余和提高资源的质量数据,但操作过程是困难的,有一定的局限性。

为了弥补上述方法的缺点,本文设计一种新的幼儿园语言教育资源整合方法基于元数据仓库。该方法的主要技术路线如下。

步骤1。设计元数据仓库和分析的优势改变集成的数据库。

步骤2。分类的样本幼儿园语言教育资源数据的帮助下成本矩阵,设置约束不同类型的分类,并设置学前语言教育资源数据收集器与随机森林算法完成数据收集的学前语言教育资源。

步骤3。执行一致性处理数据的学前语言教育资源和使用边缘函数来计算数据的融合。

步骤4。在此基础上,描述冗余数据特征在幼儿园语言教育的帮助下数据资源的话语,删除冗余数据,并完成数据预处理的学前语言教育资源。确定维度之间的距离幼儿园语言教育资源数据和完整的学前语言教育资源数据的聚类集成的帮助下模糊均值聚类算法。

第5步。进行实验分析。

2。元数据存储和数据集成的学前语言教育资源

2.1。元数据仓库分析

本文调查的使用云数据仓库技术集成的幼儿园语言教学材料。因此,元数据仓库的目的是将学前语言资源数据存储在云数据仓库的数据库学前语言教育资源整合。有必要提取学前语言教育资源的元数据,存款的元数据不同的学前语言教育资源按照一定的教学需求,并将沉淀的数据存储在以改善学前语言教育资源和数据信息的收集这些资源数据仓库的元数据(6]。通过优秀的集成检索学前语言教育材料,在本研究中建立的元数据存储库提供数据服务幼儿园语言教学。

元数据仓库是一个有效的方式实现学前语言教育资源的整合。它的关键作用是存储各种基本的学前语言教育资源元数据信息(7]。其存储的实现流程如图1

元数据仓库主要包括收集、存储和集成的学前语言教育资源数据。通过提取这些数据和集成学前语言教育资源通过设置特定的接口,它支持检索和各种形式的展示学前语言教育资源。存储库支持主流关系学前语言教育资源数据和学前语言教育资源的标准数据通过索引存储。幼儿园语言教学资源数据收集、预处理,最终纳入元数据仓库在后续研究中增加应用程序的影响幼儿园语言教学资源数据(8]。

2.2。数据收集的学前语言教育资源

基于学前语言教育资源的元数据仓库设计上面,为了整合集成学前语言教育资源数据到数据库中(9),首先,我们需要有效地收集幼儿语言教育的资源数据,把收集到的资源数据作为研究的基础,实现方法的研究。因为有许多类型的幼儿园语言教育资源数据和复杂的数据量,这些相关数据分类数据收集前幼儿园语言教育资源减少数据收集的困难(10]。

数据分类的学前语言教育资源,首先,学前语言教育资源的数据样本分为一个类别的成本通过成本矩阵,即最小化预期的代价值(11]。根据的基本原矩阵,一个任意的学前教育资源数据样本分为预期成本 类的j收益率, 在哪里 代表幼儿园语言教育的可能性,任何样本资源可分为类j物种发生。(1)在确定学前语言教育资源数据的概率将会分裂,分裂的约束。满足条件后,分类合格幼儿园语言教育资源数据(12),和一组约束如下。条件的幼儿园语言教育资源数据将被分为积极类 在哪里 代表了积极类学前语言教育资源和系数 代表了概率估计系数。(2)幼儿园语言教育资源数据的条件分为消极类设置 在哪里 代表了数据资源转换系数和 代表比例的范围分类,该值为[0,1]。

在确定上述分类学前语言教育资源的约束,需要平衡分类学前语言教育资源以确保数据资源集合的有效性13]。资源数据平衡的计算公式 在哪里 代表积极类数据的先验概率的原始数据初始学前语言教育数据, 代表了先验概率(14负类的数据在最初的学前语言教育数据,和c代表了数据平衡因素。幼儿园语言教育资源数据的有效分类过程如图2

数据分类的基础上,通过有效的积极的和消极的数据集合,presecondary语言教育数据被发现。在数据收集中,数据在收集不同类型的数据集随机森林。通过多种训练的数据在不同类型的数据集15),构造数据收集器完成数据收集,即: 在哪里 代表学前语言教育资源数据收集器, 代表单个碱基收集器, 表示目标数据采集和参数表示函数集合。

首先,幼儿园语言教育资源数据的样本分类使用成本矩阵,并建立了多种形式的分类的限制。在此基础上,对幼儿园语言教育资源的数据收集器,设置和数据收集的学前语言教育资源使用随机森林方法完成。

数据收集的学前语言教育资源,首先,学前语言教育资源数据的样本进行分类的帮助下成本矩阵,和不同类型的分类设置的约束。在此基础上,幼儿语言教育资源的数据收集器设置通过使用随机森林算法完成数据收集的学前语言教育资源。

2.3。数据预处理的学前语言教育资源

有各种各样的重复数据的集成和粒度信息相互矛盾的上述获得学前语言教育资源数据(16]。提高研究的有效性的方法在这个工作中,应适当预处理学前语言教育资源数据。根据上述教育资源数据的融合,这是需要过程的教育资源数据持续提供合适的数据集成。介绍了边缘函数控制教育资源数据的融合(17),即: 在哪里 代表了边缘功能, 代表的意思是功能, 表示程度的教育资源数据的融合。

边缘函数可以提高学前语言教育资源数据的可靠性,但泛化误差需要进一步改善,即: 在哪里 代表学前语言教育资源数据的概率存在的空间。

在解决学前语言教育资源数据的一致性,需要删除冗余信息教育资源数据(18]。幼儿园语言教育资源数据的粒度生成过程是一种造粒过程。在造粒过程中产生的冗余数据成为影响集成的干扰数据。这时,生成的冗余数据被视为一个宇宙19在一组空间和四倍,即: 在哪里 代表了教育资源数据的冗余数据属性值, 代表冗余数据的价值领域, 代表函数的信息。

在这个时候,任何教育资源数据的冗余表示在这一领域(20.)是 在哪里 代表了冗余数据库和U代表函数的信息。

教育资源的冗余数据反映的数据公式(10),这种类型的数据被获取 在哪里 代表了处理结果, 代表冗余数据的特性,数据删除比率

在幼儿园语言教育资源数据的预处理,首先,学前语言教育资源数据的一致性处理,由边缘函数和数据计算的收敛。在此基础上,借助话语,冗余数据特征在学前语言教育数据资源特点,和冗余数据删除完成数据预处理的学前语言教育资源。

2.4。数据集成的学前语言教育资源

基于上述预处理后的学前教育资源数据预处理、数据有效地集成。在集成,首先,它是必要的,以确定学前语言教育资源数据之间的空间距离。这个距离是有利于的有效测量数据集成和提高集成方法的速度21]。

设置数据集的学前语言教育资源 在哪里 代表的完整空间维度值学前语言教育资源和年度数据D代表了约束信息的集合。

然后,教育资源数据集数据集随机选择生成子空间(22]: 在哪里 代表了随机子空间的特征值。

此时,距离(23]subspatial维度之间的学前教育资源和教育资源数据的数据 在哪里 代表了子空间中相似的数据集和 代表了约束。

后确定维度学前语言教育资源数据的距离,类似的数据有效地聚集。本文完成了幼儿园语言教育资源数据的聚类集成的帮助下模糊均值聚类算法。该算法是软聚类算法,它取代了相同类型的数据有效的模糊后,减少了数据集成的困难(24),并能坚持集成过程中的不确定因素对数据的影响。集成过程如下。

设置学前教育资源数据集成 在哪里代表集成学前教育资源和数据的数量 表示数据元素的尺寸。

上述数据集集成分为C类集群,集群成员矩阵表示为一组类 在哪里 代表会员的程度。

总结所有集成数据成员的值为1,即:

当会员的价值计算集成数据更接近于1,它代表更高概率的这种类型的数据被轻松集成。

此时,设置学前教育资源数据的目标函数,并进一步确定关键数据在幼儿园语言教育资源数据集成数据通过目标函数(25),即: 在哪里 代表了目标函数和集成 是重量的因素。

目标函数决定了数据后的重量学前语言教育资源,有效的数据集成完成。数据集成模型如下: 在哪里 代表了拉格朗日乘数, 代表最后的整合结果, 代表数据集成后的密实度。

数据集成的学前语言教育资源,幼儿园语言教育资源数据之间的空间距离是决定,和幼儿园语言教育资源数据的聚类集成的帮助下完成模糊均值聚类算法。

3所示。实验分析

3.1。实验方案

完成后的学前语言教育资源整合的设计方法,仿真实验进行确认该技术的实用性。儿童语言培训的资源数据库MySQL数据库选择为研究对象,选择1000年的数据作为实验样本数据,300年的数据有一些冗余,和其他数据被非机密数据。研究数据成功地训练来满足实验的需要以保证实验的有效性。SPSS13.0被用来检查实验数据统计。

3.2。实验指标设计

在实验中,本文的方法,文献[4]和文献[5)相比,主要比较不同集成集成数据的冗余处理方法、数据集成的准确性和数据集成的时间成本。

3.3。实验结果分析

首先,实验分析了样本的冗余处理幼儿园语言教育资源数据的方法和方法(4,5]。其中,降低数据冗余处理后,代表方法的效果就越好。相反,代表方法的处理效果有一些缺点和需要进一步改进。实验结果如图所示3

使用这个工作的方法,文献[4]和文献[5),可能表明有一些差异在冗余样本幼儿园语言教育资源数据图3。数据冗余急剧下降,总是低于其他两种方法的示例数据集成时使用本研究中描述的方法。虽然其他两种方法的数据冗余是一个受人尊敬的范围内,不过比描述的方法在这工作。这是由于这样的事实,在此方法中,数据冗余的数据集在深度处理,提高了方法的功效31日,32]。

实验分析数据的准确性样本幼儿园语言教育资源的整合的方法,文献[4]和文献[5]。结果如图所示4

通过分析实验结果数据图4的准确性,可以看出,数据集成示例学前语言教育资源使用这种方法和方法(4)是不同的。其中,数据准确性的方法总是高于90%,而其他两个方法的集成精度波动大大低于这个方法。验证了该方法的有效性。

为了进一步验证该方法的有效性,数据集成的时间成本样本幼儿园语言教育资源的方法和方法在文献[4]方法和文献[5)方法的实验分析。结果如表所示1

通过分析实验结果表1可以看出,样本的数量的不断的变化,有一定的差距的时间成本数据集成示例学前语言教育资源的方法,文献[4]和文献[5]。其中,当数据量是600,本文方法的积分时间开销大约是0.57秒,集成方法的时间开销在文献[4约1.62 s,集成方法的时间开销在文献[5大约是1.48秒。的数据量是1000时,本文方法的积分时间开销大约是0.65秒,集成方法的时间开销在文献[4约1.69 s,集成方法的时间开销在文献[5大约是1.87秒。相比之下,在此方法中,数据集成的时间成本低,验证该方法的有效性。

4所示。结论

幼儿园是孩子学习语言的关键时期,语言教育资源的影响更为重要。为了解决贫穷问题的集成效应数据集成方法、幼儿园语言教育资源的一种新方法集成基于元数据仓库的设计。元数据仓库设计,和改变综合数据库的优势进行了分析。学前语言教育资源分类的样本数据的帮助下成本矩阵,和不同类型的约束分类的数据收集器集。幼儿园语言教育资源设置通过使用随机森林算法完成数据收集的学前语言教育资源。幼儿园语言教育资源的数据进行处理,并计算数据的融合边缘函数。话语的帮助下,冗余数据的特点在幼儿园语言教育数据资源特点,和冗余数据删除完成数据预处理的学前语言教育资源。我们确定维度之间的距离幼儿园语言教育资源数据和完成幼儿园语言教育资源数据的聚类集成的帮助下模糊均值聚类算法。实验结果表明,本文设计的集成方法可以减少集成数据的冗余,并集成速度快。

数据可用性

使用的数据来支持本研究的结果包括在本文中。

的利益冲突

作者宣称没有利益冲突。