文摘
现有的大学英语教学信息资源集成方法召回率低的问题,准确率低、长积分时间。因此,本文构造了一个大学英语教学信息资源集成模型基于模糊聚类算法。蚁群算法用于优化主题爬虫,使用优化的主题爬虫收集大学英语教学信息资源的混合教学模式,和重量和朴素贝叶斯算法的分类收集到的资源。结果显示资源分类、模糊聚类算法是用于构建大学英语教学信息资源的集成模型。召回率的实验结果表明,该模型是超过95%,准确率超过94%,而平均资源整合时间只有0.71秒,表明该模型具有相对性能可靠。
1。介绍
随着信息技术的快速发展,人们的学习环境和学习方法不断丰富和提高,以及各种教育理念和观点基于信息环境的不断涌现和创新。在这种浪潮,传统的教学设计和信息技术的结合是必要的(1]。因此,大学英语教学改革一直在改变基于网络技术辅助教学。多媒体、平板电脑、手机,黑板上平台,和其他信息工具涌入大学英语课堂,已成为一个有效手段,协助教师教学和丰富大学英语教学模式。在这种信息技术环境下,传统的大学英语教学模式的缺陷在一定程度上得到改善,和原来的单一平面的教学方法变得更为三维(2]。目前,基于信息技术环境下大学英语教学模式可分为小组学习模式中,个人学习模式,混合学习模式。它指多种媒体的组合和互动学习模式,为学生提供更多的自主和互动学习模式(3]。在当今大学英语教学,第一次和第二次教学模式是最常用的和常见的。他们的优势是显而易见的,但缺点是不容忽视的。在这种情况下,大学英语教学信息资源整合的混合教学模式显得尤为重要。因此,如何组织教学环节如集体学习、自主学习、社交分享,和多个评价一层一层地4),结合丰富的大学英语教学信息资源,为学生提供更多的自由和有效的学习环境是大学英语教学模式改革的研究课题和一个重要的命题来有效地促进大学英语教学的发展。
信息资源是大学英语教学的一个重要研究课题。文献[5]提出了一种信息集成模型基于云存储的多媒体整合学习资源。的配置属性关联规则挖掘是用来获取多媒体学习资源的综合信息。根据属性分类的结果,资源分配,和信息处理的多媒体学习资源,集群信息融合构建多媒体综合学习资源信息模型和最优集成模型设计通过使用模糊调度方法。一个新的资源整合系统基于Zigbee协议设计实现网络和多媒体整合学习资源信息集成系统的模块化。文献[6)提出了一个基于仿真软件实验信息资源整合模型。使用仿真软件的网页发布功能在虚拟仪器服务器中,学生登录虚拟实验室根据网页的访问模式,开展网上电子仿真实验。ffD-GRP算法是用来释放虚拟集群的虚拟实验室,获得大量虚拟实验资源,并抑制资源碎片的发生,建立实验信息资源整合模型,实现资源的有效整合。文献[7)提出了一个云计算的智能高校教学资源整合模式。它解释云计算和方法来解决教学资源建设的问题,设计了智能教学资源平台基于云计算的高校环境模型,设计了基本层、数据层、应用程序层,和云服务层智能教学资源平台的体系结构,并实现教学资源的智能集成的支持架构。
然而,发现传统的大学英语教学信息资源集成方法有一些问题,如低召回率,准确率低、长积分时间。因此,本文构造了一个大学英语教学信息资源集成模型基于模糊聚类算法。本文的主要技术路线如下:(1)分析聚焦爬虫的基本工作流程,优化与蚁群算法聚焦爬虫,大学英语教学信息资源收集与混合教学模式,优化聚焦爬虫和分类收集的资源结合重量和朴素贝叶斯算法。(2)结果显示资源分类、模糊聚类算法是用于构建大学英语教学信息资源的集成模型,从而达到大学英语教学信息资源整合的目的。(3)的召回率、准确率和积分时间的大学英语教学信息资源在不同的模式进行了比较实验。
通过研究,得出的结论是,召回率和精度很高,和积分时间很短。
2。大学英语教学信息资源集成模型基于模糊聚类算法
大学英语教学信息资源是各种元素的集合组成的各种教学内容和活动,包括课程的硬件资源、软件资源、教师资源。大学英语教学信息资源指的是各种各样的资源与英语语言现象和语言文化由网络媒体,以及各种媒体手段,如电子邮件和论坛。大学英语教学信息资源的应用丰富了英语教学的内容,促进英语学习形式的多样化,促进英语教学目标的实现。大学英语教学信息资源具有显著特征的数量、结构、内涵、类型和传输方式,包括(1)形式多样,内容丰富,(2)简单的风格,良好的沟通,和(3)方便沟通和协作学习。
2.1。大学英语教学信息资源的收集基于聚焦爬虫技术
聚焦爬虫,也称为主题爬虫或专业爬虫,是一个网络爬虫”面向一个特定的主题。”之间的区别,通常称为履带(通用爬虫)在于聚焦爬虫是target-theme-driven和选择性履带和主题选择中需要实现的web爬行(8,9]。它试图爬到主题相关的网页。根据既定的目标主题,聚焦爬虫选择性地访问相关页面。它追求网络信息的准确性,而不是覆盖的网络资源。与通用爬虫相比,聚焦爬虫不同在以下方面:(1)主题定制的目标捕获。不同于一般的搜索引擎,主题搜索引擎为用户提供特定领域的信息在网络上。所以,它收集信息来实现用户的目标,和主题定制是让用户定义他们自己的网络信息,一般提供关键词,主题类别,最初的网站,等等。(2)过滤与主题无关的网页信息。网络爬虫抓取页面通常包含大量的信息与用户的定制的主题无关。因此,聚焦爬虫需要执行主题过滤网页,删除不相关或不相关的内容,与高主题相关性[屏蔽网页信息10]。(3)启发式搜索策略通常是用来评估URL链接。聚焦爬虫采用启发式搜索算法计算相关性的链接中包含捕获网页根据面向主题的单词或主题表示模型设定的用户,丢弃的链接相关性较低的价值,并选择高相关性的链接添加到链接序列爬(11]。
不同于网络爬虫,聚焦爬虫的工作流程比较复杂。有必要根据特定的过滤与主题无关的链接网页分析算法,保留有用的链接,并把它们到URL队列等待捕获。然后,它将从队列中选择下一个web页面URL根据一定的搜索策略和重复上述过程,直到达到一定条件的系统,如图1。
此外,所有网页爬虫将存储的系统,和一定的分析、过滤,并建立索引,以便用户以后查询和检索;聚焦爬虫,在这个过程中获得的分析结果还可能提供反馈和指导后续把握过程(12]。为了进一步提高爬虫的效果,使用蚁群算法来优化聚焦爬虫搜索。聚焦爬虫的核心问题是如何有效地优化URL队列的优先级顺序,所以相对应的页面优先爬行URL具有较高的主题相关性。良好的聚焦爬虫系统必须准确预测价值的URL和关注短期和长期回报。因此,URL值的计算和爬虫策略的选择尤为重要,它决定聚焦爬虫的搜索效率和质量(13,14]。
1991年,意大利学者和其他学者马克•多日提出了一种新的模拟进化算法启发蚁群觅食的行为。这是蚁群算法,是一种群体智能的典型例子。蚁群算法的基础上,本节提出了一个使用蚁群算法的搜索策略ACO-FC指导聚焦爬虫。的基本思想如下:
在大学英语教学相关的网页信息,页面和超级大学英语教学信息资源。如果有一个链接来 ,蚂蚁在将决定是否离开来根据某些条件。每个链接序列代表一个可能的蚂蚁运动路线(15]。单个蚂蚁传递信息通过信息素在运动。信息素挥发随着时间蚂蚁爬行。页面之间的爬行的蚂蚁分为多个周期。在每一个周期,一只蚂蚁使web页面之间的一系列的动作,直到找到目标资源并返回到源点。每个爬行周期后,蚁群更新每个路径上的信息素量(16]。
假设代表所有页面的集合表示路径的集合组成的链接,然后web页面(链接)形成一个有向图 。大学英语教学信息资源的集成结构如图2:
根据图2,主题相关性值页面是由下列公式计算:
其中,是指调整因素,通常是0.8,指的是链接到的页面设置 ,和指的是链接的程度 ,也就是说,从链接的数量其他页面。
假设代表页面之间的距离和 ,由以下公式计算: 在哪里是常数和协调因素从页面的页面设置到另一个页面 。
假设代表路径上信息素的量 在这个循环。代表路径信息素数量 由 - - - - - -th蚂蚁在这个循环17]。然后,建立以下公式如下: 在哪里是一个常数,表示路径的长度 - - - - - -th蚂蚁在这个循环18],它可以表示如下: 在哪里代表了蚂蚁的网络节点数量在这种循环。
蚂蚁的数量设置为 ,然后代表蚂蚁位于页面的数量在时间 ,然后 ; 代表其余的信息素量 在时间 。在初始时刻,每条路径上的信息素数量相等,并设置 (是一个常数,通常0)。蚂蚁吗决定下一个路径根据每条路径的信息素强度运动的过程。的概率(19的蚂蚁从位置来在时刻由以下公式表示: 在哪里 意味着有一个链接来在一个给定的页面 。为了防止蚁群爬行在循环和限制蚂蚁探索页面递增,每只蚂蚁商店禁忌表记录的链接访问。如果属于禁忌,路径概率值从来是0,从而防止蚂蚁吗从探索链接。每个周期结束时,禁忌表清空(20.]。
信息素强度的不平衡会随着时间消散。信息素保留系数设置 ,这反映了信息素强度的持久性。和信息素的损失的程度。当达到每个周期的运动时间限制是,每个路径上的信息素量应根据更新公式
然而,为了避免“早熟”的问题,蚁群算法的局部收敛,公式(7)和(8)采用本文调整每个路径上的信息素数量:
当 ,以下公式:
当 ,以下公式: 在哪里 是一个函数转换的数量成正比吗 ,越多的转换 ,的价值就越大 。 是一个常数,因此可以更新信息素量自适应地根据分配的解决方案,以便动态地调整每个路径上的信息素强度,所以蚂蚁既over-concentrated也over-dispersed,从而避免早熟和局部收敛,提高全局搜索能力(21,22]。聚焦爬虫的具体结构如图3:
根据图3的实现过程,基于蚁群算法的聚焦爬虫搜索策略如下:(1)鉴于初始超链接节点,其他链接可以形成网络节点集的蚂蚁爬行。(2) 蚂蚁被放置在不同节点初始化ant控制参数。(3)设置初始浓度 路径。(4)把起始节点的 - - - - - -蚂蚁为禁忌。(5)重复直到禁忌是空的,次了。(6)计算的路径长度 - - - - - -th蚂蚁 ,并找到最优长度的平均值 。(7)每条边上的信息素值,根据公式(更新7)和(8)。(8)在一个周期结束时,最优路径输出实现大学英语教学的深入挖掘信息资源。
2.2。大学英语教学信息资源的分类
人们认为大学英语教学信息资源被认为是一种 - - - - - -维向量 在向量空间 是大学英语教学信息资源的特点,这也代表了降维后的关键词,和的重量吗 - - - - - -大学英语教学信息资源的。
的概率比函数可以全面调查情况的正样本(属于这一类),负样本(不属于这一类),它有一个良好的性能在分类过程。因此,选择概率比函数本文所示的公式 在哪里代表的概率功能出现在资源属于一类在训练样本集,代表的概率功能出现在资源不属于一类 。总之,通过计算 ,本文可以获得代表程度的功能项对类别 。更大的 是,它是更具代表性。的输出概率比算法是第一个功能词最大的 值,作为训练样本的特征数据库参与大学英语教学信息资源的实时分类,如下公式所示
然而,纯粹的方法选择第一个功能词的最大价值 作为训练样本特征数据库经常的问题“无法形容”训练样本;一些培训,大学英语教学信息资源不包含任何选定的功能项。
对大学英语教学信息资源向量和 ,本文定义了相似度用余弦值(23,24所示)向量的公式
当确定大学英语教学信息资源分类,本文计算它和各种类型之间的相似性 ,如公式所示 在哪里代表了最相似的信息集 ,下面的公式:
朴素贝叶斯算法是一种模块与已知的先验概率和class-conditional概率分类器。它的基本思想是计算资源的概率属于类(25]。在贝叶斯分类器,有必要建立一个概率分类器基于建模不同类别的词特征。然后,本文将大学英语教学信息资源根据单词和后验概率的不同类型的大学英语教学信息资源。朴素贝叶斯很容易实现和计算,其贝叶斯定理公式如下: 在哪里后验概率,表示后验概率的条件下 。 是先验概率,它是假设的先验概率 。的后验概率包含更多的信息比 ,和是独立于 。朴素贝叶斯统计方法以概率的形式,这是一群概率参数的估计。它的目的是结合分类的概率分布和大学英语教学信息资源(26]。它是基于贝叶斯规则和资源信息的依赖于简单的表示。朴素贝叶斯分类器构造输入向量,通过选择最佳的分类和最可能的选择分类。计算每个类别的条件概率的资源 ,在哪里是资源的特性。朴素贝叶斯分类器发现的类最大化公式通过选择最合适的类。假设所有功能是相互独立的,如公式所示
总之,通过建立完善的大学英语教学信息资源,高校将能够进一步加强效率的相关教学信息资源的整合,实现资源的科学管理。因此,在教育信息化建设的过程中,学院和大学应该增加投资,建立一个大学英语教学信息资源数据库尽快,并确保数据库中的资源储备通过广泛收集和信息资源的集成。在此基础上,通过数据库的强大功能,实现信息资源的科学、高效的管理和提高效率的存储、检索、分析和利用相关的信息资源。同时,数据库的完善建设还可以提供对共享信息资源的支持。结合高校之间的信息交换和共享,它可以扩大大学英语教学信息资源的来源和支持有效的大学英语教学的发展。
2.3。资源整合模型建设基于模糊聚类算法
模糊C-mean聚类算法是一种基于原型的聚类算法。在计算过程中,需要反复计算样本和每个集群中心之间的距离来确定样本的类别。通常,不同类型的数据样本需要采用不同类型的距离测量功能。因此,找到合适的距离测量功能是核心问题模糊均值聚的聚类算法。在实际问题中,对于非凸复杂的数据分布和高维数据聚类样本,研究人员已经投入了大量的精力去探索各种距离测量功能适合C-mean模糊聚类算法。作为一种新的降维方法工具,流形学习算法旨在发现低维流形结构嵌入在高维数据空间和提供一个有效的低维表示。目前,它已成为一个热门研究问题领域的模式识别、机器学习和数据挖掘。
本文基于判别社区嵌入算法,一种新的判别社区嵌入(FCM)聚类算法基于判别提出了邻域嵌入(FCM-DNE)。
集的数据集的样本与类标签分类,特征尺寸 是 ,代表 - - - - - -th样本, 代表的类别 - - - - - -样本。一个判别邻接矩阵 用于描述标签样本之间的关系。矩阵的值如果两个标签样本不相邻样本,的价值他们之间是0;如果相邻的两个样品,同一物种的的价值他们之间分配给1;如果两个样本是相邻但不相同的类,它们之间的值分配给−1。辨别邻接矩阵的表达式 是
DNE算法希望找到一个最佳的变换,所以当每个监督样本点达到平衡当地吸引和排斥的联合行动下,类内的采样点,尽可能和类之间的采样点尽可能独立。如果样本的特征维数变化维度,最优线性变换矩阵 需要发现最小化以下公式:
替代上面的公式, 。的公式,和属于相邻类,代表所有点之间的距离之和相同的类,代表了内部类密实度。 。的公式,和属于相邻的离群值,代表所有的异常值点和之间的距离之和表示类之间的分歧。因此,成本函数可以表示如下:
在公式(18)显示的密实度值之间的差异在一个类和类之间的散度的值。从分类的角度看,内部类密实度值越小,越好,而类的散度值越大,即使达到最低的变换矩阵是最优变换矩阵。为了找到成本函数的最小值 ,它转换成以下形式:
在公式(19),代表的跟踪矩阵, 是矩阵 ,注释样本集是 - - - - - -th列的矩阵 。 是一个对角矩阵:
变换矩阵的列向量形成新的空间的基础,地图的输入样本 - - - - - -新维特性 - - - - - -维的特征空间。因为变换矩阵的列向量形成一个新的空间的一组基,它可以假定变换矩阵的列向量相互正交的;因此,这个问题可以转化为下面的约束优化问题:
根据特征值定理,
在公式(22),是 - - - - - -矩阵的特征值 ,和特征值对应的特征向量是什么 。
因为矩阵不是半定,其特征值可能大于,小于或等于零,也就是说, ,和代表的数量特征值小于零。当只有选择特征值小于零,目标函数达到最小,变换矩阵的列向量由矩阵的特征值所对应特征向量小于零。后得到的变换矩阵 ,新空间中的任何两个样本之间的距离 在哪里 属于距离及其顺序 ,这是最好的尺寸适合模糊均值聚的聚类算法。大学英语教学信息资源的集成过程如图4:
图的基础上4,测量的距离函数公式(23)提出了引入传统的FCM聚类算法,和一个新的FCM聚类算法(FCM-DNE)基于判别相邻嵌入流形学习是建立。其目标函数如下: 在矩阵是负的特征值对应的特征向量矩阵 。在约束条件下 ,采用拉格朗日乘子方法获得
因为集群中心大学英语教学信息资源的集成生成的样本数据集,当集群中心决定,可以从上面的流形距离矩阵中提取。为 - - - - - -th集群中心,大学英语教学信息资源的集成模型如下:
考虑到多方面的距离矩阵之间的和任何两个样品
聚类中心的类别是
根据新获得的聚类中心,从多方面的距离矩阵中提取,分配系数重新计算,迭代循环进行,直到聚类中心并没有改变,和大学英语教学信息资源的集成结果输出。
3所示。实验设计
为了验证大学英语教学的有效性信息资源整合模型基于模糊聚类算法设计本文的实验测试。整体测试方案如下:(1)为了保证实验结果的真实性和可靠性,需要设计实验参数,如表所示1。(2)实验数据在实验中,爬虫技术被用来获取大学英语教学信息资源,和捕获的资源数据作为实验样本数据。为了保证实验结果的真实性,没有处理完成实验数据的实验。(3)评价指标召回率和精确率的大学英语教学信息资源的集成结果和大学英语教学信息资源的集成时间作为评价指标。文献[5)模型,文献[6摘要)模型,该模型被用作实验方法来验证不同的方法的实际应用效果。
召回率是指之间的比例从数据库中检出的信息量和总量。值越高,更全面的大学英语教学信息资源的集成结果。
查准率是一个指标来衡量检索系统的信噪比,即比例的相关检测和检测到的所有引用的引用。此值越高,更准确的大学英语教学信息资源的集成结果。
大学英语教学信息资源的集成时间指的是时间消耗完成大学英语教学信息资源的集成。值越高,越高集成效率。
首先,大学英语教学的召回率的参考信息资源整合结果(5)模型,文献[6)模型,该模型进行比较,结果如图所示5。
通过分析数据在图5,可以看出,召回率的大学英语教学信息资源整合的结果文献[5)模型之间的73%和87%,与文献[6模型是在75%和89%之间。与文献[5)模型和文献[6)模式,召回率的大学英语教学信息资源整合模型本文的结果总是在95%以上,说明大学英语教学信息资源集成的结果更全面更好的方法。
其次,大学英语教学的准确性的参考信息资源整合结果(5)模型,文献[6)模型,该模型进行比较,结果如图所示6。
通过分析数据在图6可以看出,大学英语教学的准确性的参考信息资源整合结果(5)模型之间的66%和90%,与文献[6模型是在57%和77%之间。与文献[5)模型和文献[6的准确率)模型中,大学英语教学信息资源集成模型的结果本文始终维持在94%以上,表明该方法具有更高的准确率和更准确的集成效果。
最后,文献[5)模型,文献[6)模型,该模型比较的精度结果大学英语教学信息资源的集成。结果如表所示2。
分析表2中的数据,平均时间为一体的大学英语教学信息资源参考[5]模型下1.85年代,资源整合和平均时间参考[6]模型下是1.49秒。与实验方法相比,在这种模式下的平均资源整合时间是0.71秒。最短的三种模式中,表明该方法具有较高的大学英语教学信息资源的集成效率和更好的实际应用效果。
4所示。结论
混合教学可以补充传统的学习模式和网络学习模式的优势,以取得更好的教学效果。换句话说,混合教学可以充分发挥教师和学生的自主性,并更充分地反映了主动,热情,和创造力的学生为主体的学习过程。因此,混合教学在大学英语教学中的应用取得了良好的效果。混合教学的过程中,有必要提高混合教学在大学英语教学的质量基于大量的信息资源。因此,本文构造一个大学英语教学信息资源的集成模型基于模糊聚类算法。模型的实验结果表明,大学英语教学信息资源集成的查全率和查准率较高,大学英语教学信息资源整合时间短,并能解决传统方法中存在的问题,促进教学方法的优化,因此混合进一步提高教学质量,促进教育领域的进一步发展。
下一步的工作可以集成使用高校英语教学信息资源,帮助大学英语教师加强网络教学资源储备,并为英语教学提供支持创新探索,通过充分利用信息资源的同时,满足学生的需要自主学习,提高大学英语教学水平和效果。在教育信息化建设的背景下,创新信息资源支持的网络教学模式应该积极探索促进教学模式的创新和技术改造,提高高校人才培养的质量。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者表明,没有利益冲突的研究。
确认
这部分工作是赞助SFLEP国立大学外语教学与研究项目“大学英语混合教学的研究和实践的背景下教育信息化”(2018 ln0064a)和LUIBE本科教学改革研究项目“大学英语教学模式改革的研究与实践基于OBE和信息技术”(2018 xjjgyb02)。