文摘

改进的入学率近年来,高校创新与企业家精神已经成为国家和人民的焦点。然而,创新和创业精神的统计学院和大学变得越来越复杂和困难。本文的目的是研究如何面对创新与企业家精神的统计数据,在学院和大学,然后学习智能云计算数据处理系统,并提出了创新与企业家精神的重要性和云计算在高校。实验结果表明,可以看出,毕业生的数量急剧上升,从2011年到2020年,这一比例已从20%上升到90%左右,这也导致了大研究生企业数据管理的难度增加。研究生企业数据管理的难度已经从年初的18%左右上升到了2020年的87%左右。因此,有必要研究数据处理系统使数据处理更有效率。智能云计算数据处理系统极大地提高了企业服务管理的质量和效率,和系统中数据挖掘的应用程序也可以提供数据支持毕业生的创业情况的分析和预测。智能云计算数据处理系统极大地提高了企业服务管理的质量和效率,和系统中数据挖掘的应用程序也可以提供数据支持毕业生的创业情况的分析和预测。

1。介绍

随着高等教育的迅速扩张在中国近年来,学生的数量也显著增加,这与创业精神给毕业生带来了巨大的压力,也对员工管理他们的创业精神。面对这种压力,越来越多的学者们希望利用数据处理系统提高研究生的管理信息,以便更好的为毕业生提供指导和帮助开始自己的生意。云计算已经每秒运算10万亿次。如此强大的计算能力,可以模拟核爆炸,预测气候变化和市场发展趋势。在未来,无论是智能驾驶、情感伴侣的机器人,和许多其他人工智能产品,它从云计算的支持是分不开的,甚至边计算。

创业的大学毕业生一直是教育领域的一个重要问题。国家高度重视,相应的提出了一系列政策研究生创业服务体系。为了应对这些政策及时,有必要跟进国家信息化的发展,并从创新工作服务的角度来看,主要是通过信息化服务,更有效的管理,有效地促进研究生创业。

本文的创新如下:(1)介绍了理论知识的创新和创业精神和云计算在高校,并使用数据挖掘来分析数据挖掘的重要性在智能云计算数据处理系统。(2)阐述了数据挖掘和关联规则。通过实验,发现基于数据挖掘的智能云计算数据处理系统数据统计的算法可以提高工作效率。

随着国家重视创新和创业精神,越来越多的人毕业后选择创业。林发现,近年来,社会创业教育迎来了一个蓬勃发展的时期。然而,在创业教育领域的大学生,社会创业教育并不令人满意。学者提到,创新和创业精神是总的趋势,还发现,创业教育并不是很完美,但是他并没有提出如何解决这个问题(1]。邓发现手机用户通常有很高的定位和信息服务的需求。然而,从远程获取数据往往效率低下,所以边缘计算,这是云计算的一个扩展。在这个基本框架,它是非常重要的边缘之间的互动与合作学习计算和云技术。虽然学者意识到,重要的是要研究边缘计算和云技术之间的关系,他没有提及两者之间的关系是什么2]。魏发现现有的资源调度算法不能满足云计算所需的资源调度需求和当前的云基础设施解决方案只提供业务支持的基本水平。考虑云计算的竞争本质,他提出了一个云资源分配模型在云计算环境中使用隐马尔科夫模型。尽管学者提出了一个云资源分配模型,他并没有提到具体的这个模型的概念,也没有实验证明其可行性(3]。金发现数据共享是一个有吸引力的云计算平台提供的服务,因为它方便和经济。作为一个潜在的技术来实现数据共享,基于属性的加密吸引了大量的关注。然而,大多数现有的加密解决方案的缺点计算开销和疲软的数据安全性高,严重阻碍了资源受限的移动设备定制服务。学者发现,加密是一种很有前途的技术,还发现它的缺点,这些缺点(但并未提出具体解决方案4]。平井伯昌发现云计算提供了一个大规模并行分布式处理服务,在一个巨大的任务被分成多个子任务,并处理子任务需要很长时间。一种有效的方式来减轻这个问题是另一个工人执行相同的子任务,所以他考虑备份任务的效率。然而,学者没有具体实验证明备份任务是否真能有效提高工作效率(5]。Ghahramani发现云计算的资源提供的用户以最小的行政工作;然而,也有一些障碍和使用云的担忧。学者只提到一些障碍和关切的使用云计算,并没有给出一个明确的介绍这些障碍(6]。Barsoum发现,越来越多的组织选择外包数据到远程云服务提供商(csp),顾客可以存储大量的数据。提高可伸缩性、可用性和耐久性,一些客户可能希望复制他们在多个数据中心数据跨多个服务器。因此,客户需要有一个强有力的保证,他提出了一个动态数据所有权计划。虽然学者相应的问题提出了相应的解决方案,没有实际的案例来证明这个方案是可行的(7]。蔡发现,在现代社会,手机用户的数量急剧增加,他提出了一个高效的分布式移动云计算服务身份验证方案,,该方案为移动用户提供了安全、方便。该方案的安全力量是基于加密系统和动态随机数生成。虽然学者提出了一个安全可靠的计划,他没有列举的相关数据来支持他的方案的真实性8]。

3所示。基于大数据的数据挖掘算法

3.1。云计算的概念和创新和创业精神

随着技术的进步,计算机的硬件组成经历了巨大的发展。互联网正在改变每一天,和网络上的数据量增长突飞猛进。不管有多少资源,无法满足的需求。由于大量的数据在互联网上,电脑是完全无法执行相应的任务(9]。如何整合和优化资源已经成为计算机应用领域的一个重要课题。的前提下这样的应用程序中,云计算将提上议事日程。云计算的架构图所示1

如图1。云计算的大规模数据存储主要是由分散的文件系统,实现和分散的文件系统的设计必须符合要求的透明度、可伸缩性、故障电阻、和安全10]。中国经济的快速发展,大学入学的人数持续增加,许多大学毕业生创业会面临巨大的压力。国家强调创新与企业家精神在大学图所示2

如图2,对中国来说,如何应对时代和发展创新教育是我国高等教育面临一个主要问题。现在,中国正积极采取改革,促进创新和创业精神。为了促进创业,国家加快了makerspaces建设,支持和鼓励企业、投资机构、行业组织和其他社会力量投资建设按照市场化的原则。因此,为了培养具有创新意识和创业精神的人才队伍,实现中国现代经济的可持续发展,国家提出了一系列配套政策(11]。

学院和大学的教育和培训是杰出人才的培养具有重要意义。因此,它是非常重要和必要的信息进行数据挖掘的大学生(12]。随着科学技术的进步,创新和创业的数据统计系统也不断更新。创新与企业家精神在信息时代在图所示3

如图3,大数据时代的到来,特别是大数据相关技术的快速发展,大学越来越关注现有历史数据的分析和挖掘,创新和创业精神正在进行更多的科学教育活动13]。

有大量的企业数据信息存储在学生数据管理系统,和隐藏的关系中扮演着关键角色在创业方法的改革和创新系统(14]。创新和创业的数据统计系统的流程图如图4

如图4这个流程图完全显示,系统中数据挖掘的过程。系统应该有学生在校期间的各种信息,以便它可以实现数据共享,方便用户分析学生信息(15]。它为员工提供了高效的服务从事教育,同时实现系统化,规范化,自动化的学生信息管理。

3.2。平行的基于加权项集的先验的算法

先验的算法挖掘关联规则的频繁项集的算法。其核心思想是通过两个阶段来挖掘频繁项集:候选集生成和情节向下关闭检测。并行基于加权项集的先验的算法实现了分布式先验的算法。为了实现高效的并行计算原始数据库,数据进行预处理,过滤掉所有频繁项集,本文将数据库转换为权重矩阵和布尔矩阵(16]。对于任何给定的事务数据库D,让方程(1)持有:

其中, , 是交易的数量, 是物品的数量,和事务组 如下所示:

先天是一种数据挖掘算法,使用多个循环迭代找到所有频繁项集一层一层地,但它有两个相对更严重的缺陷:原始数据集和太大的多个扫描每迭代(候选项目集17]。为了提高先验的算法的主要缺陷,学者们提出了一个分布式先验的算法。

分布式架构下的先验的算法执行数据并行策略是他们的关键是减少和分发到相应的处理器的数据,然后执行本地数据处理操作,获取本地处理结果,然后在所有处理器集成结果,最后得到所有的结果(18]。本文比较和分析了传统的先验的算法和分布式先验的算法,如表所示12

如表所示12,传统的先验的算法的运行时间是28分钟,36分钟,之间的计算能力是39%至47%,28%和32%之间的计算效率。平行先天算法与传统算法相比,缩短了运行时间,提高了计算能力,也提高了算法的运行效率。可以看出,选择分布的先验的算法显然是更有利的(19]。

3.3。数据预处理

数据预处理是指对数据执行一些处理之前的主要处理。例如,转换或增强的大部分数据之前,首先,不规则分布的测量网络转换为常规网络通过插值,从而促进计算机操作。如果数据直接计算,数据预处理是第一次,因为数据太大,罕见的候选项集反复计算。过滤掉同龄网站项目集后,候选项集和更高的项集将减少大量20.]。提高算法的效率因为不必要的减少候选项集的支持计算,算法的运行时间缩短。

首先,原始数据库D扫描一次,和所有事务的项集是遍历,支持上叠加次数。记录项目集的支持数表示 :

的方程, 在数据的事务数, 出现的itemset的总和是一个在所有事务。

关联规则挖掘的第一阶段必须找出所有高频项组从原始数据集。高频意味着某项组的频率必须达到一定级别后相对于所有的记录。在关联规则的研究,人们通常只关心itemset的存在,但是忽略本身的数量在一个事务中。A和B之间的联系程度不应只考虑在事务数据库中出现的次数的同时,自己也A和B的数量(21]。

的最小值在一个特定的事务,所有项目的数量在itemset的重量是一个事务中,这是代表 : 在哪里 代表任何项itemset。

平均体重的比例累计itemset的权重之和所有事务 , :

在方程(5), , 在数据的事务数, 的累积重量之和在所有事务。

当谈到并行关联规则挖掘算法,分块的数量分配给每个主机的数据必须考虑。如果数据块很大,计算节点的压力会很大,和数据切割太小失去并行计算的意义。

对给定的数据库进行数据挖掘时,关联规则挖掘的过程一般分为两个过程,如图5

如图5分配平衡的数据大小,节点可以充分利用集群的计算资源,缩短算法的运行时间。布尔矩阵的运算是一样的通用矩阵,例如,它可以连接,可以调换。权重矩阵是指每个数字的频率加权平均的复杂的或真实集安排在一个矩形数组。布尔矩阵和权重矩阵,分别切成两个小矩阵,然后移到以下几点:

将数据划分为 块和局部最小值的总和支持n个节点是全球最低的支持。因此,局部最小值的大小是全球最低的产品支持和交易节点数据块的数量,这是由 :

当地的平均体重和全球平均体重代表一定的关联度itemset中的项目组合,代表了 : 在哪里 是当地的支持数的。

itemset的重量的次数,itemset中的每一项都有自己的发生在一个事务中。以最小数量的出现可以代表共同出现的最大数量的所有项目,同时出现的次数设置在该事务。出现的平均体重平均最小项的计算环境,代表了相关组内所有物品。

计算每个候选项目集的支持数和平均体重,就是代表 : 在哪里 itemset的全球支持计数。

频繁项目集是一组的支持度大于或等于最小支持度,在支持度是指特定的频率出现在所有事务。所有满足最低平均体重的项集和最小支持同时是另一个全局频繁项集的一部分,和这两个频繁项集都是全局频繁项集。

3.4。k - means算法

k - means是一种最常用的聚类算法。算法的最大特点是,它是简单的,容易理解,和快速运行,但是它只能用于连续数据。k - means算法最后收集样本数据到k集群。因此,该算法首先需要选择k初始聚类中心,然后计算距离剩下的数据样本的k聚类中心,分别,把数据样本类别对应最小的聚类中心距离所有k集群中心。

如图6k - means算法,虽然有很多地方需要改进和优化,在处理一些基本的大数据集时,获得的聚类效果和算法处理数据的效率已被公认。

当一个特定的函数是用来评估的利弊的标准所采用的战略系统,它被称为一个标准函数。聚类算法的判别函数方程

k - means算法与其他算法相比,在原理和简单的操作,算法执行效率高。

3.5。模糊c均值聚类(FCM)算法

而基于分区的FCM算法的聚类算法,其思想是最大化对象之间的相似性分为相同的集群,而不同簇之间的相似度是最小的。学者利用模糊集合理论来改进k - means算法,最后取代样本之间的距离的平方与集群中心准则函数的k - means算法与隶属度的平方的重量,并获得FCM算法的目标函数。

目标函数是目标形式所追求的设计变量,目标函数是设计变量的函数,这是一个标量。让n维样本数据集 ,和每个样本数据有s-dimensional属性。如果FCM算法用于聚合这个样例数据转换成c类,那么相对应的目标函数算法 在哪里 代表之间的隶属程度一定j和第i个类别和示例数据 k - means算法中隶属度的值 的样本对象和相应的类别是1或0。模糊c均值聚类FCM算法中隶属度的值是某个值的区间[0…1],指示的概率属于这个类的数据对象。

当目标函数满足约束条件 和最小值,得到相应的模糊矩阵和聚类中心时最优聚类效果。使用拉格朗日乘数法建立拉格朗日方程:

模糊矩阵是用来表示矩阵的模糊关系。如果设置X m元素和集合Y 元素,从集合X到Y的模糊关系可以表示为一个矩阵。的偏微分方程(12)计算,对应的模糊矩阵和聚类中心目标函数的最小值是通过简化,如下所示:

在这个时候,我们需要注意一个特例:当分母在模糊矩阵方程(13)是零距离 样本数据和集群中心之间的这个时候是0。人们普遍认为j示例数据属于我的类。这个过程完成后,集群是重新计算的平均值来获得一个新的集群中心,重复这一过程直到标准函数收敛。距离计算函数通常是欧几里得距离,距离收敛标准数据对象通常是平方误差准则,这是

其中, 代表任何数据对象, 代表所有数据对象的平方误差的总和。 集群的平均值吗 数据 坐落,之间的距离的平方和每个数据对象和集群的中心点,它位于终于获得。可以计算的平均绝对偏差

在这里, n的措施吗 , 的平均值吗 这是

计算归一化测量

其中,平均绝对偏差的 更健壮的异常数据的标准差。最常用的距离测量是欧几里得距离。欧几里得度量,也称为欧几里得距离,是一种常用的距离的定义,是指真正的m维空间中的两个点之间的距离,或者是自然的一个向量的长度。欧氏距离在2 d和3 d空间两点之间的实际距离,这是

在这里, 是两个P-dimensional数据对象。另一个常用的曼哈顿距离距离计算方法。曼哈顿距离,也被称为曼哈顿距离,两个点之间的距离在南北方向+在东西方向上的距离。当坐标轴变化时,点之间的距离将会不同,它被定义为特定的计算方程

数据复制技术在一定程度上解决了不同数据的不匹配每个数据源的数据复制到其他相关的数据源,从而大大提高了信息共享和使用的效率。数据复制技术的一般过程如图7

如图7数据复制技术可以确保相同的数据存储在不同的节点上是一致的。这样,当一个节点失败时,可以从其他节点获得数据,存储数据,避免数据丢失,因此提高了系统的可靠性。数据复制可以提高数据融合系统的性能,减少不同数据源的数量,避免频繁访问不同的数据来源,它减少了查询效率。

因为有许多不同的数据库,数据信息的提取和知识挖掘的发展在一定程度上是有限的。为了解除这个限制,数据仓库技术应运而生。基于数据仓库的数据集成模型图所示8

如图8,数据仓库本身也是一个数据库,这是非常简单的用户访问数据仓库。与此同时,数据仓库存储用户决策支持所需的所有数据,挖掘和分析,为用户提供了强大的分析和执行数据支持。

4所示。数据处理系统智能云计算的实验和分析

4.1。云计算的特点

这篇文章采访了4校园数据系统经理,分析云计算的特点,如图9

如图9云计算的特点如下:(1)超大型和虚拟化:云计算提供了最可靠的、安全的数据存储中心。用户不需要担心数据丢失、病毒入侵等问题。“云”的另一端是世界上最专业的团队来支持信息管理和最先进的数据中心,帮助保持数据(2)客户需求很低:云计算需要最少的设备在客户端和使用是最方便的。例如,为了防止病毒期间推出的下载,安装杀毒软件和防火墙软件必须反复。云技术,只要你有一台电脑上网,最喜欢的浏览器,你可以享受云计算带来的无限乐趣(3)轻松共享数据:云计算可以实现不同设备之间共享的数据和应用程序。在云计算的网络应用模式中,所有电子设备可以同时访问相同的数据通过简单地连接到互联网(4)强大的可伸缩性:云计算并不是特定于应用程序的。通过支持“云”,各种应用程序可以根据用户的需要。“云”的规模可以动态伸缩,以适应需求的应用环境和用户规模的扩张

4.2。传统的数据处理系统和智能云计算数据处理系统

目前,各高校一般有两个问题:缺乏科学性和准确性在研究生创业数据的收集和低水平的企业数据的利用率。对高校来说,很难获得准确的企业数据和有效利用没有一组科学创业数据收集过程和标准。企业数据的收集存在的问题如表所示3

如表所示3,企业家数据的利用率低,利用率低,意识和利用方法很简单。缺乏科学和准确的数据收集的企业家直接降低了数据利用的价值和重要性。

如何充分利用企业的宝贵的资源数据,并提供一个科学依据的转变学校和学科和专业的改革是高校迫切需要解决的问题。这些问题的解决具有重大意义,大学和研究生组。

在中国大学本科招生的扩张,在一个环境中,每年毕业生数量的增加明显,人才中心的研究生部门不仅需要使用企业服务的综合管理信息系统来管理大量的毕业生数据,还需要分析这些数据。分析毕业生的比例从2011年到2020年毕业企业数据管理的难度,如图10

如图10因此,为了智能和快速获取有用的信息和知识等创业服务创业学员从大量的数据来帮助员工做出总体规划为创业服务、数据挖掘历史数据的综合管理信息系统的创业服务,和分析模型和关系的挖掘结果已经成为不可或缺的环节。

与全球信息资源共享的实现,信息的数量的快速增长和改善请求信息。目前,很难满足实际应用的需要,传统的信息提取方法的基础上,提出了数据挖掘技术。本文比较了传统数据处理系统和智能云计算数据处理系统,如表所示45:

如表所示45推动下,当今高科技发展,数据挖掘的应用范围变得越来越广泛。将它应用到大学管理不仅可以促进进一步改革,学校管理的改善和发展,但是也为管理者提供良好的基础,做出正确的决策。与此同时,它还提高了科学性,实用性和学校的教务管理方法的效率。它使用数据挖掘技术来提取和分析大量的数据,找到隐藏的线索,为进一步决策提供更有价值的依据。

5。讨论

论述了如何研究一种智能云计算数据处理系统为大学创新与企业家精神的数据统计,描述了智能云计算相关理论知识和大学创新与企业家精神,并专注于数据统计的难度。它探索更科学的数据统计方法,讨论了云计算对数据处理系统的影响通过实验分析研究,最后发现,云计算可以使数据处理系统更加实用。

本文还研究了聚类分析和研究集群分析改进前后。它结合了传统的聚类分析和模糊理论,得到一种改进的模糊聚类分析算法。聚类分析在数据挖掘中起着重要的作用,可以使数据分类更快速。

可以从本文的实验分析使用数据挖掘方法在智能云计算数据处理系统不仅可以提高智能云计算数据处理系统的实用性,和数据统计的准确性也得到很大的提高。

6。结论

随着近年来大学毕业生的增加,大学毕业生创业的问题也已成为一个国家问题。国家不仅鼓励毕业生积极创业,还鼓励他们积极创新和创业,给了他们很大的支持。但是,随着人才的增加,它变得越来越难以为这些毕业生收集信息和数据。因此,本文提出了一种智能云计算数据处理系统为大学创新与企业家精神的数据统计。系统是基于数据挖掘的基础,结合云计算实现。然而,由于作者的能力有限,本文进行了一般分析框架和研究的数据处理系统。在方法部分,主要阐述了关联规则算法和基于数据挖掘的聚类分析方法。这两种算法应用于智能云计算数据处理系统,可提高数据处理的效率和分类数据,从而使毕业生更容易创新和创业。在实验中,分析了云计算的优势和发现,云计算不仅大规模处理数据,还可以共享数据,这使得创业更方便的信息收集。实验最后发现,基于云计算的数据处理系统比传统的数据处理系统,更加有效和具有高度的科学。

数据可用性

没有数据被用来支持本研究。

的利益冲突

作者宣称没有利益冲突与任何金融机构有关材料报告在这个手稿。

确认

这项工作是支持的重点科研项目的高校在河南省(20 b880015)和特殊的研究项目创新与企业家精神2021年黄河水利技术学院教学改革(2021 cxcyjg008)。