文摘
大数据是平衡的结果和需要大量的计算能力,迅速更新,和全面的数据集,现在广泛应用于城市规划、医学等领域。随着大数据的时代,体育产业也必须适应这一变化。大数据的时代带来了新思想的发展体育资源交互。同时,要求高效率和高性能体育大数据集成系统迫在眉睫。学校体育和社区体育之间的交互实现的实践能力的提高两个机构和部门通过满足人们的需求。它影响人们的终身体育和健康改善外部环境到内部因素。它可以提高生活质量,维护社会稳定与和平,从而确保更好的大学和社会的发展。目前,数据集成的速度在运动大数据集成系统是相对较慢。为了解决这个问题,本研究介绍了人工神经网络中的BP神经网络。介绍了神经网络的概念及其相关公式。 By using the BP neural network classification algorithm for data classification integration, this study conducts training and performance testing of the network. It links the extraction, transformation, and loading of data. The experimental results show that when the number of databases is 2, 4, 6, and 8, the time taken to load data by the system in this study is 113 s, 87 s, 64 s, and 42 s, respectively. It can be seen that the system in this study has obvious advantages in data loading compared with the data integration system of the existing system data warehouse. The system data query designed in this study is more efficient and consumes less time.
1。介绍
随着大数据时代的临近,大数据的内容变得更加熟悉的人类。体育是一种特殊的社会和文化活动由中国几千年来。大数据是一项重要的体育发展的机会和重要的数据处理逻辑,从大数据高效。它扮演着一个重要的角色在学校体育的协调发展,社会体育、竞技体育。人们做运动在家里、学校或社区。体育信息在家庭、学校和社区也将相互交换和沟通。但家庭体育、学校体育和社区体育有自己的特点和主要对象,他们都是相关和不同。
未来的大学应该使用其设施和物质资源积极参与社区体育的发展,体育产业的创建。满足教师的迫切需求、学生和公民提高他们的业余时间和运动。通过研究高校体育和社区体育之间的相互作用机理,实现人类的相互作用,材料,和文化资源。它促进了中国社区体育和高校体育的健康发展。它可以提高人们的身心健康。它能改善生活质量。这是一个社会主义精神文明建设的重要支柱。
本研究的创新有:(1)本文提出改善传统学习算法的组合变量学习速度和加速度。(2)本文使用一个系统对收集的数据进行分类体育大数据集成系统和提供了一个有效的网络连接比较之前和之后的算法升级。
2。相关工作
关于体育大数据相关的科学家做了以下研究。通过收集和解释大量数据集,他们提供了一个丰富的知识来指导决策者在社会的各个方面。这在体育管理也不例外。渡边解决这些问题,推进大数据在体育管理中的应用研究以及如何使用大数据推动体育产业的学术研究。他扮演了一个角色在推进运动的理论分析,生成新的知识,分别和开发新调查。它奠定了基础为未来的研究在这个不断增长的领域领域的体育管理(1]。大数据、人工智能、数据分析、机器学习和神经网络是当前行业的前景。这是紧随其后的是一颗冉冉升起的新星,在当前技术领域。Patel等人研究了大量的行业覆盖。它提供了一个深入研究的整个体育产业在许多方面受到影响。不仅是球场上的表现,但也影响商业影响和球迷的浸2]。分析数据和大型数据库的快速增长影响生活的方方面面。体育产业没有生存发展。Morgulev等人提供三种类型的数据驱动的例子分析在运动。它包括域级分析关注球员的行为,教练,裁判,分析管理和决策者的决策,和文学使用运动数据的分析来解决各种各样的问题领域的经济学和心理学。
以下是由研究人员负责人工神经系统。艾拉妮丝提出使用卡尔曼滤波训练算法的结果基于广泛重复神经系统和它的使用在预测电值。有两种情况:一步N前进。的稳定的实现提出了人工神经网络的开发使用一种改进的基于卡尔曼滤波算法。这演示了该预报系统的好处使用一步向前,向前N-step系统数据(3]。Isik供热系统设计和Inalli提供预测数据。它所收到的信息从芬兰气象研究所的一个人工神经系统和基于模糊系统的自适应系统。天气结果是令人满意的。他还展示了一个城市的地图的年度相比太阳能潜力和米高梅的结果。该方法的结果与实际结果一致。决策者可以很容易地使用这些方法在创建应用程序(4]。李等人研究了如何利用神经网络来管理保护街区连接到互联网减少障碍。神经网络实现了有效的编程算法,训练有素的传播。增加效率和稳定,他还介绍了其他方法,包括集成的主要输入误差信号和连接电源电压的电源插座(训练5]。通过调查和分析中国青少年的身体健康数据,Ascione等人提出作为实证研究的一部分青少年健康大数据管理服务系统的建设。健康干预训练的结果可以有效地提高青少年身体健康的关系假设。研究结果表明,青少年身体健康促进理论可以提高青少年的身体健康通过干预学生的体育锻炼。在数据处理方面,GBDT更合适当训练集相对较大。随着样本容量的增加,准确率可以达到79.79%6]。上述研究大数据的详细分析体育项目和人工神经系统。难怪这些研究类似领域的发展做出了巨大的贡献。它可以教许多技术和数据分析。然而,很少有研究领域的人工神经领域的数据人工神经系统,有必要全面实施这些算法在该领域的研究。
3所示。体育大数据集成和资源交互方法
3.1。数据集成
数据集成是一个过程,将来自不同数据源的数据组合成一个连贯的数据集,是否逻辑或物理。数据集成的主要任务是整合相关,不同的和异构数据的方式,用户可以透明地访问。数据集成的一般方法包括联邦数据库系统、中间件集成方法和数据仓库的方法。联邦数据库系统将来自不同数据源的一组视图转换为一个共同的模式,允许用户透明地访问来自不同数据源的数据。可以共享数据模式与其他数据源创建一个统一的系统(7]。中间件集成方法为用户提供了一个接口来访问数据。从用户的角度来看,集成数据源看起来像一个单一的实体。中间件坐标不同数据源系统,并充当一个中间人。数据仓库方法涉及创建一个数据仓库来存储数据。基本上,数据复制是通过每个数据源的数据复制到相同的位置,数据仓库(8]。
使用数据仓库方法的原因如下:(1)数据仓库方法已经存在大量的业务数据库。它可以实现业务数据的有效集成,而不影响原来的业务系统。它不占用本地处理资源,也可以存储和整合的历史信息。它还支持复杂的多维查询。(2)中间件集成方法需要复杂的信息过滤和集成处理。它将抢占本地处理资源,经常查询时效率低下,需要很高的成本。(3)联邦数据库系统查询所需的响应时间有点长,所以频繁查询是不适合的。特别是,该方法容易锁争用和资源冲突等问题9]。
数据仓库是存储在不同的业务系统中提取数据到数据仓库。不同的业务系统数据源中的数据可能有不同的名称或物理含义在同一领域由于不同的开发系统,操作系统,开发语言和系统开发人员的习惯。这也是一个重复的字段名称与不同的含义。因此,它是非常必要的进行数据预处理根据一个统一的信息标准。通过这种方式,可以确保数据一致性,和系统集成困难造成数据的不一致是可以避免的,影响用户的决策(10]。(3)相对稳定:数据仓库的应用主要涉及很多工作的查询、分析和挖掘。相对而言,有相对较少的情况下,包括修改和删除操作。一般来说,只需要定期维护处理提取新数据,删除不必要的数据,和其他操作,所以它是相对稳定的。(4)时变:存储在数据仓库中的数据通常是历史数据。时间戳数据在数据仓库的一个重要特性。这些数据的挖掘和分析可以在一定程度上预测未来发展趋势(11]。图1显示了数据集成的系统模型。
数据集成是异构数据在逻辑上或物理集成到一个统一的数据平台(12]。它是方便用户访问统一的观点和方法。它提供了数据集成、共享和融合服务。异构数据源主要有三个特点:自主性、分布和异构性。每个数据源是一个独立的实体,并有很强的自主性。在某种程度上,它可以直接沟通,只与其他数据源和改变自己的数据和结构没有通知集成系统。
数据源通常是分布在不同的地方。分布在不同的地方,它依赖于网络交换和共享数据(13]。此外,分布的数据源不仅包括一个物理位置的差异,也由于不同数据源的分布在一个逻辑位置。在正常情况下,每个数据源系统是独立开发的由不同的开发人员在不同时期的不同发展时期,和使用的开发平台和开发语言是不同的。他们会导致困难数据源的统一管理。因此,数据的异质性是需要考虑的核心问题在数据集成的过程中(14]。
中间件模型系统的主要组件是中间件和贝壳,和每个数据源由贝壳。一个包装是一个组件,该组件使用一个数据库与中间件。中间件与每个数据源通过框架。用户发送一个请求到中间件和中间件将用户的请求为每个异构数据源成一些子请求可以由每个数据源进行处理。包装器封装了数据源,变换的数据模型,并提供一个访问机制(15]。与集成的数据库模型相比,中间件模型的优点是,统一数据可视化逻辑允许用户查看数据源集成作为一个整体。底层数据是隐藏的细节和每个数据源可以由操作系统访问。它也有防止不同的网络协议。因此,中间件可以提供一个相对稳定的高层应用环境。重点是总体查询优化和性能。但是,中间件模式不是万能药。中间件应用程序跨不同的模式移植较低,通常都是只读的。如图2,它是一个middleware-based数据集成模型。
有许多原因数据源的异构性。每个业务系统的发展时期不同,开发平台不同,操作系统是不同的。数据是否完全从原始数据源中提取相应的目标数据库,数据的逻辑关系是不同的,数据存储的形式是不同的,不同的业务系统数据的定义是不同的。经理和每个数据库的操作和维护人员有不同的名称和物理意义为特定领域的数据。这些是数据源的异构性的原因,导致数据集成的困难。
数据复制是独立的数据源中数据的复制到其他相关数据源异构数据中消除矛盾和协调信息的共享和使用。数据复制可以提高数据集成系统的性能通过限制数量的用户密钥对异构数据源和防止查询性能退化引起的频繁访问异构数据源。所谓的数据仓库是复杂的数据存储库。来自不同数据源的数据提取,清洗和转换、数据仓库和复制。数据仓库本身就是一个数据库,这是非常方便用户访问。也是复杂、时效性和弹性变化。存储库存储所有的数据需要支持决策、检索和分析的信息。它还为用户提供了有效的支持数据分析和实现16]。如图3,它是一个基于数据仓库的数据集成模型。
最早的数据集成方法的模式集成方法。其他数据集成方法的基础上研究了模式集成方法。联邦数据库是一个典型的模式集成方法和广泛使用的方法。直接集成会员数据库,从而实现数据共享和交换的目的成员数据库。每个数据库的操作系统是独立的,与其他数据库无关。在联邦数据库系统,接口相互交流和访问所有成员被添加到数据库。联邦数据库系统可以是一个集中式数据库系统或分布式数据库系统和其他联邦系统。在联邦数据库系统中,一个联邦引擎需要安装和配置与外部数据源通信。包装器的功能是将用户的查询请求由查询分析器来分解到每个成员数据库中执行的查询请求来执行。每个会员数据库执行请求后,它接收到返回的结果和过程按照一定的标准和规则。 The query integrator synthesizes these query results and returns them to the application server.
根据不同的模式和耦合方法,联邦数据库系统可以分为两种形式:紧密耦合和松散耦合。一个或多个统一的全球模式需要建立紧密耦合的联邦数据库系统。这种统一的全球模式提供了一个统一的访问方法,它的优点是相对静态的和高度集成。然而,添加数据源是更加困难。建立一个全局数据模式非常复杂,导致困难的系统升级,可扩展性差,和有限的紧耦合的应用程序。另一方面,不采用全球模式的松散耦合,不提供一个统一的接口。虽然不如紧密耦合的集成,动态性能优势是显而易见的。松散耦合不需要高度集成数据,它是独立的一个集成系统,连接数据源。两种模式都有自己的优势,如何选择取决于特定的场景中,如系统组件的数量、用户需求、访问体积的大小,和成员的特征数据库。联邦数据库的优点是系统不需要经常提取增量数据,但将请求直接发送到会员数据库,然后聚集结构,高实时性能。 However, the query efficiency of the federated database is low, and the resource consumption is obvious when the query request is too frequent.
中间件集成方法也是一个更常见的集成方法使用全球模式。相比之下,联邦数据库、中间件系统使用一个统一的模型来访问异构数据库。它集成了半结构化或非结构化数据源中的数据,等。中间件位于中间的应用软件和系统平台,它为应用程序提供了一个统一的数据模式异构数据源访问数据。数据访问也是通过数据访问的通用接口。每个数据源的应用仍然完成各自的任务。中间件系统的主要任务是为用户提供一个先进的检索服务访问异构数据。
3.2。人工神经网络
神经网络是一个网络有大量相互连接的计算机单元。数据处理发生在人工神经网络中神经元之间通过通信。数据和信息的存储出现分散的物理连接,结合网络组件,而人工神经网络的学习和识别的特点是重量的极端发展相互连接的神经元(17]。除了网络地形同质性的属性,也是神经网络的一个重要特性。在各种增强神经网络中,最常用的学习算法之一是错误交换算法和BP算法。BP网络的基本思想是输出层错误re-decentralized逐步调整系统参数和正确的网络错误18]。图4显示了神经系统的功能和血压。
整个学习过程的BP算法可分为两个阶段:训练输入和转移的转移阶段阶段的错误表。输入数据生成的第一个输入层,然后隐藏神经层过程的数据分析,最后,输出层生成的输出数据。直接沟通的过程中,的重量之间的连接层的BP神经系统不会改变(19]。每个神经细胞影响的权重较低的神经连接这些神经元的状态后联系。如果输出没有达到期望值,BP神经网络不是完全充电,进入“反向传播”阶段的误差范围内。误差的反向传播阶段的信号,实际和理想的结果所产生的误差信号传输从输出层的输入层网络。当误差范围内分发给每一层,第一层的神经元水平和调整现有的两个层之间的重量根据特定的规则,这样的结果是接近目标的结果(20.]。
神经网络是一个网络有大量相互连接的计算机单元。在人工神经网络、信息处理通过神经元之间的通信和数据的存储,和信息表达通过分布式网络组件之间的物理连接。研究和识别的人工神经网络是由单个神经通信的动态演化的因素。除了单元属性,神经网络的一个重要特性是空间网络(21]。根据不同的连接方法,神经网络可分为下列形式:(1)先进的网络。神经细胞分为多层层组成的中间层(也称为一个间接层,可以有多个层)和一个输出层。每一层的神经元仅接收来自第一层神经元的输入。下面的段落对前款规定不予置评。输入模式逐步通过每一层最终,生产层被接受作为输出。(2)纯反馈。这是输出层的反馈到输入层。(3)网络连接规则。通过结合在一层神经元,抑制或刺激神经元之间可以实现在同一层。 (4) Interconnected networks (including full and partial connections). This type of network is a network that can connect two neurons [22]。
BP网络的学习过程由两部分组成:正向传播和反向传播。向前传播中,输入信息从输入层到输出层发送设备处理后的隐藏层,和在每一层神经元的状态只影响下一层神经元的状态。如果没有达到所需的输出在输出层,切换到反向传播,误差信号沿着原路返回的神经元连接。在反向传播过程中,每一层的神经元之间的连接权值是逐渐发生了变化。这个过程被重复,最后,公差极限内的输出误差信号的系统。
BP神经网络具有以下基本特征:(1)它可以学习和存储大量的输入和输出之间的关系没有先验知识的数学方程描述这些关系。如果网络可以训练对足够数量的模型,它可以执行一个非线性映射从输入空间到输出空间。(2)普遍性:如果网络是美联储的数据没有被观察到在训练期间,网络将能够正确合适的输入空间到输出空间。(3)容错。大输入模型中的错误,甚至是一个错误,没有对网络的输入和输出模型的影响。
尽管BP网络具有上述优点和广泛应用,它也有一些缺点,即(1)由于固定的学习速度,网络的集成速度非常慢,处理时间非常缓慢。学习是长。如果问题是复杂的BP算法的训练时间很长。主要原因是学费率太低,可以使用变量研究改进或调整利率如BP校正算法。(2)BP算法可以生成重量在一定值,但没有保证这是一个普遍的最小错误率,斜率可以导致局部最小值。这个问题可以通过其他直接解决技术,如英国石油公司紧急算法。(3)没有理论指导方针的选择层数和隐层网络中,通常由经验或重复实验。结果,在网上经常有多个职位空缺,进而增加了在线工作的数量。(4)学习和记忆的网络不稳定。换句话说,当添加实验训练,经过训练的神经网络需要重新训练,和前面的权值和阈值是不记得。
为了解决这些传统BP算法的缺陷,本文提出了改进BP算法。它解决了网络训练问题使用变速学习方法,然后试图改进算法的连接,以便本地网络不降至最低水平在训练。在实践中,电子学习沟通的价值显著影响算法的集成和效率。其最佳值通常是与一个特定的问题,所以没有合理的研究速度为每一个问题。事实上,尽管某些问题,它并不总是能够找到正确的学习步伐。由于算法学习速度的变化非常敏感,如果这项研究速度设置太低,集成速度非常缓慢。如果这项研究速度过高,尽管可以加速整合的速度,它可能导致体重变化的调整。因此,我们需要改变的速度在线学习特定的教育条件。 在哪里误差均方误差 在哪里隐层节点和吗是输出层节点。 在哪里是任何重量和是任意的神经元阈值。 在哪里初始网络的输出和吗是负梯度。 在哪里是学习速率。 在哪里动量系数和吗 是加权调整。 在哪里 比例因子。 在哪里实际的输出值和什么是理想的输出值。 在哪里 是新的一个校正和后重量吗是学习的因素。 在哪里是输出神经元的数量。 隐层节点的数量和吗是隐藏层的激活函数。 在哪里是可控的斜率。 在哪里隐层输出和吗是连接权重。 在哪里网络预测误差,是网络连接权重,是学习速率。 在哪里个人健身价值。 在哪里是个体的适应度函数,是系数,是人群中个体的数量。
在这项研究中,改进的BP神经网络用于运动数据进行分类,然后分别集成的分类数据,以及人口分布、土地、资金、公共资源等在体育部门。
4所示。体育大数据集成和资源相互作用的实验
基于改进的BP神经网络分类模型包括三个步骤:结构的BP神经网络,训练BP神经网络,神经网络BP和分类。图5的分类系统是神经系统的流动。
在培训之前,实验系统还要求用户确定目标网络的准确性。如果训练神经网络满足这两个条件之一,所有培训被认为是完整的。如表所示1,电子学习的速度和数量的训练时间比较。
从结果可以看出,该算法在一定程度上提高神经过程的集成。此外,训练结果表明,神经网络集成了更快的开始练习。随着培训增加,积分减少的速度。
在本文中,排序规则设置为正确的排序结果如果误差小于0.5和统计排序结果如表所示2。结果是,最终分类的准确性高达98%或更多。
在不同数量的机器,BP网络训练的实验分别完成,和各自的运行时间记录,如表所示3,这是一个集群计算性能的比较表。
在完成分类器的设计神经网络模型结构和参数,有必要应用设计值和样本集进行训练。培训期间,一轮向前运行所有样品和修改权重反方向被称为一个培训。图6显示了单一BP分类测试结果。
可以看出1型错误的平均数为20.8,2型错误的平均数量是29。从这一点,可以计算出第一类错误率是0.1041,第二类错误率是0.1542,平均分类错误率的10组测试是0.1282。
单个BP分类的基础上,英国石油公司被视为弱分类,分类和多个弱分类集成通过一种改进的算法。本研究按顺序组成的列车提高分类2 11弱分类的一个BP神经网络,结果如图所示7。
数据采集、数据转换和数据集成的检索是非常重要的方面。数据检索、编辑和数据库检索是最重要的组成部分。在一个大型体育数据模型相结合,参考表和浏览表存储参考数据库数据和指标。基表、下拉表和汇总表存储业务与不同精度和实际数据。在最好的粒度,基表存储业务数据和导出汇总表存储业务数据总结。图8显示了关系数据提取、转换、加载,提到了三个表。
基于改进的BP神经系统数据集成系统相比,本文设计的传统数据集成系统。图9是时候用于检索数据。
测试结果可以清楚地看到,系统在数据加载在本文中具有明显的优势与现有系统数据仓库的数据集成系统。此外,该系统在这项研究中具有良好的可伸缩性,几乎线性膨胀,加载速度时的节点数量的增加呈线性增加。
在相同的硬件配置,系统在这项研究中使用四个节点比较查询的复杂性对性能的影响与现有的系统。如图10,查询效率比较。从图可以看出,系统设计在这项研究中具有较高的查询效率。当数据库的数量是不同的,数据加载所需的时间小于现有的系统。
5。讨论
通过体育大数据的集成的结果,一些建议高校体育和社区体育资源之间的交互。大学体育的兴趣点是改善学生的训练,和相应的驱动大学体育科学研究和经济收入水平。对社区体育的目的是获得更多的健身机会和科学健康水平。政府的利益在于有效地组织群众体育,形成一个健康的体育文化环境,促进社会发展。社会的利益在于获取资本增值的机会,一个稳定的市场。经济管理方法是使各方利益收集和集中注意力,并互为补充。
学校体育和社区体育的互动形式发挥作用在三个层次:物质技术层,组织系统层和价值概念层。在合作与互动,大学体育和社区物质和技术互补,共同完善组织制度,促进彼此的价值观。相互作用的竞争,材料和技术的水平应该通过竞争,来提高组织的改善系统应该通过竞争,来改善和应适当引入市场竞争机制促进更新的值。在弱相互作用行为,材料技术是在一个方向上传播,组织系统的响应和适应外部变化,巧妙地和价值观影响对方。
学校体育和社区体育之间的交互方法包括加强小组沟通和指导小组目标;增加集体活动,培养体育兴趣;加强集团规范和提高凝聚力和情感;改善个人训练和比赛水平的促进体育组的大小;在迭代的交流;加强物理平台的建设有利于老年人;加强组织建设,提高组织能力;和使用适当的管理策略来提高管理水平。
6。结论
科学技术与社会之间的互动是社会发展的持续推动力。促进群众体育和公共服务在中国需要人才和资源之间的交互。当事人如何参与社会互动整合他们的行为通过经验机制,如何加强互动,这种交互系统的特点,进而影响互动各方对有关问题的理解,以及如何处理和影响有关问题。他们都需要体育大数据的综合分析。本研究介绍了BP神经网络来构造一个数据分类系统。它加速运动的速度大数据集成。此外,本研究提出了一些方法建议高校体育和社区体育。在这项研究中,不同结构的分类误差比较方法用于确定最终的网络结构。不难发现这个方法,但是需要大量的对比实验,所以有必要探索一种更简单的方法来确定网络的拓扑结构。
数据可用性
没有数据被用来支持本研究。
的利益冲突
作者宣称没有利益冲突有关这篇文章的出版。
确认
作者没有得到金融支持研究,本文的作者,和/或出版。