文摘

当前上下文的建立世界一流的大学和学科在中国,本研究调查了在大学研究基金的投资。首先,六个变量被选为评价指标从固定资产的角度来看,教学配置,研究工具和书在图书馆的数量。七十二所大学调查了从2013年到2017年。其次,构造了一个评价体系使用BP(反向传播)神经网络方法及其适用性验证。最后,通过调整六个指标,大学研究基金的投资可以调整和预测提供参考“头等”大学和学科的建设。

1。介绍

自改革开放以来,中国已经更加重视教育,特别是当世界正处在大发展、变化和调整,与快速科技进步,经济全球化不断深化,并为高技能工人的激烈竞争。与此同时,高等教育在中国的发展举世瞩目。最初形成社会主义高等教育体系的构建,这是多样的,多层次,和完整的学科来满足经济建设和社会发展的需要,大量的优秀和一流的高技能工人被训练为社会主义现代化建设和发挥巨大的作用在国家的经济建设、科技进步和社会发展。今天,在知识经济的时代,先前实施“211”工程和“985”项目的高等教育政策暴露出一些问题,比如资源利用率低,身份整合,缺乏公平、有效的竞争等因素。国家的发展需要提高我们的质量和培训创新高技能工人。考虑到中国的现状及其改革的关键时期,以及先进的高等教育的国际经验,政府引入了一个“双一流”大学的政策体系。

研究从每个大学科学研究基金投资在基础设施和设备方面更有利于了解和掌握当前的“头等”大学在各方面。固定资产的增加大学,科研仪器、设备的购买,和扩大图书馆的书更有利于确定资金的范围,促进基金的使用实践,有效地促进一流大学和一流学科的建设和发展在中国效率高。

2。文献综述

2.1。研究评估学校的设施

通过分析当前高校教学实验室的发展,地位高(1)提出优化方面的教学实验室信息化建设和社会服务,以便教学实验室能够更好地促进“双一流”的发展学校。张(2]讨论了一流的实验室建设的重要作用在“双一流”大学和提供参考意见促进“双一流”的发展建设项目在三个方面:实验室管理机制、实验室条件建设,实验室老师团队配置。

刘和丁3]使用上海大学图书馆为例,研究学科文献资源的可用性建设“双一流”的大学。提出建立一个文档资源保障体系应该适合一流高校学科建设,重点建设学科文献资源的组织和定期评价和评估。张,郑4]总结开放的现状和高校大型仪器设备的共享。他们提出了一种新的方法公开分享这些资源在现实背景下“双一流”建设的大学。江et al。5]分析了当前“双一流”的重要性在新的实验教学平台建设。深三维教学设计,如在线资源和测试,进行了讨论。重点是培养学生的基本实验技能和创新意识以及提高实验教师的能力。吴和马6了42”双一流”大学图书馆为研究对象,强调开放科研成果的重大问题。相信制定和完善政策应加强意识到早期开放的科学研究成果。风扇等。7)研究和评估的要求建设“双一流”大学图书馆资源的建设。他们提出了相应措施的运行库的梯形资源建设模式和相关政策机制。

2.2。研究基础设施与神经网络大学的评价

王(8)用BP神经网络建立评价指标体系对图书馆电子资源的质量。通过实证研究图书馆的电子资源,管理的有效性评价是澄清。刘和李9使用SOM(自组织映射神经网络聚类算法研究在高校图书馆数字化建设的突出问题。他们屏幕和过程相关数据资源的用户形成相关的数据集,并结合相关技术建立在大学图书馆个性化推荐服务系统的用户。Zhang et al。10)进行了全面、科学的评价信息传播能力的智库在我们聊天的公共平台。他们使用BP神经网络模型进行了仿真验证。评价模型具有较强的可操作性和实用性,可以为信息传播提供新的方法和理念。Zhang et al。11)用BP神经网络建立一个评价体系。他们使用的能力成熟度模型研究智库大学图书馆的服务功能。它有利于高校图书馆来确定自己的智库服务能力水平和优化和改进目标的方式。

2.3。教学质量评价的神经网络研究的大学

郑,严12)使用一种教学评价机制来衡量教学质量。通过三个方面的差异教学质量、教学评价的统一主题,和教学评价的棘手的手术方法,全面建立了教学质量评价体系。风扇和马13)大学教师的教学质量评估通过建立一个复杂的非线性关系教学质量和各种指标的评价结果。朱和王14)用粒子群优化方法建立BP神经网络评价模型。它解决了科研绩效评估的问题所面临的学院和大学的科研管理部门。它使用粒子群优化优化BP神经网络的初始权值和阈值模型,然后做出预测。

总之,大部分的研究“双一流”大学的建设进行了结合大学的基本配套设施,教育教学的质量和其他方面。很少有研究在大学研究经费,和缺乏研究,利用神经网络进行深入分析。本研究使用神经网络模型来讨论各大高校的科学研究基金投资方面的基础设施和硬件设备的“双一流”大学和讨论相关的影响。

3所示。BP神经网络模型

一个人工神经元模拟抽象、简化和模拟生物神经元。它是一个人工神经网络的基本处理单元。神经网络学习是人工智能领域的基本算法。这是一个心理学家麦克洛克提出的数学模型和数学家在1943年皮特。其主要应用领域包括模式识别、智能机器人、非线性系统识别、知识处理,和其他因素。

3.1。神经网络感知器的数学模型

最常见的神经网络模型只有一个单隐层的三层感知器。这些三层输入层、隐藏层和输出层。有一个信号之间的数学关系每一层如下:

隐层,

为输出层,

在公式(1)和(2),变换函数 通常是一个单极乙状结肠功能,我们称之为

乙状结肠函数导数连续。对方程(3),我们称之为

如果有必要,您还可以使用双极乙状结肠功能:

以减少计算复杂度,输出层根据需要还可以使用线性函数:

3.2。BP算法的推导过程

以下采用三层BP神经网络模型为例,推导出BP学习算法。(1)网络错误如果网络输出不等于预期的输出,然后有一个输出错误E如下: 扩大上述错误隐藏层, 此外,扩展到输入层: (2)网络重量根据梯度下降法调整从方程(9),输入错误的神经网络权值的函数 每一层。通过调整权重值,错误E可以改变,所以调整数量的重量值成正比的梯度减少错误,即 在上面的公式中,负号表示梯度下降法。常数 是一个比例因子,反映了学习速率。当然,BP算法属于 学习规则。方程(10)和(11)只调整权重的数学表达的想法。重量的计算公式推导调整三层BP算法如下。假设所有的推导过程 , 对于每一个输出层 , 为每一个隐藏层。为输出层,方程(10)可以写成 方程(11)可以写成 我们定义一个误差信号为输出层和隐藏层。 综合应用公式(2)和(14):重量的调整公式(12)可以写成 综合应用公式(4)和(15):重量的调整公式(13)可以写成 计算出误差信号 在公式(14)和(15);然后,体重调整量的计算和推导过程也完成了。输出层 可以扩展到 隐藏层 可以扩展到 接下来,根据公式(18)和(19),我们发现网络的偏导数误差每一层的输出。输出层:使用方程(7),偏导数可以获得: 隐藏层:使用方程(8),偏导数可以获得: 用上述结果为公式(18)和(19),应用方程(4), ,我们获得 用方程(22)和(23)到方程(16)和(17),重量的计算公式调整BP学习算法的三层感知器可以获得: (3)向量形式的BP学习算法输出层:假设 , ,权重矩阵的调整隐层到输出层 隐藏层:假设 , ,权重矩阵调整从输入层到隐层 根据公式(25)和(26),在BP学习算法,每一层的权重的调整公式是相同的相同的形式。他们都需要三个因素,学习速度 ,错误的信号 由这一层输出,输入信号Y(或X这一层。每一个隐层的误差信号与上一层的误差信号,并传送从输出层和回输入层。

3.3。确定输入变量和输出变量
3.3.1。输入维数减少

邻近像素的图像数据,是高度相关,所以输入数据有点多余。假设一个16 x灰度值图像处理。输入是一个256维向量 ,特征值 对应于每个像素的亮度值。由于相邻像素之间的相关性,需要对输入向量转化为一个近似向量维数较低。这时,误差很小,不影响处理结果,但计算量大大减少。

主成分分析(PCA)是一种统计分析方法来识别事物的主要矛盾。计算主成分的目的是找到 新变量。每个新变量是原有的线性组合n变量。它们反映了原始的影响n不相关的变量,这些新的变量。

3.3.2。输入和输出数据的预处理

规模正常化是一个线性变换。不祥之兆数据的每个输入组件的值。这些尺寸可能是相互独立的。确保最终的数据向量落在区间[0,1]或[−1,1]。当处理获得的像素值自然图像在区间[0,255]。常见的过程是这些像素值除以255规模[0,1]。将输入和输出数据的价值区间[0,1]: 在哪里 代表输入或输出数据, 代表数据的最小值变化, 代表数据的最大值变化范围。

如果输入或输出数据转化为一个值的范围(−1,1),常用以下转换公式:

代表了数据变化范围的中间值。根据上面的转换改变后,原始数据的中间值转化为零。最大的值转换为1,最小值转化为−1。

3.3.3。训练样本集

法律在神经网络训练可以从样品中提取。因此,一个高质量的数据样本集是一个重要的和关键的一步。样本的选择应该不仅具有代表性,而且消除无效的数据和错误数据。与此同时,我们必须统一样本类别和样本大小。通常情况下,如果训练样本的数量大,培训结果将更为精确地反映其内部的法律。然而,当样本的数量达到一定上限,更难改善网络的准确性。一般来说,训练样本的数量总数的5 - 10倍的网络连接权重。

3.4。BP网络结构设计

通过训练样本,在输入和输出层的节点数的网络可以确定。BP网络的结构设计主要是用于确定隐藏层的数量,每个隐层节点的数量,和每个节点的神经元激活函数。

隐藏层的数量的确定:根据理论,如果一个前馈网络只有一个隐层设计多层BP网络时,它会首先考虑设计只有一个隐藏层。当有太多的隐藏节点在一个隐藏层和网络性能无法改善,第二个隐藏层将被考虑。

确定隐层节点的数量:隐层节点的角色从样本中提取内部法律并存储它们。常用的经验公式确定隐藏节点的数量如下:

在上面的公式中,隐层节点的数量和吗n输入层节点的数目。l在输出层节点的数目,然后呢 1到10之间是一个常数。

近似和概括的考虑:权重和阈值的总数反映了网络的信息容量。的保险设计隐藏节点的数量可能导致“过度拟合。“噪声样本中被保留,但它减少了概括能力。上面的设计使用经验和试验。神经网络设计的理论指导仍然需要改进。研究表明,训练样本的数量P给定的训练误差 和网络信息的能力 应该满足以下匹配关系:

4所示。科学研究基金的实证分析与BP神经网络在高等教育

在这项研究中,六个评价indicators-fixed资产,教学和研究仪器、设备,教学和研究仪器、设备,大型教学和研究设备数量超过400000的大型教学和研究设备数量超过400000的数量和书籍在图书馆选择作为输入变量。固定资产、教学和研究设备和图书馆收集是由学生和老师使用的工具获取新知识和解决研究问题,这是很重要的在改善教育和研究的质量。另外,随着科学技术水平的持续改进和持续过程的加速度informationisation在这个时代,教学、科研仪器、设备越来越先进,发挥着越来越重要的作用在进行相关的教学实验。2018年,中国双级大学固定资产投资约3882亿元,总共631万块教学和研究工具,投资约1266亿元,其中400000多教学和研究设备约326亿元,占总数的25.8%投资在教学和研究设备。图书馆收藏大约2.5亿本书。一般来说,固定资产、研究工具和库集合包括高校教学和科研的基础设施,和他们也基本要求的建设中国“双一流”的大学。

作为研究对象,72所学院和大学的“双一流”的学院和大学在2017年被选中,和上述指标作为网络输入,科学研究活动的数量作为网络的输出,确定隐层节点的数量根据隐节点数的经验公式,从而形成了一个6-3-1的神经网络结构。BP神经网络是使用软件创建的R使用相关函数,确定权重和阈值。最小最大正常化方法用于正常化样本指标数据与总分,以及神经网络函数用于创建正向网络实现任意映射的神经网络输入输出。神经网络的算法计算rprop +激励函数从输入层到隐层Tansig,激励函数的隐层到输出层Purelin,学习速率设置为0.01,在隐层神经元的数量是3。停止队列的误差函数为0.001,迭代训练允许的最大数量是100000,和训练的数量是1000。设置网络收敛的误差性能指标均方误差(均方误差);设置输出模式是线性的输出和所有其他参数的默认值被选中。默认情况下,该算法用于神经网络函数是基于弹性与upweighted回归和额外的修改反向传播相关的学习速率的最小绝对梯度或最低学习速率本身。

学院2017年样本分为训练集和测试集,构造神经网络如图1X1是固定资产。X2是教学和科研仪器和设备的数量。X3是教学和研究设备的数量。X4是大型教学和研究设备的数量。X5是大型教学和研究设备的数量。X6是书在图书馆的数量。Y是科学研究的资助活动。

的最大一步训练神经网络是88143年。当达到这个值时,神经网络的训练过程停止。指定的阈值误差函数的偏导数,即停止误差函数的阈值,达到0.00098。这种神经网络模型的出错率为0.07809。黑线(线从输入节点)展示了每一层之间的连接和体重在每个连接上,而蓝线(线从偏差节点区分1)显示每一步添加的偏差。它可以被认为是线性模型的截距偏差。隐层的第一个节点的偏差为1.68549。隐层的第二个节点的偏差为16.14033。偏差的第三个节点隐藏层−4.87729。输出层节点的偏差为1.45841。 The specific values of the weights between the nodes of each layer are shown in Table1

从表1,第一个节点的权重的隐层产生更大影响的指标数量的教学和研究设备和大型教学和研究设备的数量指标,这两个发挥抑制作用。隐层的权重第二节点产生更大的影响教学和研究设备的数量,这是一个主持人,和书在图书馆的数量,抑制作用。隐层的权重第三节点产生更大的影响教学和研究设备的数量指标和教学和研究设备的数量指标,前者作为抑制剂,后者作为主持人。隐藏层和输出层之间的关系有更大的影响在第三和第一个节点。

神经网络的均方误差值651133098显著低于线性回归模型的值为1723270943,这表明神经网络模型更好。此外,它可以预测的对高等教育研究的资助活动“double-first-class”大学通过神经网络评价模型。只要这些指标的数据收集在某大学的某一年,可以预测资金的大致范围,大学的科研活动提供一个有效的参考在中国大学教育的资助。

5。总结

在当前的背景下在中国创建世界一流大学和学科,本文探讨了在大学投资的研究基金。六个变量被选为评价指标从固定资产的角度来看,教学配置和研究设备,图书馆的图书数量,72所大学从2013年到2017年的数据进行分析。神经网络的均方误差是651133098和1723270943的回归模型,并证明了神经网络模型比回归模型更有效。理论模型可以应用于实践,研究结果显示,可以修改和预测科学研究费用的投资策略通过调整大学的六个指标,它提供了一个有效的参考“世界级”大学和学科的建设。

附录

答:神经网络算法

库(“neuralnet”)#负载包set.seed (1)max_data <应用(数据,2、马克斯)min_data <应用(数据、2分钟)= min_data data_scaled <剂量(数据中心规模= max_data-min_data)#数据标准化的规模是一个通用的函数,默认的方法是中心或一个数字矩阵的列。指数=样本(1:nrow(数据)(0.70 nrow(数据)))# 70%的数据用于训练神经网络,,剩下的30%是用来测试神经网络。train_data < -as.data.frame (data_scaled(指数))test_data < -as.data.frame (data_scaled(指数)#分为两个新的数据帧的数据,称为train_data和test_datan=名字(数据)f=。formula (paste (“Y∼”,粘贴(n[!n% %”Y”),崩溃= " + ")))#构建公式将用于构建神经网络net_data = neuralnet (f、数据= train_data隐藏= 3,阈值= 0.001,learningrate = 0.01, linear.output =T)#使用neuralnet函数来构建和训练神经网络。有三个隐藏层,阻止误差函数的阈值是0.001,和学习速率是0.01。net_data result.matrix美元#输出权重值和阈值情节(net_data)#画一个神经网络predict_net_test <计算(net_data test_data [1: 6])predict_net_test_start < -predict_net_test net.result美元 美元(max(数据Y)±min(数据$ Y)) +分钟(数据元Y)#用神经网络进行预测。test_start < -as.data.frame ((test_data $Y) 美元(max(数据Y美元)±min(数据Y美元))+分钟(数据Y)MSE.net_data <总和((test_start-predict_net_test_start) ^ 2) / nrow (test_start) #定义均方误差公式。Regression_Model < - lm (Y∼=数据)#建立线性回归模型来理解神经网络预测的准确性。总结(Regression_Model)测试<拼(指数)predict_lm <预测(Regression_Model、测试)MSE.lm < -sum ((predict_lm-test$Y)^2)/nrow (test)MSE.net_data#计算神经网络的均方误差值MSE.lm#计算均方误差值的回归模型

数据可用性

使用的数据来支持本研究的结果包括在本文中。

的利益冲突

作者宣称没有利益冲突。

确认

这篇文章是一个阶段性的结果研究项目“十年研究高校的绩效评估,“国家教育科学研究所(批准号GYH2019010)。