文摘
随着信息技术的迅速发展,特别是数据库的广泛应用,计算机网络,和其他领域,由企业的数据量也在迅速增长。与当前人力资源短缺和人才竞争的压力,人力资源管理在企业的评价尤为重要。创建措施吸引人才、创新的理解管理体系,制定标准的人才评价体系,避免不当就业事故的发生,合理分配人力资源的重量,培养员工对企业的忠诚度已成为越来越多的公司需要面临的挑战。针对上述问题,本文进行深入挖掘了战略人力资源管理评价和使用深入挖掘技术。由于大量的人力资源管理系统中的数据,数据挖掘算法如ID3算法,GBDT算法,并提出了贝叶斯网络分类和评估数据。基于这些数据挖掘技术,战略人力资源管理评价算法研究和测试。首先,决策树算法建立决策树的教育背景,公司的员工的身份和其他信息对员工进行分类。删除后的因子分析试验结果表明,一个类似的因素,每个人力资源管理影响的方差贡献率评价有一定的增加。员工参与和组织文化上升了2%,而员工满意度、组织学习和组织能力上升了1%。因此,病人数据挖掘技术的决策树算法是有效的战略人力资源管理评估。
1。介绍
企业管理者和研究人员很难确定一组指标来衡量战略人力资源管理的有效性,尽管事实上,它可以为企业增加价值的核心竞争力。论述了人力资源管理的研究和应用使用数据挖掘技术评估过程。决策树算法为了解决大量的数据在战略人力资源管理系统中,和其核心算法,如ID算法和GBDT算法,利用人力资源管理进行实现实验评估。首先,员工的数据是使用决策树分类的方法。员工满意度、组织学习和组织能力都增加了1%后删除单个因素相似,根据因子分析实验。员工的忠诚和组织文化增加了2%。我们验证ID3算法的加速比和GBDT算法在各个节点的情况下,观察数据大小之间的关系和ID3算法的运行时间和GBDT算法性能测试的决策树算法。在验证的过程中速度比,发现在相同的数据集群,ID3算法的速度比率和GBDT算法4:3.2和5:4.2,分别同比增长速度比GBDT算法ID3算法。发现当样本数据50,GBDT算法的速度是34.2%高于GBDT算法。结果,GBDT算法性能更好的战略人力资源管理系统的运行时间。 On the other hand, the rate of growth is faster than the ID3 algorithm year-over-year. As a result, both algorithms are somewhat useful for implementing human resource management evaluation.
数据挖掘的需求越来越大数据的背景下,和这一领域受到越来越多的研究。羽毛球由张持有中国体育的重要地方。体育产业逐渐接受数据挖掘技术。数据挖掘技术的定义、步骤和方法,及其应用的战术分析系统用于羽毛球场全部包含在这篇文章(1]。为了评估针灸治疗颈椎病患者的有效性(CS)和颈部疼痛、霍等人研究了数据挖掘模型的价值。评估数据挖掘模型的可行性,我们比较临床数据的数据处理模型。数据挖掘的处理效率模型和支持向量机模型已被证明通过实验达到最大值的81.48%和82.64%,分别为(2]。刘等人探索药物兼容性规则使用频率分析等数据挖掘技术,关联规则先验的算法和改进的互信息方法,为其临床应用提供参考和新的概念和建立新药研究[3]。为了揭示相关信息提取参数,王等人使用历史数据。他还建议提供正交试验的影响因素和各因素的相对重要性。尽管脚底算法的结果可以清楚地理解,支持向量分类算法具有较高的精度,根据实验结果(4]。
人力资源管理受到越来越多的关注结果,公司员工的一个基本要素在企业组织的过程。Amalnick和Zarrin提出一个全面的框架来评估和分析人力资源性能,考虑到欧洲联盟的标准质量管理(EFQM),著名的卓越的商业模式,和组件的健康、安全、环境和人体工程学(奚恺元)管理系统。根据研究结果,EFQM模型对公司业绩的影响明显大于HSEE教授管理系统(5]。Lidinska和Jablonsky检查员工绩效考核的功能在管理咨询公司使用层次分析法(AHP)。建议的AHP模型结合相对和绝对的措施,从而能够快速、简单地计算员工的整体绩效评分使用一个简单的MS Excel工具(6]。Ellitan努力提供基本的企业资源管理相关的一些问题的答案用案例分析的方法以获得竞争优势,确保自己的生存。这项研究的结论是,有多种方法来衡量金融和操作性能7]。上述研究非常深入的数据挖掘和人力资源分析,这是一个有价值的信息来源为以下深入描述。
战略人力资源评价算法研究和研究利用数据挖掘中的决策树分类算法的函数为人力资源管理评估。提高人力资源管理的有效性的评估工具是评价算法的结果对系统性能的影响。相结合的风险评估模型是由一套合理、科学的风险评估指标与贝叶斯网络技术。这是由应用贝叶斯网络理论和AHP方法。为了指导企业人力资源管理,它也执行风险评估人力资源管理系统的使用贝叶斯网络工具包。战略人力资源管理和战略目标之间的关系和变量级可以显示两者之间的关系。本文在分析模型的内容和实施步骤,为实际应用奠定了基础。
2。战略人力资源管理的实现方法基于数据挖掘技术的评估算法
2.1。数据挖掘技术
分类学习(8)、聚类分析、关联规则挖掘、预测,时间序列挖掘(9,10)、偏差分析等都是数据挖掘技术的例子,用于提供一个特定的模型对矿业开采过程中的对象。这是数据挖掘的过程,如图1。数据挖掘过程中的五个关键步骤如下:选择开采对象,收集挖掘数据,预处理数据,数据挖掘和解读信息的结果。使用不同的实现取决于知识挖掘。这些分类方法分类知识与不同的功能类型具有相同属性和知识但不同特征类型(11]。分类是数据挖掘的一个关键技术。语言规则可以用来解释和预测分类。的k最近邻居算法、决策树算法、贝叶斯分类、和支持向量机的常见分类算法。领域的广泛的数据挖掘,决策树分类器是经常使用的其中一个。
数据挖掘技术是人工智能的技术基础(12- - - - - -14]。通过挖掘大量的人工智能算法,它为用户提供了有用的信息。在某种意义上,数据挖掘是一个非常成熟的人工智能技术(如神经网络(15)、遗传算法和决策树)。它在一个特定的应用程序实现系统,但其规模和难度都大大降低。数据挖掘的步骤主要是基于数据建立一个模型,使用数据挖掘的算法和技术,为特定的任务和使用适当的算法,算法模型是最优的效果。用于矿山可视化和专家知识解释结果和提高可理解性,因此数据挖掘结果可以更好的应用在实践中。
2.2。决策树算法
2.2.1。ID3算法
在决策过程中,决策树从根节点开始,到达叶节点通过多属性的分类节点。决策树构造过程不依赖于领域知识,但将不同群体的属性,构建之间的拓扑属性。决策过程的决策树是直观,可判断的,和容易理解,所以它是广泛用于客户分析、市场调研、销售决策,市场细分,市场预测,和其他领域。
决策树模型是一个机器学习模型,就像一个树结构。它主要包括组件,如根节点的子节点和叶节点。决策树的根节点位于顶部,和它的子节点位于中间。它的每个子节点,它允许有多个的,站在一个分裂属性的样本集,分类效果最好的顶级子节点时,也被称为最好的分裂属性节点,使用;样本集的类别是由树的叶子节点,子节点底部。每个叶子节点代表一个分类规则,可能会有多个路径从根节点。在确定样本集的类别,首先分类样本集在根节点,然后为每个子节点后,最后在叶子节点。决策树结构如图2是典型的。确定用户是否出去玩的目的是基于天气数据分类。前景的采矿目标驻留在根节点。数据类别,即“是”或“不”,是由底部叶节点,中间节点通过天气属性,每个分支的判断规则,和中间节点的判断规则。
其中,ID3是最早的基于属性设置的决策树算法选择标准和使用信息增益特征选择方法。最大信息增益的属性是选为最佳的分割准则在确定的最佳分裂点基于每个属性的信息增益。不确定性属性变化的程度是衡量信息增益。计算属性更适合作为分割节点属性,如果它有一个更高的信息增益和一个较小的属性变化,更合适。由于从nonleaf节点后代叶节点的平均路径是最短的,生成的决策树的平均深度是最小化,提高分类树的准确性。
我们设置了数据集,根据样本分类,和W相对的信息熵k国家分类定义如下:
的价值W代表了系统的稳定性。W值越大,越不稳定的系统。当稳定性差,系统更加混乱,反之亦然。
如果F是选择最好的分割属性,那么对应的节点子集包含D。然后,测试属性的属性分为一个子集的熵定义如下:
当重量值数据集变化时,熵值越小的病人在子集,分工的程度越高,然后,预期的子集的信息如下:
样本属性的概率可以从上面的公式,和获得的信息可以通过分裂样本属性。这个公式表示如下:
的过程中构造的决策树ID3算法,属性的划分是一个递归调用的过程。当所有的属性数据集的计算,他们都参与建设的决策树。当没有属性计算,递归停止和决策树建设完成。在决策树的深度或属性划分的数量达到了预设的阈值后,递归停止。
所需的信息做出正确的判断类如下:
ID3方法确定每个属性,选择信息增益最大的属性一个(互信息),创建一个基于决策树节点的不同值的属性,并创建分支机构根据不同的属性值,直到一个特定的实例属于同一类别子集。
ID3算法既有很多好处也有一些缺点。好处如下:ID3算法的判决结果可以自动生成规则集,算法的决策过程简单,容易理解,算法可以处理数据类型和属性。在算法初期的发展,不需要大量的数据预处理。ID3算法有很多好处,但它也有很多缺点。ID3算法使用信息增益作为属性判断的标准,数据集时,效果更好的不同分支之间的差异小;然而,当不同分支之间的数据差异很大,根据计算信息增益的方法,分割后的属性会有更多分支的属性,这就是所谓的多值偏好问题;此外,ID3算法存在多值偏好问题可能发生在不同分支的数据集区别很大。ID3算法构造决策树的算法是基于最大信息增益的特点,最小的节点数量和高准确度的歧视。
分类的准确性是评价使用决策树保存方法,给出一个单独的数据集。这是分为两组,其中三分之二被用来构建决策树。然后,分类,和正确的获得是决策树的正确性16]。如图的保存方法3。
2.2.2。GBDT算法
梯度提高决策树算法,称为GBDT算法,主要使用决策树分类数据,同一节点上的数据可以分为同一类别。GBDT通常是由数以百计的回归树,但每个决策树构造的深度较浅(17]。当GBDT算法预测数据,为每个输入数据样本,当经过每一个决策树,该模型将修订一次,然后,将得到预测结果。GBDT渐近梯度决策树的整体学习是通过增加迭代方法执行的,也就是说,学习是通过多个决策树以串行的方式执行。
首先,我们定义模型并得到以下:
每一次迭代后,进一步降低系统中的错误数据。梯度下降法是一种有效的方法来减少错误,和应用梯度下降迭代过程得到的负梯度损失函数如下:
如果上述过程的拟合目标,负度方向是一个持续的浮点类型,这是代表的均方误差如下:
误差均方误差降低,然后,损失函数的泰勒展开式得到执行如下:
如果均方误差函数被认为是安装一个负梯度,然后
结合上面的公式,可以得到如下:
模型的迭代高等之后,UI和最优Rg可以获得如下:
对于上面的公式,我们首先定义一些符号和用泰勒展开方法得到以下:
最后,执行二阶泰勒展开解决以下:
最后,这个函数的拟合极限点得到如下:
通过以上解决方案,梯度下降法可以达到收敛点在相对较短的时间和减少拟合误差。
2.2.3。贝叶斯网络
不同的风险可能是物化的人力资源管理系统。一个概率模型,结合图形框架和风险评估的概率模型在人力资源管理形式的贝叶斯网络的基础。贝叶斯公式是用来修改先验概率和后验概率计算基于内部节点变量之间的因果关系。最后,父节点的先验概率分布和条件概率分布的节点变量的中级水平可以用来确定必要的节点变量的概率值。贝叶斯网络拓扑规划考虑各种风险因素的作用在控制人力资源的原因和危险因素的可能性将会实现。最后,各种风险因素的影响程度获得了整体风险事件(18]。
贝叶斯网络是一个复杂网络的节点和连接。在这个网络中,每个节点是一个随机变量。变量可以是某种现象,状态或属性和状态的节点对应节点的发生的概率。每个节点之间直接连接弧代表节点之间的依赖关系或因果关系。如果没有弧所表示的变量之间的连接节点,条件变量之间是独立的。
当每个节点变量是相互独立的,它可以根据获得的链式法则如下:
获得的后验概率可以根据一组条件概率分布的贝叶斯网络中的节点和链式法则如下:
在贝叶斯网络结构,当有一个新的补充事件概率,最初的概率将修正,最后,将获得后验概率(19]。如图4贝叶斯网络模型,它是一个人力资源管理的风险评估。
2.3。层次分析法确定指标体系的权重
层次分析法(AHP)结合了定性分析和定量分析,分解成几个问题的水平,并逐步分析它在一个简单的层面,从而分层和量化决策问题(20.]。定量评价的信度和效度可以通过定量分析的问题,大大提高,它无疑是合适的应用效果评价指标的权重的确定。根据要实现的目标,包括在目标元素分为不同级别,一般分为三个层次,如顶层是目标层,中间是准则层,底部是计划层(21]。如图5,这是一个关系图的层次结构和因素。
最终形成判断矩阵,矩阵的结构是建立在较高层和较低层的元素进行比较。判断矩阵的最大特征根W,因为它是由人们的主观看法和分析来自定性研究,必定会有一些错误。因此,它必须经过必要的一致性测试,和程序如下:
其中,米和CI是呈正相关。当米是一样的,CI越大,越不稳定的判断矩阵。CI = 0时,它意味着判断矩阵的完全一致性。
我们计算组合权向量的不同层次之间的总体决策目标,假设整个水平分为三层:第一层有一个元素,第二和第三层k和元素,分别。然后,第二层和第三层的权重第一层和第二层可以获得如下:
我们计算每一层之间的重量根据上面的公式,最后根据重要性排序的元素在每一层,并选择最好的。如图6,它是一个AHP的构造图。
使用分层的方法量化人力资源的角色控制可以克服个人有限的情报,并评估结果更为理性和理性22]。同时,分析这些测量可以作为材料的分析结果,可以为未来的工作提供技术和实用的建议。
指标包括四个层次:人力资源管理任务,人员和行为,项目的结果和性能。不同层次有不同的贡献的实现过程,因此,不同的结果。计算的实现影响人力资源管理系统,有必要确定每个级别和每个指标的权重(23]。
层次分析法将复杂的决策问题分为多个因素和分解成多个层面。两双比较方法用于确定每个因素的权重在同一层,每个因素排名。最后,定性和定量分析是由决策者获得最好的决策方案。AHP决策过程更数学通过减少定量数据,并提供一个简单的决策方法对于复杂的多目标决策问题,多准则或非结构化性质。整个决策过程反映了人们的分解、判断、综合决策。
3所示。解决实验和实施战略人力资源管理评价算法基于数据挖掘技术
3.1。实现人力资源管理评价的决策树
进行分析时,相关的数据库数据是用来检查元素(如员工的标题、性别、教育水平、年龄、等。不同层次提供不同的执行策略和有各种各样的结果。因此,有必要为每个级别和权重设置每一个指标来评估战略人力资源管理的实施效果。决策树ID3算法是用于建立一个员工分类模型在数据选择、数据清洗、数据归纳、数据转换等过程。然后提出了分类规则。组织、工作和个人的三个组件构成战略人力资源管理的主题。使用ID3算法构造决策树分类员工根据他们的教育背景,身份,和其他因素。基本信息统计的例子如下。
从表可以看出1,该公司共有3700名员工。从文化层面的分析,我们可以知道,有硕士学位或以上的人数相对较少,共有97人,占总数的2.62%。其中,低于大专水平的人数是最大的,占总人数的62.7%,表明该公司大量的中层和基层员工。有753到530人大专学位,学士学位,分别占20.35%和14.32%。以上数据反映正常位置之间的差距,可有效避免严重的表示问题。
根据服务的员工在表的长度2,员工的数量为5 - 8年的工作是最大的,拥有1130名员工,占总数的30.54%。上述参数有利于学习的综合构成企业的人力资源管理系统。分析后,企业的人力资源状况可以被系统地理解。
结合决策树的分类功能,每个员工的学习和成长方面进行了分析,并进行适当的因子分析根据单位矩阵获得的分类。本文提取六个员工学习和增长的因素进行分析,即员工的满意度,员工参与,组织学习、组织能力、组织文化和工作环境,分析每个员工根据因素的状态。
从图可以看出7方差贡献率的员工学习和增长的因素决策树分类前后是不同的。删除后的结果表明,一个类似的因子,方差贡献率的影响人力资源管理评价有一定的增加。员工参与和组织文化上升了2%,与员工满意度、组织学习和组织能力,每上升1%,和工作环境的方差贡献率是不变。因此,病人数据挖掘技术的决策树算法是有效的战略人力资源管理评估。
3.2。数据挖掘中决策树算法的性能测试
在战略人力资源管理系统中,随机数据集并行,并使用决策树建模。因为少量的数据很难满足人力资源管理、性能测试的原始数据扩展到100年,200年,300年、500年和600年的实验。首先,通过增加数据规模,它比较了ID3算法的运行效率和GBDT算法在相同的数据规模。如图8,它是数据大小之间的关系和ID3算法的运行时间和GBDT算法。
图8测试表明,当使用相同的采样数据,这两个算法的处理时间减少样本数量的增加。GBDT算法比GBDT算法快34.2%当数据样本是50,ID3算法运行在210秒和GBDT算法运行在415秒。ID3算法运行速度最快500年运行示例数据的两个算法增加了50,GBDT算法也加速假设所有其他条件保持不变。虽然GBDT算法ID3算法更快地运行,它仍然有一个相对较短的运行时间。它还与更高层次的执行操作的效率。
上述算法都需要他们的内部部件为了他们之间的通信功能。随机森林算法并行构建树使用许多节点,大大减少所需的时间,导致平面度算法。之间的速度比GBDT算法ID3算法和确认使用样本数据集的不同数据,如图9。
从图可以看出9坛的算法集成分布式实现良好的速度比,速度比与数据集大小和集群大小有关。调整后的数据集时,在集群中的数据段继续增长,分区速度也逐渐增加。虽然GBDT算法是在一个类似的过程,许多串行过程算法的过程,所以加速度的增加比例不是很大。集群规模50时,生成的速度比最高的ID3算法的节点数量是4,GBDT算法的速度比是3.2;当集群的数量是100,GBDT算法生成的速度比是4.2,但ID3算法达到5,同比增长速度比GBDT算法。
4所示。讨论
本文使用数据挖掘技术进行分类和管理人力资源管理系统的数据集中在潜在问题在最初的人力资源管理系统。我们创建一个共同的树选择模型独立的员工根据重要算法ID3算法,GBDT算法和贝叶斯网络。贝叶斯网络模型被创建来量化为了解决潜在风险事件的影响人力资源管理。人力资源管理系统的密度和评估过程的增强都是评估使用层析释放的方法。GBDT算法ID3算法的比较,发现改进后的系统性能测试的人力资源管理系统的性能。GBDT算法的成功演示了数据挖掘技术在资源管理的重要性。
5。结论
本文介绍了三种数据挖掘算法在方法部分中,在分类决策树算法的应用重点介绍。GBDT的ID3算法和决策树算法的核心算法,其中ID3决策树算法构建一个模型通过细分和分散数据。通过将ID3算法应用到战略人力资源管理的研究评估算法,我们可以直观的看到明显的细分人才系统的影响因素。GBDT算法也是一种数据分类算法,主要的过程预测输入数据,修改数据显示,然后获得结果。本文使用决策树算法测试系统性能,发现在相同数量的数据,GBDT算法更快和更有效率。比较两个的加速率,它是发现,加速比与数据集的大小和集群的规模。集群越大,加速率越高。根据决策树分类的本质,员工学习的因素和方差贡献率和增长之前和之后的分类进行了分析,并发现方差贡献率的人力资源管理评价在一定程度上增加了。虽然一些数据挖掘技术提出了在本文讨论人力资源管理评价的实现算法,仍有某些数据的缺乏。如果它是适用于大型企业,仍有很多需要改进的地方。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者没有任何可能的利益冲突。