文摘

作为企业的第一资源,人力资源是企业的核心竞争力,企业越来越多的关注,因此,人力资源的管理手段和技术不断改进,和人力资源管理信息系统逐渐新兴企业。作为企业人力资源管理,如何使企业管理科学和理性的帮助下数据挖掘(DM)技术,以及如何我的信息有利于企业决策从大量的数据,已经成为目前一个重要的问题需要考虑。基于DM技术和随机森林算法,本文研究了人力资源管理(人力资源管理)系统。有很多不同的算法来实现随机森林中独特的树。特征的数量达到8时,索引值的基尼系数是0.116,指数熵的值是0.106。从这可以看出,随机森林,使用基尼系数的影响人力资源管理比较好。随机森林可以避免过度拟合,其灵活的报告生成和分析功能使人力资源经理摆脱乏味的日常工作,专注于更有挑战性和创造性的人力资源分析、规划、员工的动机和策略。

1。介绍

目前,各行各业之间的竞争变得越来越激烈,而竞争的本质是人才的竞争。所有公司都明白,只有通过和企业留住人才,有效地鼓励人才能健康发展。企业的竞争力的力量完全取决于企业能否合理有效地开发和利用人力资源。未来的竞争是人才的竞争。不用说,谁拥有一流的人才会有一流的企业、一流的效益。任何企业的发展离不开优秀的人力资源管理,尤其是对中小型企业(1]。作为企业的第一资源,人力资源是企业的核心竞争力,已经受到企业越来越多的关注,因此,人力资源的管理手段和技术不断得到改善和发展。人力资源管理信息系统在企业已逐渐出现。企业使用人力资源管理系统获取、存储、分析和传播信息的状态的员工(2,3]。人力资源管理系统不仅可以作为支持工具,线经理的日常工作,也为企业人力资源经理提供必要的信息,参与制定企业的发展战略。人力资源管理从科学的角度来看,人力资源管理系统从企业的人力资源规划和一般包括信息等相关员工招聘、职位描述、培训、技能、绩效评估,个人信息,工资和福利,各种假期,辞职4]。与中小企业的规模扩张和经济体制改革的逐步深化,中小企业面临着日益复杂的情况下,竞争日益激烈和复杂的社会关系。原来的人力资源管理系统已经不能适应中小企业的发展,甚至成为束缚限制他们的发展5,6]。因此,迫切需要优化中小企业的人力资源管理系统。

作为企业人力资源管理中,如何使用DM技术实现科学合理的企业管理和我如何从大量的数据信息,有利于企业决策已成为重要问题。DM提取隐藏的是一个过程未知,但从大量的潜在有用的信息和知识不完整,嘈杂的、模糊的、随机的实际应用数据。本文应用DM技术和随机森林算法详细分析了人力资源管理(7,8]。随机森林算法的过程中,一个决策树的施工过程是连续的。一个决策树的建设完成后,建设可以进行下一个决策树。每个决策树是独立于其他。建设的下一个决策树后只能进行一个决策树的结构。决策树可以独立并行化随机森林。随机方法采用随机森林主要用于随机抽样和随机特征提取(9]。然而,这种原始随机森林树方法仍然有一些缺陷,一般仍然可以减少误差,精度可以继续得到改善(10,11]。

随机森林算法DM技术的应用在人力资源管理包括人力资源管理的员工流动率。本文研究DM技术在人力资源管理的具体应用过程。它存储在一个集中的数据库兼容的,一致的,共享的访问和检索方式,使员工在企业的信息可以统一管理(12]。随机森林算法的准确性高于单个分类器,是更健壮的错误和异常值。决策树的数量越多随机森林,森林的泛化误差会逐渐收敛(13]。因此,此外,当随机森林算法划分和管理人力资源信息,选择一个或几个功能的准确性优于多个特性。因此,随机森林也非常有效的在大型数据集,和随机森林将选择特性的评价它们的重要性。随机森林可以避免过度拟合,其灵活的报告生成和分析功能使人力资源经理摆脱乏味的日常工作,专注于更有挑战性和创造性的人力资源分析、规划、员工的动机和策略14]。音素的关键是确保随机森林模型的有效性将单个分类器的精度,确保政府在人力资源个体分类器尽可能独立。的主要创新如下:(1)本文随机森林算法的流程图,和招聘管理在人力资源管理系统主要是用于发布应用程序信息,使统计数据获得应用程序的信息。位置管理重要的职位,主要是用来释放工作调动信息;使每个帖子的转让信息统计;员工培训管理主要是用于发布培训内容和计划;并添加培训计划,培训计划的汇总,统计各部门的培训计划。(2)人力资源管理实施的实验和实验结果进行了分析。与CWC-SVM模型相比,加权随机森林算法,和平衡的随机森林算法,该方法具有更高的预测精度的人力资源管理。四个排名方法是一个接一个,预测精度最高的是这个方法,其次是一个平衡的随机森林算法,然后加权随机森林算法,最后CWC-SVM模型。它有明显的优势在分析人力资源管理的不平衡的大型数据集。

本文的总体结构由五部分组成。

第一章介绍人力资源管理的背景和意义,然后介绍了本文的主要工作。第二章主要介绍了人力资源管理的相关工作。第三章描述了DM的概述人力资源的分析理论和随机森林算法。在第四章中,人力资源管理进行仿真实验,实验结果进行了分析和讨论。第五章是全文的总结。

2。期刊了

文献综述Papineni等人提出,通过案例研究,发现引入后的人力资源管理体系,人力资源部门的功能已经改变了。他们认为应该进行信息化建设三个阶段,即信息发布、业务流程自动化,和战略角色的转变,逐渐从单向流动促进了人力资源管理信息双向流动,使事务管理功能不断改变战略管理(15]。Sijo Kavitha提出,大力发展中小企业是经济体制改革的一个重要方向,是政府义不容辞的责任,创造一个良好的为中小企业发展环境。自1990年代末,政府推出了各种改革措施,促进中小企业的发展,这反映了社会和国家高度重视中小企业的发展16]。张等人指出,有许多问题在当前中国民营企业人力资源管理,如缺乏系统性和战略人力资源管理和不完善招聘、培训,并使用系统;然后分析这些问题的原因,也就是说,大多数民营企业的高级管理人员有过时的管理概念,人力资源部门也有自己的缺陷,需要改进和员工忠诚。最后,提出良好的策略来解决民营企业的人力资源管理问题在中国,也就是说,我们应该建立战略人力资源管理的概念,积极培养良好的企业文化,努力建立客观公正的绩效评估体系(17]。周等人提出,目前,人才已成为中小民营企业的主要因素,以避免开发风险和大力提高开发速度。然而,有许多问题在中小民营企业的人力资源管理在中国,比如过时的概念,滞后系统、机制建设,以及不足的措施。我们必须改变和更新管理,制定科学有效的招聘政策,建立一个合理的工资和培训系统,和其他激励措施的目的达到留住和用好人才18]。李等人提出了信息系统的应用使得企业人力资源经理不仅注重事务性工作,也注重培养新的能力。人力资源经理是否能反驳新信息系统将直接影响人力资源信息化的实现的有效性(19]。李等人提出,通过科学方法的实现企业人力资源管理信息系统的建设,这一理论,企业实践和构建系统相结合,并提出了相应的优化方法在原系统存在的问题,使系统符合实际工作(20.]。Zulfa等人指出,随着中国经济的快速发展,人力资源管理在企业管理的作用越来越突出。因此,迫切需要大力提高人力资源管理。只有这样做,才能企业在激烈的竞争中立于不败之地。同时,他们指出,运营商、中层管理人员、基层管理人员和专业技术人员操作主要集中在人力资源的企业21]。Zaharov等人提出,人力资源管理的信息化建设应研究从信息技术和人力资源管理之间的互动管理。他们引用了许多例子来证明深度集成的信息技术和人力资源管理会促进企业的发展22]。阿里提出人力资源管理信息系统开发的许多软件公司很受欢迎的产品,可满足不同企业的需求和使用社会在一个大的方式。然而,对于一些特殊的或独特的企业情况,完成人力资源管理信息系统将显示明显的不一致,这将带来很多不便使用企业(23]。Mozhaeva提出,通过研究实现信息系统的故障情况下,他提出了10个关键因素的成功实施信息系统,包括战略目标、高层的支持,项目管理,组织变革,实现能力,教育和培训,数据准确性、绩效评估、纠错和系统操作(24]。

在此基础上,本文研究了优化中小企业的人力资源管理系统在中国基于DM技术和随机森林算法以提供政策支持中小企业的管理者更好的管理企业,制定政策,促进中小企业的发展,然后实现又好又快发展的中小企业在中国。通过深入研究的思想在中国在大型企业建立人力资源管理信息系统,结合人力资源管理信息系统的探索,针对人力资源管理信息系统的缺陷,提出了相应的优化设计和解决方案从企业管理的角度。DM技术和随机森林算法开发人力资源管理子系统。通过DM技术,随机森林算法在该系统中输入相关数据和设置参数。电脑是用来保存员工的文件,计算工资支付,并记录员工的培训和工作的细节变化。而不是原始的手动处理,随机森林算法查询人力资源和薪酬资源,从而大大提高了工作效率和管理水平。在DM技术,管理培训过程中的每个环节,然后培训计划和课程系统通过一个随机森林算法,以提高员工的工作能力。同时,培训效果和员工参与培训的数量和时间也记录下来,和各种培训结果查询。随机森林算法的主要过程包括以下:培训计划,使培训内容,确定培训,参与培训。

3所示。方法

4所示。DM理论的一项调查

在现实中,人类社会和经济活动总是可以被描述和记录数据,数字或符号。通过对这些数据的分析,将生成的信息。使用这些信息来指导实践,我们可以做出相应的决策。这些决定引发了新一轮的社会和经济活动(25]。广义上说,数据和信息知识的表现,但人们认为概念、规则、模式、法律、知识和约束。人把数据看作是知识的来源,就像从矿石采矿或淘金,原始数据可以是结构化的。从商业的角度来看,糖尿病是一种新的信息处理技术。它的主要特点是提取、转换模型分析和商业数据库中的大量业务数据和提取的关键数据协助商业决策(26]。数学模型在数据库和数据仓库的建设是客观对象的抽象处理的结果在现实世界中。分析的对象数据库和数据仓库都是客观事物在现实世界中。这些东西可以正确描述的数据库和数据仓库之后才逐步抽象处理。DM的本质区别和查询等传统数据分析,报告,和在线应用程序分析是DM矿山信息和发现知识没有明确的假设。DM获得的信息应该有三个特点:第一个未知,有效和实用的。数据仓库的建设和DM模型中的两个关键技术点DM价值链(27]。在狭义上,DM只侧重于从数据到知识。DM人员,最低要求是完全领会性能,限制,各种挖掘工具和应用条件。糖尿病是一个在多个专家之间的合作过程,以及一个高投资资本和技术的过程。这个过程需要重复。不断在重复的过程中,方法的本质东西,不断为主的解决方案。DM的过程如图1数据采集:DM进行时,首先需要提取样本数据的一个子集相关问题研究从大量的企业数据,而不是使用所有企业数据。通过数据采样、数据必须的质量控制,和代表性、真实性、完整性和有效性必须确保抽样。只有这样才能结果反映的基本规律是通过随后的分析和研究。数据探索:数据探索的目的是确定要分析的数据集,缩小处理范围,并改善DM的质量。当我们得到样本数据集,它满足要求我们最初认为吗?有任何明显的规律和趋势,有数据指出,你从未想过吗?数据排序:数据排序和技术选择的两个步骤后,最初的问题需要解决可能进一步澄清。此时,要求进一步解决问题应尽可能量化。模式:数理统计是最常用的主流技术手段在DM。软件包涵盖所有实用的数理统计方法和提供了十多个数据回归分析各类模型和特征。评价:

根据问题的需要,您可能需要添加或删除数据,或者你可能合并或生成一些新的变量根据你的理解整个DM过程,以反映国家的有效描述和作出评估。

在DM知识发现并不需要发现新的自然科学定理和纯粹的数学公式,也不是机器定理证明。事实上,所有的发现知识是相对的,与特定的先决条件和约束,面向特定字段,容易被用户理解。DM是寻找信息或知识,不能凭直觉发现,甚至违背直觉信息或知识。意想不到的挖掘信息越多,它可能是更有价值。粗糙集理论在DM数学工具研究不精确和不确定的知识。粗糙集方法有几个优点:它不需要提供额外的信息来简化输入信息的表达空间。该算法简单,容易操作。粗糙集处理的对象是一个信息表类似于二维关系表。目前,成熟的关系数据库管理系统和新开发数据仓库管理系统为粗糙集DM奠定了坚实的基础。数据准备是被转换成数据由系统根据需求可辨认的。建模是系统开发的过程。 When it comes to the evaluation stage, the customer conducts the user acceptance test. The final stage of release, that is, the product system goes online.

4.1。人力资源分析基于随机森林算法

随机森林算法已正式成为DM分类算法的一个重要组成部分。在最近的十年中,通过随机森林的不断优化,性能都得到很大的提高。该算法已广泛应用于实践,在DM已被研究人员一致认可,知识管理,模式识别,和其他方面。随机森林算法是一个集成的基于决策树学习方法,这是一个改进算法装袋。不像装袋,随机森林里每棵树不选择一个功能完整的特性集的节点分裂,但随机提取特性集的一部分根据一定比例和选择一个功能完成节点分裂。随机森林算法简单有效,支持并行训练,具有较强的泛化能力。它在许多领域取得了成功,如计算机视觉、生物信息学等。研究随机森林算法越来越深,性能和分类精度也大大提高。然而,并不意味着随机森林是完美的。通过对算法的研究,发现仍有改进的余地。 It is believed that through the continuous optimization of the random forest, the algorithm will be applied in more fields. The random forest is composed of many decision trees. It is thought that the formation of these decision trees adopts the random method, so it is also called the random decision tree. There is no correlation between the trees in the random forest. When the test data enter the random forest, it is actually to classify each decision tree. The category with the most classification results among all the decision trees is the final result. By constructing a large number of single decision trees, a random forest is formed. According to the classification results of N decision trees, the classification results with the most votes are selected by voting as the final output of the algorithm. The flow chart of the random forest algorithm is shown in Figure2

招聘管理在人力资源管理系统主要是用于发布应用程序信息,使统计数据获得应用程序的信息。像其他管理系统、人力资源管理系统只是一个辅助工具,它只能帮助人力资源经理处理复杂的信息和数据分析报告。在人力资源管理实践中,许多企业不能系统地进行,如调整组织结构、系统的建设工作,就业的专业技术资格、职业资格,仍需由人处理。位置管理是用来制作统计每个位置,主要用于发布位置传递信息;使每个位置的转移信息统计;员工培训管理主要是用于发布培训内容和计划;并添加培训计划,培训计划汇总,统计每个部门的培训计划。一个人力资源管理系统的建设是非常复杂而系统的工作,其中包括人事工作的各个方面和广泛的业务问题。公司的人事工作在省、市、县是高度一致的主要政策和指导方针,但是有这样的个性情况结合各单位的实际情况。正确处理安全保障和灵活的应用程序之间的关系; establish and improve rules and regulations; standardize authority allocation; implement preventive measures; strengthen daily administration, supervision, and inspection; establish a security and confidentiality system for hierarchical protection of information systems; and ensure the security of network information. In view of the problem of information gain in classification nodes, a node classification rule is introduced into the random forest algorithm. The information gain rate is used to replace the information gain. The evaluation formula is as follows: 在哪里 是属性的值的数量吗

火车的一致性的代表 和比较这个索引的信息效益指数,这样选择的属性可以更均匀,和没有偏见的问题。通过这种方式,信息收益率的计算公式如下:

计算 系数的样本: 在哪里 代表类别的概率 出现在样本集

如果 分为两个子集 , 这种分裂系数如下:

计算 每个属性系数,选择最小的属性 系数的属性节点分裂,生成一个决策树的递归。

为每个输入向量 ,分类结果是由简单多数投票决定。

随机森林使用基尼系数最好选择分裂属性。后的训练集,计算基尼系数根据以下算法: 在哪里 的概率是选中的类属于

用这个算法,类的标准化的投票 点如下:

错误是

算法评价标准如下:

根据水分分成子集,它由以下公式给出:

阈值越低,子集划分的纯度越高将。 在哪里 样本的概率是 属于 - - - - - -喜欢的。

根据随机森林算法,在处理连续变量时,也有连续变量离散化的问题。当人们满足一定的需求,他们将不可避免地选择更高层次的需求。建立分级奖励系统提供不同的奖励方法是指根据不同的成就,以合理满足各级员工的需要。未来企业人力资源管理的一项重要任务是建立一个有效的分级奖励和激励机制,激发每个员工的积极性。基本建立一个人力资源管理信息系统的目的是帮助公司提高管理水平,核心竞争力,快速发展。其网络化、简化和标准化的管理模式使人力资源管理部门能够平静地在新形势下面临各种挑战。然而,如何使人力资源管理信息系统更符合企业的实际情况,加强企业的竞争力仍然是企业需要高度重视和深入研究。

5。结果分析和讨论

6。因子分析

因子分析的结果表明,高新技术企业的人力资源管理系统可分为四个维度,这叫人力资源流,系统工作,薪酬制度,员工的影响。人力资源管理系统的因素分析结果如表所示1

创新能力的因子分析表明,高新技术企业的创新能力可以分为两个维度,分别命名为技术创新和管理创新,。以上两个维度的系数0.8,相当大程度的可靠性,如表所示2

这个实验优化的参数模型来预测会话是否已经购买行为。使用的功能包括会话功能和日期功能,和功能的数量是18岁。首先,调整最重要的参数的数量树,如图3

对于这个问题,当树的数量控制在约60 - 70%的特征数,也就是说,当有10棵树在图中,可以获得最好的结果。

有许多不同的实现决策树算法在随机森林,如ID3、C4.5,它使用信息增益选择功能,购物车,它使用基尼系数来完成决策树的生成。随机森林里,你也可以选择更好的决策树进行测试培训的人力资源管理并完成模型比较,如图4

有很多不同的算法来实现随机森林绿咬鹃树。特征的数量达到8时,索引值的基尼系数是0.116,指数熵的值是0.106。从这可以看出,在随机森林,最好选择基尼系数来管理人力资源。

6.1。实验分析的人力资源管理

在树上,当寻找最好的分割点,必须选择适当的特性,通过计算相关的人力资源管理的特性指标。此时,所选特征的量化将会影响最终结果。常用的选择方法包括根功能的总数,对数的值,和所有特性,如图5

使用的相关指标计算特性选择适当的特性,在这个时候,特征选择的量化人力资源管理会影响最终的结果。当图中特征的数量达到5,平均使用平方根方法效果更好。与此同时,它也显示了平方根方法是最有效的管理人力资源管理系统。

把分数加起来的人力资源管理系统的四个因素的得分总体人力资源管理系统。根据总分,发现26%的得分最高和最低分数的25%,高、低组之间的分界线。有152个有效样本在这项研究中,扣除15问卷使用默认项。结果分为66分下界,36个样本属于高组和55点作为上界,33个样本属于低组,如表所示3

完成数据整理后,230个样本是随机选择来自500多个数据集作为本研究的实验数据。每个样本包含10属性和一个标签。随机分组后的培训包括175正样本和负样本。测试集包括183正样本和44负样本。CWC-SVM模型,森林算法后的重量,平衡随机森林算法,本文方法用来进行实验,和人力资源管理的变革图预测精度下的四个算法如图6

与CWC-SVM模型相比,加权随机森林算法和平衡的随机森林算法对人力资源管理有更高的预测精度。四种方法分别排序。本文方法的预测精度最高,其次是平衡的随机森林算法,加权随机森林算法,最后CWC-SVM模型。它有明显的优势在人力资源管理不平衡的大数据集的分析。算法的效率和泛化能力深感研究。本文的方法是使用区间变量来确定样本的分布。

CWC-SVM模型仍在使用。重量是森林算法,平衡的随机森林算法和本文方法用于实验。人力资源管理的变更图出错率下的四个算法如图7

实验结束后在人力资源管理的出错率,本文中的方法仍然有错误率低于CWC-SVM模型。重量是森林算法和平衡随机森林算法有较低的错误率。这四个方法排序。本文中的方法错误率最低,其次是重量遵循森林算法,然后平衡随机森林算法,最后CWC-SVM模型。

7所示。结论

网络和信息化随处可见在当前社会各行各业。无论公司的大小,民营企业和国有企业都有一个或多个套管理系统。管理系统已成为一种常见的管理工具和广泛应用。基于DM技术和随机森林算法,本文研究了人力资源管理系统。有很多不同的算法来实现随机森林中独特的树。特征的数量达到8时,索引值的基尼系数是0.116,指数熵的值是0.106。从这可以看出,随机森林,使用基尼系数的影响人力资源管理比较好。有必要加强各级领导的关注,人力资源管理信息系统,争取支持的所有方面人力、物质资源和财务资源,实现其信息化可以保证质量和数量。建立人力资源管理信息系统的目的通过DM技术是使系统标准化业务工作,而不是让系统适应现有的非标准业务工作。随机森林算法下,企业的日常工作必须标准化和统一,所以人力资源管理信息系统可以帮助避免一些不规则的操作在实际业务工作中,不断促进人力资源管理。

数据可用性

标签数据集用于支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。