CIN 计算智能和神经科学 1687 - 5273 1687 - 5265 Hindawi 10.1155 / 2021/5572781 5572781 研究文章 一种新的随机森林算法基于学习自动机 https://orcid.org/0000 - 0001 - 5229 - 0589 Savargiv 默罕默德 1 https://orcid.org/0000 - 0003 - 2314 - 283 x Masoumi Behrooz 1 Keyvanpour Mohammad Reza 2 年兽 1 计算机和信息技术工程学院 Qazvin市分行 伊斯兰自由大学 加兹温 伊朗 azad.ac.ir 2 计算机工程系 Alzahra大学 德黑兰 伊朗 alzahra.ac.ir 2021年 27 3 2021年 2021年 12 2 2021年 9 3 2021年 16 3 2021年 27 3 2021年 2021年 版权©2021年穆罕默德Savargiv et al。 这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。

聚合基分类器的目标是实现一个聚合比单个分类器分类器有更高的分辨率。随机森林是一个类型的集成学习方法被认为是比其他乐团学习方法由于其结构简单、易于理解,以及更高的效率比类似的方法。经典方法的能力和效率总是受到数据。从数据域,独立的能力和适应能力问题空间条件下,是最具有挑战性的问题的不同类型的分类器。本文提出了一种基于学习自动机方法,通过自适应问题空间的能力,以及独立的数据域,被添加到随机森林来提高其效率。使用随机森林中强化学习的思想使得人们有可能解决问题数据的动态行为。动态行为是指行为的可变性的一个数据样本在不同领域。因此,评价该方法,创造一个环境与动态行为,不同领域的数据被认为是。在拟议的方法,添加到随机森林使用学习自动机。这种选择的原因是学习自动机的结构简单、学习自动机的兼容性问题空间。 The evaluation results confirm the improvement of random forest efficiency.

1。介绍

随机森林是集成学习的方法之一,在均匀基础学习者类别的建设性的分类器的类型。顾名思义,基础学习者都是决策树,因此他们有了一个更简单的结构比类似的方法 1]。随机森林结构有两个优点。第一类是从计算的观点来看,第二类是从统计学的观点。优势,可以考虑从计算的观点是:随机森林有能力处理回归和分类问题。这个分类器的训练和预测流程执行在高速度,因此随机森林被称为经典的快速分类。随机森林的另一个优点是它能够直接使用高维问题[ 2]。第二种观点的随机森林的优点是它的特点,即优先级的功能,不同的权重系数不同的归因类,和插图和无监督学习能力。

根据文献,随机森林方法是整体学习最实用的方法之一。权重合奏的基础学习者学习的一个主要挑战聚合的基本分类器以达到更强的分类器( 3]。重基础学习者的原因,或者换句话说,确定影响因子对于每一个基础的学习者,是提高数据挖掘算法的可伸缩性问题空间。这变得更加明显,当环境是动态的,和不同的或有时相互矛盾的行为是观察到的数据在不同的情况下。文本数据环境中有这样一个有趣的行为数据挖掘算法,它挑战。例如,将一个词在一个域可能创建一个积极的极性,但它也可能在另一个域上创建一个负极性。这种差异在极性创建没有任何改变单词的形式,没有任何变化的作用从语法的角度来看这个词。“小”这个词在电子领域和餐馆领域有如此行为。这种行为构成了重大挑战的观点挖掘算法( 4]。

克服这一挑战的解决方案在古典文学是基于lexical-based的使用方法。这种方法是基于框架如unigram,语法,以面向方面为基础的,和类似的方法,都是视。除了迫切需要预定义的数据,这些方法失去效率如果他们会见了一个未指明的词或意见矿业领域的隐喻。换句话说,他们不兼容问题空间。随机森林的工作方式与训练数据的顺序放置,特征向量注入每一个基础的学习者,它试图找到最佳特征子集,并增加其影响因素分类器,实现最高的性能在所有聚合基础学习者( 5]。然而,这种方法并不是有效的有关数据如文本,一个词可以在不同的领域有不同的极性,因为在分类算法,没有能力适应问题空间的条件。

在这篇文章中,我们打算让随机森林的强化学习,提高效率。在拟议的方法,学习自动机用于聚合和重基础的学习者。学习自动机的工作方式是从环境和接收反馈执行的操作基于反馈的类型。在学习自动机,反馈强化信号分为两类:奖励信号和点球信号。对于每一个强化学习自动机收到的信号,它更新的概率选择前一步骤中选择的行动。这一过程持续进行直到行动选择的概率收敛于一个行动;换句话说,运行在当前形势下的最佳选择。在拟议的方法,学习自动机行为是适当的,当一个人基础学习者选择导致的最大奖励,可以收到环境。在每个阶段的学习自动机执行以来,学习算法试图选择最好的选择,实现全球问题空间的最适条件保证。这是证明该方法的适应性。 In the proposed method, the subprocess of replacing features in the feature vector is removed, and all the features in the feature vector are used. As a practical application in the field of opinion mining, if the Bag of Word (BoW) method is used to create the feature vector, the advantage of considering all the features of the feature vector will also cover cases that occur rarely. In other words, in the proposed method, the aspect of independence from the domain in the processes such as opinion mining is considered.

我们的贡献是总结如下:

本文简要回顾随机森林的应用范围。

本文提出一个学习automata-based法提高随机森林的性能。

该方法独立运作的领域,它是适应问题空间的条件。

剩下的纸是组织如下。节 2介绍了相关工作。部分 3介绍了介绍学习自动机。该方法在部分说明 4。部分 5包括评估。讨论了部分 6,最后,节中描述的结论和未来的工作 7

2。相关工作

在本节中,理论和随机森林是检查的有关这一课题的文献。本节的目的是回顾介绍了创新在近年来随机森林。

随机森林是一个齐次乐团的合奏的方法学习学习小组。在随机森林,每一个决策树,或者换句话说,每个基本学习者,能够访问一个随机子集的特征向量( 6]。因此,特征向量的定义如下: (1) x = x 1 , x 2 , , x p , ,在那里 p是可用的维度属性向量为基础的学习者。的主要目标是寻找预测功能 f( x),预测 Y参数。预测函数定义如下: (2) l Y , f x , 在哪里 l被称为损失函数,目的是减少损失的期望值。对于回归的应用程序和分类应用程序,平方误差损失和损失0 - 1是常见的选择,分别。这两个函数定义如下方程( 3)和( 4),分别。 (3) l Y , f x = Y f x 2 , (4) l Y , f x = Y f x = 0 , 如果 Y = f x , 1 , 否则。

创建一个乐团,一组基础学习者聚在一起。如果基础学习者定义如下: (5) h 1 x , h 2 x , , h J x , 对于回归的应用程序,将基于方程(平均 6),对于分类应用程序,投票将基于方程( 7)。 (6) f x = 1 J j = 1 J h j x , (7) f x = 参数 马克斯 j = 1 J y = h j x

随机森林分类应用程序所示算法的伪代码 1

<大胆>算法1:< /大胆>随机森林分类应用程序的伪代码(< xref ref-type =“bibr”掉= " B1 " > 1 < / xref >]。

D= {( x1, y1),( x2, y2),…,( x NgydF4y2Ba, y NgydF4y2Ba)}表示训练数据 x = ( x ,1, x ,2、… x 我,p)T

jJ = 1:

采取引导样本的大小为N D。

使用引导样本,Dj作为训练数据树。

从单个节点的所有观测。

重复以下步骤为每个节点递归,直到满足停止准则:()选择预测的随机 p可用的预测因子。

所有的二元分裂中找到最好的二元分裂步骤(i)的预测。

将节点分为两个后代节点使用步骤(2)的分裂。

在一个新的x作出预测。

f ^ x = 参数 马克斯 y j = 1 J h ^ j x

在哪里 h ^ j x 响应变量的预测在哪里 x使用j树。

我们可以看到在算法 1随机森林,试图找到一个子集的功能使用各种替代的训练数据和功能最大化输出的效率和准确性。这组的功能是用来识别一个新实例。

以下是简要回顾随机森林的文学主题。应该注意,我们打算介绍课题的背景,这纸不是一个审查,提出审查是一个简短的回顾和没有提到的所有以前的作品无疑。然而,作者试图把最新、最权威的研究工作近年来出版。

2.1。天文学、生物信息学、和经济学领域

在天文学领域,马克尔和贝里斯 7)使用射频IA型的分类和核坍缩超新星。陈等人。 8]提出一种方法来检测潜在的信号通过射频光子。生物信息学,彭日成et al。 9)提出一个方法来减少计算复杂度的RNA仿真软件通过一个典型的随机森林。Darmawan et al。 10)提出一个估计模型在生物信息学领域的时代。在经济学领域,公园等。 11]提出两个阶段的短期负荷预测随机森林和深层神经网络,以减少能源成本。 12用一个典型的射频解决电子商务产品分类问题。通过射频建模消费信贷风险的主要目标是( 13]。 14增加树的相关性通过控制将分裂的概率随着有力预测来解决高维设置。Sikdar et al。 15)提出了一种基于射频识别的变量选择方法的关键预测价格变化在亚马逊。

2.2。一般和全球性问题领域

在通用领域,Giffon et al。 16)使用的正交匹配追踪算法计算权重的线性组合生产树与最小训练误差的线性组合。结合射频和广义线性混合模型的主要思想 17集群和纵向二进制结果)模型。Mohapatra et al。 18)优化随机森林利用不平等权重投票策略。霁et al。 19)提出一个混合模型的人群计数卷积神经网络(CNN)和回归森林深处。Santra et al。 20.)提出一个确定性辍学删除不重要的神经网络连接的射频。提出了斜射频没有显式的正则化技术的主要目标是通过最小化结构风险( 21]。Katuwal et al。 22)使用一个斜超平面将增加的数据树的准确性,减少射频的深度。Probst et al。 23)调整hyper-parameters达到更高的性能改善射频。金等。 24]提出一个解释方法和简化的黑箱模型深射频通过量化特征的贡献和训练有素的深射频频率。耆那教等。 25]目的动态称重方案射频使用决策树和数据样本之间的相关性。在全球性问题领域,Stafoggia et al。 26]估计每日天气预报的颗粒物射频。建模全球森林面积由射频的主要目标 27]。Breidenbach和Saravi 28]研究地面沉降空间建模和评估。分析净生态系统碳交换的目标( 29日]。使用指数量化预测全球气候问题的能力随机森林算法的优化能力的神经网络预测模型的主要目的是( 30.]。李等人。 31日)解决类失衡通过检测串行双。

2.3。医疗保健领域

肥胖患者的诊断检测和预测的主要目标是通过射频( 32, 33),分别。El-Sappagh et al。 34)使用简单的表单中射频检测阿尔茨海默病的进展。在[ 35),介绍了射频作为一个有用的机器学习工具对于医疗领域,特别是对于COVID-19建模。Khedkar et al。 36)使用患者电子健康记录供射频预测心力衰竭的风险。羽根等。 37提出一个预测模型的各种氧化物的溶解行为的眼镜。Subudhi et al。 38)提出一个方法通过射频检测缺血性中风的MRI图像序列。Javadi et al。 39)提出一个方法来预测细胞内寄生虫的免疫原性肽。识别关键风险因素与器官移植急性排斥反应的主要建议( 40]。在辛格et al。 41),射频已经作为一个分类器分类covid-19蔓延。Na et al。 42]提出一种自动模式更改的膝上假肢行走。集群和预测由射频生命体征的目标( 43]。朱et al。 44)优化参数的随机森林改善鱼类群算法预测膝盖接触力。方法确定外国粒子液体药品的质量检测提出了( 45]。李和荣格( 46)考虑老师附件和学生成长之间的关系。 47提出一种实用的SIF降尺度方法。Guanter et al。 48基于RF)提出一个方法预测糖尿病。Subasi et al。 49)提出了一个决策支持系统由射频对偏头痛的诊断。司机的压力水平分类的主要目的是( 50]。Ayata et al。 51]提出一种情感识别算法的多通道生理信号通过使用随机森林作为识别的机器学习方法之一。

2.4。工业和网络领域

Zeraatpisheh et al。 52)使用生产的典型射频特性映射在工业领域。杜et al。 53)提出一个快速、准确检测农药的检测射频技术构建一个定量检测模型。改善性能的映射矿物的主要目标是文献[ 54]。刘等人。 55]提出一种自适应电时期分区开路故障检测算法。软件故障预测整体技术调查( 56]。在[ 57),RF id是用于构建分布式能源系统。提出了一种综合图像处理模型, 58]。何鸿燊et al。 59]利用射频来提出一个气候数据模型框架,利用水力发电。周et al。 60]使用射频小和不平衡的数据集来创建一个风险预测模型的决策工具。邓et al。 61年提出一个保护高附加值食品射频身份验证方法。提出的预测农产品由射频( 62年]。宋和金 63年)使用加权随机森林预测模型的链接。Khorshidpour et al。 64年)提供了一个模型与nondifferentiable攻击分类方法决策边界。多域融合熵和射频的主要目标是( 65年)提出了一种具有中介轴承的故障诊断方法。分析了葡萄酒质量提出了( 66年]。在网络领域,Madhumathi和苏雷什 67年)开发一个模型来预测未来动态传感器节点在无线通信的位置。方等。 68年)提出一个加密的恶意流量识别方法。检测网络入侵的典型射频是提出的 69年),和网络中的入侵检测安全通过调优Moth-Flame的射频参数优化算法, 70年]。

2.5。物理、文本处理、旅游和城市规划领域

在物理领域,明镜( 71年)射频测量和量化土壤的pH值。 72年提出一个模型来提取能量调制之间的复杂关系和设备效率。Zhang et al。 73年)提出一个模型来准确而有效地预测UCS LWSCC的甲虫为调优的hyper-parameters射频天线搜索算法。岩土参数的预测典型射频是由( 74年]。蠕变指数预测的RF算法来确定变量的最优组合的主要目标是( 75年]。在文本处理领域,射频和其他分类器之间的比较是由( 76年)寻找最好的分类主题文学文本的分类。随机森林作为一个基础学习者的假新闻的整体模型的检测( 77年]。分析评论家的评论情感分析的主要目标是( 78年]。Zhang et al。 79年)提出了两种新颖的标签翻攻击来评估森林NB根据随机噪声的鲁棒性。认识报纸文本由射频是由( 80年]。Madichetty和Sridevi 81年)使用射频的分类器来检测损伤评估的微博。Madasu和Elango 82年)使用的典型射频特性选择情绪分析。Chang et al。 83年)使用在线客户评论意见挖掘的射频。文本分类通过简单的射频的目标是( 84年]。奥南和Tocouglu 85年)提供一个文档聚类和主题建模方法在大规模网络公开课。情感分析技术英文单词的基尼指数特征选择是由( 86年]。贝克( 87年]使用整体学习和深度学习情绪分类方案预测性能高的大规模网络公开课的评论。俄南( 88年]目前基于深度学习的情感分析方法。这种方法使用TF-IDF加权手套字嵌入与CNN LSTM架构。奥南和Tocoglu 89年)存在一个有效的讽刺识别框架对社交媒体数据通过追求神经语言的范例模型和神经网络。在旅游领域,Rodriguez-Pardo et al。 90年基于简单的射频)提出一个方法预测游客的行为。预测旅行时间减少交通拥堵的主要目标是( 91年]。Jamatia et al。 92年提出一个旅游目的地的预测方法。在城市规划中,鲍迈斯特et al。 93年排名的城市森林文化生态系统服务供给特征典型的射频。由[预测道路交通条件 94年]。城市空间发展的模拟射频提出了( 95年]。调查信息经济发展的国内生产总值(gdp)为分析提出了( 96年]。梅等。 97年)提出一个方法来识别交通系统的时空通勤模式。在这个简短回顾,提到引用分类和功能方面的创新。

从表可以看出 1,RF高范围的应用程序和范围的变化。相比之下,在数量和质量方面,他们的创新通常仅限于设置不同的参数,而且没有重大创新基地学习者组合。

射频的简短回顾文献的功能和创新。

类型
功能 天文学 ( 7]、[ 8]
生物信息学 ( 9]、[ 10]
经济学 ( 11]、[ 12]、[ 13]
全球性的问题 ( 26]、[ 27]、[ 28]
医疗保健 ( 32]、[ 33]、[ 34]、[ 35]、[ 36]、[ 41]、[ 98年]、[ 37]、[ 39]、[ 40]、[ 42]、[ 43]、[ 45]、[ 46]、[ 47]、[ 48]、[ 49]、[ 50]、[ 51),
工业 ( 52]、[ 53]、[ 54]、[ 55]、[ 56]、[ 57]、[ 58]、[ 59]、[ 60]、[ 61年]、[ 62年]
网络 ( 63年]、[ 67年]、[ 68年]、[ 69年]、[ 99年]、[ One hundred.]
物理 ( 71年]、[ 72年]
文本处理 ( 76年]、[ 77年]、[ 78年), 80年( 81年]、[ 82年]、[ 83年]、[ 84年]
旅游 ( 91年]、[ 92年]
城市规划 ( 93年]、[ 94年]、[ 95年]、[ 96年]、[ 97年]
创新的方法 经济学 ( 14]、[ 15]
一般 ( 16]、[ 17]、[ 18]、[ 19]、[ 101年]、[ 21]、[ 22]、[ 23]、[ 24]、[ 25]
全球性的问题 ( 30.]、[ 31日]
医疗保健 ( 44]
工业 ( 65年]
网络 ( 64年]
物理 ( 73年]、[ 75年]
文本处理 ( 79年]、[ 86年]
3所示。学习自动机

学习自动机(LA)的学习算法,在不同的时间选择不同的动作后,确定反应的最佳实践方面收到从一个随机的环境。拉选择一个动作从向量的集合行为的概率,这行动是评估环境中。通过接收到的信号环境,洛杉矶更新概率向量,通过重复这个过程,逐渐确定最优行动。可以制定分类问题作为一个团队的共同运作优化一个目标函数 102年]。在图 1,学习自动机和环境之间的相互作用。

学习自动机与环境的相互作用。

找到全局最优解空间中使用的另一个优点。洛杉矶可以正式代表的四倍 (8) l 一个 = α , β , P , T , 在这 (9) α = α 1 , α 2 , , α r 是行动的集合(输出)的洛杉矶;换句话说,组输入的环境。 (10) β = β 1 , β 2 , , β r , 是洛杉矶的组输入;换句话说,设置的输出环境。 (11) P = p 1 , p 2 , , p r , 是洛杉矶的概率向量操作和 (12) P n + 1 = T P n , α n , β n , 学习算法。

在洛杉矶,在环境中可以定义三种不同的模型。P-Model,环境提出了0或1的值作为输出。Q-Model,环境的输出值是离散数字0和1之间。s模式,环境是连续的输出值在0和1之间。所选的行动拉更新信号来自环境和使用奖励和惩罚函数。的数量分配奖励和惩罚的LA行动可以被定义在四个方面:含碘,奖励和处罚的数量被认为是相同的;LR εP量的惩罚比奖励小几次;LRI的罚款金额是0;和唇,奖励金额是0 ( 103年]。

在每一个瞬间 n,操作概率向量π(n)更新线性学习算法给出了方程( 13)如果选择行动ai (k)奖励的环境,并更新根据方程( 14)如果选择行动惩罚 104年]。 (13) p n + 1 = p n + 一个 1 p n , p j n + 1 = 1 一个 p j n , j , j , (14) p j n + 1 = 1 b p n , p j n + 1 = b r 1 + 1 b p j n , j ; j , ,“ 一个“是奖励参数”, b“是惩罚参数,和“ r“是操作的数量。作者应用了该方法拉的,因为:

洛杉矶在不确定的情况下提供了一个可接受的性能。

洛杉矶并在概率空间搜索行动。

洛杉矶需要简单的反馈环境优化其状态。

自洛杉矶有一个简单的结构,它有一个简单的软件和硬件实现。

洛杉矶不限制使用精度标准优化使用。

洛杉矶是适用于实时使用自洛杉矶并不涉及光计算复杂性( 105年]。

4所示。该方法

随机森林是集成学习的方法之一,同一类型(即所有构造函数分类器。决策树)。因此,随机森林是一个齐次整体学习法。在这篇文章中,我们打算用强化学习的想法增加随机森林的效率和适应能力添加到环境问题的数据挖掘算法。下面将描述该方法的细节。

方法提出了基于强化学习的想法,它采用学习自动机来实现这个想法。学习自动机是该方法的核心,并通过接收反馈从环境中对于每一个动作,它更新的概率选择行动。在该方法中,每个基地学习者,决策树,都视为学习自动机动作。

在拟议的方法,训练数据首先被随机分为N部分。在这个部门,N对应于树的数量我们想要在森林里。与随机森林,树木之间的预测模型是通过平均或投票,该方法,创建了预测模型使用学习自动机,形成的核心算法。该方法的框图如图 2

该方法的框图。

该方法的预处理步骤是一个通用的步骤,并基于何种类型的数据处理面积处理,这个阶段确定的细节。在拟议的方法中,首先,类似于随机森林方法,训练数据随机分为基础学习者的数量和注入基础的学习者。这一步的区别和相似的步骤随机森林的所有特性的特征向量给出所有基础的学习者,和删除功能替代选项。

第一次运行后,预测模型创建基础学习者和放置在一个池中,实际上是一个交互式的环境,有学习自动机。从学习者获得的结果为每个新样本的形式给出学习自动机的强化信号,我们知道作为主要的环境的反馈。取决于收到强化信号奖励或惩罚,选择的机会每一个基础的学习者,——他们的行动学习自动机——更新。应该注意的是,最初的概率选择这些行动被认为是相等的。如果我们有 R基础学习者形成整体,他们每个人的初始选择的概率等于 (15) p D T r = 1 / R

很明显,所有行动的概率之和等于1。 (16) = 1 R p D T = 1

初始概率选择的行为被认为是平等的,因为他们都是均匀的分离能力。

在拟议的方法,集成的基础学习者是由洛杉矶。因此,对于每个输入的测试集,定义了线性拉,每个LA对应选择的行动基础的学习者。跑步基础学习者和接收反馈的过程从环境中持续进行直到选择行为的概率收敛于一个基础的学习者,或重复学习自动机的数量超过预先确定的极限。一旦选择的概率收敛,然后基地学习的结果,选择的概率最高,坚定的合奏特定输入的结果。在这种情况下,担保的找到全局最优算法,因为所有的功能特征向量检查,罕见的模式也覆盖,和适应环境的能力问题空间和独立的域是稳定的。方法,随机选择的子集原因之间的相互依存关系树。所有的决策树的深度方法被认为是相等的。每个决策树在叶级别将训练数据不同。显示了该方法算法的伪代码 2

<大胆>算法2:< /大胆>该方法的伪代码。

输入D = {(x 1 y 1 ),(x 2 y 2 ),…(x NgydF4y2Ba y NgydF4y2Ba ),}与x表示训练数据x = (我,1,x我2x、…我,p)

输出分类测试数据

假设

:学习自动机

DT r= {DT1DT2,DT…R}表示基础的学习者

α / /选择DT: LA行动r

一个:奖励参数

b:惩罚参数

:所有的学习者训练基地

算法

r = 1 r

创建一个数据集 D t通过抽样 (N / R)项目,随机的替代 D

火车 DT r使用 D t,增加了

结束/ /

每一个测试样本

{

=新/ /创建一个从LA LA对象类

((收敛到一个操作)或(超过了预定义的迭代数量))

{

选择一个随机的操作和执行,由,让它去 α

如果( α 预计新测试样本正确) 然后/ /更新选择的概率向量

p n + 1 = p n + 一个 1 p n p j n + 1 = 1 一个 p j n , j , j / /选中的奖励 α

其他的

p j n + 1 = 1 b p n , p j n + 1 = b / R 1 + 1 b p j n , j , j , / /惩罚所选 α

}/ /而结束

}/ /结束

返回DT r

分类测试数据的预测 DT r

结束。/ /算法

在学习自动机块图 2,有两个函数称为奖励函数和罚函数。激活这两个函数之一是基于强化信号来自环境的类型。接收到的信号从环境决定的结果基础学习者活动或前一步骤中选择的行动是否有用。如果结果是有用的,行动必须得到回报,或者换句话说,增加其选择的概率。选择行动的概率的增加是由参数决定的“a”、“b”称为奖励参数和惩罚参数,分别。

符合( 16),也就是说,所有操作的概率之和等于1,所有其他行为的概率减少根据参数”的大小。“如果选择行动的结果不是有用的,这一行动也必须受到处罚。换句话说,行动必须的概率降低。为此,选择行动的概率降低的大小参数“b”和作为一个奖励模式,和观察( 16),选择其他操作的概率增加的大小参数” b”。

在拟议的方法,学习自动机模型环境被认为是P-Model,那里的环境定义0和1值作为输出。零意味着奖励,意味着惩罚。如果正确的答案是来自所选基础学习者的洛杉矶,选择的行动会得到回报;否则,它将被处罚。

5。评价

为了全面评价该方法的效率,在本节中,评价该方法的细节提出了分开使用的数据和实验结果。

5.1。数据集

为了评估该方法和创造一个环境的动态行为数据,不同领域的应用程序已经被选中了。如前面几节中所述,动态行为指的是不同的结果,实例展示在不同的环境条件。不同结果的环境是由一个特定的领域。文本数据是最知名的数据类型之一,表现出这样的动态行为。换句话说,这些类型的数据的一个最佳选项创建一个动态环境中,证明了该方法的适应性。选定的数据评估阶段的细节如表所示 2

文本数据用于评估的细节。

的名字 #特性 #实例
文本 Stanford-Sentiment 140语料库[ 106年] 袋的话 1600000
大数据集的电影评论( 107年] 袋的话 50000年
句子极性数据集v1.0 ( 108年] 袋的话 10662年
互联网电影数据库( 105年] 袋的话 1400年
Yelp审查( 105年] 袋的话 598000年
亚马逊评论( 105年] 袋的话 1000000
医疗保健 心脏病数据集( 105年] 13 200年
乳腺癌数据集( 105年] 30. 569年
心律失常的数据集( 105年] 279年 454年
帕金森数据集( 105年] 45 241年
剖腹产数据集( 105年] 5 81年
基因表达数据集( 105年] 255年 801年
糖尿病数据集( 105年] 7 765年
Statlog(心)数据集 105年] 13 271年
物理 电离层数据集( 105年] 34 352年
声纳、矿山与岩石数据集( 105年] 60 208年
声音 声音数据集( 105年] 20. 3168年
情绪从音乐数据集( 105年] 28 592年
5.2。实验结果

为了评估该方法,18个数据集在不同领域介绍了在前面的小节中已经被使用。在文献中学习自动机,不同的模式被认为是优化学习自动机;在这篇文章中,三种模式被用来评估该方法。唇模式不被认为是由于贫穷的结果。每个LRI的评价结果,LRɛP,单体模式显示在单独的数据。为了确定最优值的奖励和惩罚参数,六个文本数据集已经被选中了。这种选择的原因是高多样性在文本数据的行为以及大量的样品和这六个数据集的大量的特征。LRI模式,惩罚参数的值被认为是零,在这种模式下和该方法的结果如图所示 3

该方法在LRI模式的结果。

基于文献学习自动机LRɛP模式,惩罚参数的值被认为是比奖励参数的值小得多。该方法的结果LRɛP模式如图所示 4

该方法的结果LRɛP模式。

正如学习自动机节中提到的,在单体模式,惩罚和奖励参数的值被认为是相等的。该方法的结果在这种模式下也显示在图 5

该方法的结果含模式。

比较的结果的实现方法在三个可调模式学习自动机显示含上设置模式导致了识别的精度最高。还有LRɛP和LRI模式。LRɛP模式的设置 一个= 0.01, b= 0.01不考虑,因为这些值等于第一个值中设置单体模式,和为了防止重复的结果在不同的表,这些设置了LRɛP模式。出于这个原因,许多实验上执行LRɛP模式评估是一个小于其他两个。考虑到奖励和惩罚参数的设置在单体模式的值 一个= 0.5, b= 0.5导致最高效率,评价已经完成其他数据集与这些设置。该方法的比较和主题文献中类似的方法如表所示 3

与类似的方法该方法的比较文学主题。

数据集 平均 多数投票 随机森林 我们的方法
文本 Sentiment140数据集 74.54 75.50 74.30 76.30
大型数据集的电影评论 86.28 86.86 86.42 86.62
句子极性数据集 73.75 74.63 73.38 77.03
电影评论数据集 81.58 81.58 81.67 85.92
Yelp评论极性 89.47 90.32 89.74 90.76
亚马逊评论极性 80.86 81.66 80.97 82.58
医疗保健 心脏病的数据集 58.00 57.50 57.50 65.00
乳腺癌数据集 97.41 97.36 96.49 98.24
心律失常的数据集 80.71 85.71 81.31 85.71
帕金森的数据集 63.95 64.58 64.58 68.75
剖腹产的数据集 60.31 62.50 43.75 68.75
基因表达数据集 95.59 95.62 96.27 98.75
糖尿病数据集 75.77 75.32 74.67 76.62
Statlog(心)数据集 81.20 81.48 79.62 85.18
物理 电离层数据集 91.05 91.54 92.95 95.77
声纳、矿山与岩石数据集 85.23 85.71 73.80 88.09
声音 声音数据集 76.38 76.18 76.49 88.95
情绪从音乐数据集 78.23 78.15 82.35 84.03

我们可以看到在桌子上 3的观点的准确性,该方法提供了更好的性能比主题文献的方法,这表明改善学习者的聚合模型基础。这个改善是由于使用强化学习的思想聚合的基本分类器的方法,称为基础的学习者。利用强化学习的思想创造了合奏的能力有所提高,而且提高了解决问题的能力,数据展示动态行为。实验的结果上执行不同的数据证实了功能添加到随机森林的方法。如前所述,矿业领域的意见,文本数据的类型是最明显的表现出这种动态行为的数据。因此,奖励和惩罚参数最优值已经确定在这些类型的数据,和这些设置用于其他类型的数据。

除了精度标准,其他统计标准检查来评估该方法。我们可以看到在桌子上 4,该方法显示在正面和负面类更好的结果比文献中可用的方法。在统计标准,精密(P)决定从分类器的精确结果,和回忆 R)确定分类器结果的完整性。提到的测试的结果统计标准表明,该方法具有很高的性能。

比较的统计标准。

积极的课堂 负类 积极的课堂 负类
方法 P (%) R (%) F1 (%) P (%) R (%) F1 (%) 方法 P (%) R (%) F1 (%) P (%) R (%) F1 (%)
Sentiment140数据集 帕金森的数据集
MV 72.44 70.35 71.38 70.90 72.96 71.92 MV 69.23 66.67 67.92 59.09 61.9 60.47
射频 72.44 74.58 73.49 76.46 74.43 75.43 射频 69.23 66.67 67.92 59.09 61.9 60.47
OM 75.20 80.36 77.69 81.17 76.16 78.59 OM 76.92 68.97 72.73 59.09 68.42 63.41
大型数据集的电影评论 剖腹产的数据集
MV 87.50 87.33 87.41 87.41 87.59 87.50 MV 55.56 71.43 62.5 71.43 55.56 62.5
射频 85.83 76.16 80.70 73.37 83.93 78.29 射频 33.33 50 40 57.14 40 47.06
OM 87.80 87.97 87.88 88.10 87.93 88.01 OM 66.67 75年 70.59 71.43 62.5 66.67
句子极性数据集 基因表达数据集
MV 75.63 72.83 74.20 72.80 75.61 74.18 MV 92.31 94.12 93.2 97.25 96.36 96.8
射频 74.62 67.78 71.08 65.95 72.94 69.27 射频 94.23 93.23 94.23 97.25 97.25 97.25
OM 76.04 73.29 74.64 73.29 76.04 76.64 OM 98.08 98.08 98.08 99.08 99.08 99.08
电影评论数据集 糖尿病数据集
MV 83.10 82.52 82.81 81.84 82.09 81.78 MV 90.29 76.86 83.04 45.1 69.7 54.76
射频 77.46 71.43 74.32 76.41 73.98 70.54 射频 90.29 76.23 82.67 43.14 68.75 53.01
OM 84.51 83.33 83.92 82.22 83.46 82.84 OM 91.26 77.69 83.93 47.07 72.73 57.14
Yelp评论极性 声音数据集
MV 90.85 88.04 88.42 87.11 90.11 88.59 MV 64.58 76.09 69.86 84.85 76.24 80.31
射频 80.64 85.94 83.21 86.22 81.00 83.53 射频 64.58 76.75 70.14 85.4 76.35 80.62
OM 90.00 89.43 89.71 88.89 89.49 89.19 OM 87.82 86.55 87.18 89.81 90.81 90.3
亚马逊评论极性 情绪从音乐数据集
MV 82.68 79.45 81.03 79.38 82.62 80.97 MV 83.58 78.87 81.16 71.15 77.08 74年
射频 79.12 74.56 76.77 73.98 87.61 76.22 射频 88.06 81.94 84.89 75年 82.98 78.79
OM 83.70 79.52 81.56 79.21 83.45 81.28 OM 92.54 81.58 86.71 73.08 88.37 80年
心脏病的数据集 声纳、矿山与岩石数据集
MV 61.90 59.09 60.47 52.63 55.56 54.05 MV 87.5 87.5 87.5 83.33 83.33 83.33
射频 61.90 59.09 60.47 52.63 55.56 54.05 射频 79.17 76年 77.55 66.67 70.59 68.57
OM 61.90 68.42 65.00 68.42 61.90 65.00 OM 87.5 87.5 87.5 83.33 83.33 83.33
乳腺癌数据集 Statlog(心)数据集
MV 95.74 97.83 96.77 98.51 97.06 97.78 MV 79.19 79.19 79.19 83.33 83.33 83.33
射频 97.87 93.88 95.83 95.52 98.46 96.97 射频 75年 78.26 76.6 83.33 80.65 81.67
OM 97.87 97.87 97.87 98.51 98.51 98.51 OM 79.19 86.36 82.61 90年 84.38 87.1
心律失常的数据集 电离层数据集
MV 88.37 82.61 85.39 83.33 88.89 86.02 MV 82.14 95.83 88.46 97.67 89.36 93.33
射频 83.72 78.26 80.9 79.17 79.74 73.85 射频 85.71 96年 90.57 97.67 91.3 94.38
OM 93.02 80年 86.02 79.19 92.68 85.39 OM 89.29 One hundred. 94.34 One hundred. 93.48 96.63

P, R,F1参考精度、召回和F1-score。MV:多数投票,射频:随机森林,和OM:我们的方法。

6。讨论

在本节中,该方法的更多细节解释的原因以及需要解决这些细节。这些包括预处理步骤的细节,优化学习自动机参数,以及排名根据他们的表现这些参数的设置。

6.1。预处理

在方法部分解释,预处理步骤是一个通用的步骤。为了评估,检查不同来自不同领域的数据。文本数据的预处理,以及相关的细节,描述如下。应该注意的是,其他类型的数据预处理,如特征提取、特征选择,规范化,去除噪声、和其他相关预处理,没有执行,因为他们所有的人都作为清洁UCI数据存储库( 109年]。和准确性的基础是基于以前的研究工作已经使用这些数据。

为了准备文本数据的主要过程,认为矿业领域选择和相关预处理如下。的细节意见文本数据挖掘的预处理步骤如图所示 6

富有表现力的延长。延长或词延伸是指词的细长的表达特定的情感强烈,和单词拼写错误纠正,取而代之的是原来的。

表情符号处理。它指的是表情符号替换的文本中提到他们的意义,这使得它更容易分析表情符号。

HTML标记删除。HTML标记的文本被删除,因为他们没有任何情感价值。

语言处理。语言用于编写一个给定的单词,总之音节,描述相同的意义,但保存的时间打字。在语言处理、语言的文本替换为原来的单词。

标点符号处理。标点符号在文本用于单独的句子和它们的元素,并阐明它们的含义。在标点符号处理,一旦处理撇号,所有剩余的标点符号和数字都删除。

Stopwords去除。Stopwords意义不多,没有文本中的重要性。Stopwords被简化的文本。

阻止。它指找出根或茎的一个字。消除各种后缀来减少单词的目的是阻止。

词元化。它返回基或字典的一个词,它被称为引理。它非常类似于阻止,但它更接近于同义词替换。

弓的创造。词创作的包是最新的预处理进行文本的准备。

文本数据的预处理步骤的细节。

6.2。奖励和惩罚的调优参数

文学主题的学习自动机,定义了三种不同的模式来优化参数的奖励和惩罚。在该方法中,强化学习的想法是使用学习自动机,实现这三个可调参数的方式奖励和惩罚是检查。这三种模式的结果在实验结果部分。摘要弗里德曼测试统计验证用于确定哪些模式和设置是最好的奖励和惩罚参数可调。设置参数值” 一个”和“ b“如表所示 5。确定这些参数的数值是基于主题学习自动机的文学。当然,各种各样的值可以考虑这两个参数。本文尝试调整参数以这样一种方式,所有的模式被认为是,这样他们可以用来证明了该方法的效率相比以前的方法。

奖励和惩罚参数的数值优化。

模式 参数
LRI 一个 0 0.1 0.1 0.3 0.5 0.7
b 0 0 0 0 0 0
LR εP 一个 0.1 0.1 0.3 0.5 0.7
b 0 0 0 0 0
含碘 一个 0 0.1 0.1 0.3 0.5 0.7
b 0 0.1 0.1 0.3 0.5 0.7
6.3。排名

弗里德曼测试统计验证( 110年)是一个排名的方法,不同的等级分配给每个输入样本,确定每个选项的最优水平。本文这种验证方法被用来确定奖励和惩罚参数的最优值和比较该方法与传统方法的主题文学整体学习。结果如表所示 6

弗里德曼测试统计验证结果排名奖励和惩罚的参数和比较该方法与文学。

方法 调优 意思是排名 最终排名
含碘 一个= 0.5, b= 0.5 19.17 1
含碘 一个= 0.3, b= 0.3 16.83 2
含碘 一个= 0.7, b= 0.7 15.58 3
MV 多数投票 14.67 4
含碘 一个= 0.1, b= 0.1 13.92 5
LReP 一个= 0.05, b= 0.01 12.17 6
LReP 一个= 0.1, b= 0.01 11.83 7
LReP 一个= 0.5, b= 0.01 10.08 8
含碘 一个= 0.05, b= 0.05 9.58 9
射频 随机森林 9.17 10
含碘 一个= 0.01, b= 0.01 8.75 11
LIR 一个= 0.01, b= 0 8.42 12
LIR 一个= 0.05, b= 0 7.67 13
LIR 一个= 0.1, b= 0 7.67 13
LIR 一个= 0.3, b= 0 7.67 13
LIR 一个= 0.5, b= 0 7.67 13
LIR 一个= 0.7, b= 0 7.67 13
AV 平均 7.58 14
LReP 一个= 0.3, b= 0.01 7.17 15
LReP 一个= 0.7, b= 0.01 6.75 16

我们可以看到在桌子上 6之间有显著差异,排名的方法和传统方法的排名,这表明该方法效率的改善与其他方法相比。三种模式中考虑优化奖励和惩罚参数,可以看出LRI排名上升,LReP,分别和单体模式。在单体模式,奖励和惩罚参数的值被认为是相同的,最高的效率也观察到。之间有显著差异的平均排名最好的奖励和惩罚参数的设置方法和这个等级随机森林方法。队伍的区别是证明该方法优化与传统方法聚合分类器实现一个强大的分类方法。

6.4。检查收敛速度

更准确地解决该方法在效率方面,LA融合已被调查。图 7显示了不同数量的LA行为的收敛奖励和惩罚变量。在大多数的不同设置这两个参数,收敛速度高,收敛到一个行为通常发生在达到一定数量的迭代。如表所示 5,收敛速度较低发生在其他的一些设置,在弗里德曼的测试中得分较低。

对不同的奖励和惩罚参数收敛速度。(一) 一个= 0.5, b= 0.5;( b) 一个= 0.3, b= 0.3;(c) = 0.7, b= 0;(d) 一个= 0.1, b= 0.1;(e) 一个= 0.01, b= 0;(f) 一个= 0.05, b= 0.05;(g) 一个= 0.3, b= 0。

6.5。噪声电阻

为了更准确地评估该方法并确定该方法的抗噪音,另一个评价是在前一节中给出的数据上执行。这个评估是由将20%噪声注入干净的数据。评价数据的结果表明,该方法,由于学习自动机的使用,具有较高的适应性问题的条件下,噪声的存在,与传统文学中的方法,该方法不受急剧下降,在这种情况下,它显示了比传统方法效率高。评价该方法在噪声图所示 8

该方法的评价噪声的存在。

7所示。结论和未来的工作

基础学习者聚合在整体学习应该以这样一种方式,以下几点。第一点:选择一个基础的学习者会导致最高的性能可实现的现状。第二点:如果情况变化的动力学问题,整体的结构将会改变以这样一种方式,它最大的兼容性与新环境的条件。因此,为了满足上面的点,实现一个能够适应动态环境的问题,在这篇文章中,新方法提出了基于强化学习的想法整合基础学习者在随机森林。在拟议的方法,学习自动机用于接收反馈的环境和执行操作。一般程序是接收反馈的环境,环境是一组基础的学习者,我们打算将比独立基础学习者实现更好的性能。学习自动机的行为包括选择一个基础学习者学习者的最佳基地。行动的选择是根据收到的反馈环境。这将导致数据的动态行为由使用强化学习的想法。另一方面,考虑到在每个阶段,学习自动机努力实现最高的可实现的回报,这是保证找到全球最佳状态空间的问题。 Adaptability is another advantage of the proposed method compared to similar methods in the subject literature.

因为在每一步学习自动机运行根据环境条件和接收反馈从环境中适应能力问题是满足。评估的结果执行不同的数据表明,该方法能够实现以上所有所需的项目。尽管事实上,与随机森林机制,所有功能都注入基础学习者在拟议的方法,该方法的效率在处理大容量数据并没有减少,结果比传统方法更有利。该方法是独立的数据类型和有能力处理任何其他类型的数据在任何领域。为了证实这一说法,为了评估方法,选择不同类型的数据。然而,没有任何限制的方法处理不同类型的数据。在本文中,一种新的聚合方法的基本学习者使用学习自动机,提出了随机森林。确定参数的最优值的奖励和处罚的形式自调优是一个未来的作品,作者打算做。

数据可用性

作者公开宣布所有可用的数据在UCI库。

的利益冲突

作者宣称没有利益冲突有关的出版。

C。 Y。 整体机器学习:方法和应用 2012年 纽约,纽约,美国 施普林格 加利西亚 一个。 Talavera-Llames R。 Troncoso 一个。 Koprinska 我。 Martinez-Alvarez F。 多步预测的大数据基于集成学习的时间序列 以知识为基础的系统 2019年 163年 830年 841年 10.1016 / j.knosys.2018.10.009 2 - s2.0 - 85055056789 Savargiv M。 Masoumi B。 Keyvanpour m·R。 一个新的基于学习自动机的集成学习方法 环境智能和人性化计算杂志》上 2020年 1 16 M。 J。 K。 意见挖掘使用合奏文本隐马尔可夫模型的文本分类 专家系统与应用程序 2018年 94年 218年 227年 10.1016 / j.eswa.2017.07.019 2 - s2.0 - 85026395526 Y。 苗族 D。 J。 Z。 对集成学习技术厂商三方组合在情绪分类 国际期刊的近似推理 2019年 105年 85年 97年 10.1016 / j.ijar.2018.10.019 2 - s2.0 - 85056747028 郭宏源。 Ullah 一个。 R。 “引导聚合和随机森林 2020年 纽约,纽约,美国 施普林格 389年 429年 马克尔 J。 贝里斯 a·J。 随机森林的机器学习算法的性能在二进制超新星分类 2019年 http://arxiv.org/abs/1907.00088 程ydF4y2Ba B。 Z。 森林对光子计数激光雷达信号检测使用随机森林 遥感信 2020年 11 1 37 46 10.1080 / 2150704 x.2019.1682708 W。 X。 Z。 方ydF4y2Ba Y。 J。 通过随机森林预测RNA分子特定杂交 学报2019年IEEE第七届国际会议上生物信息学和计算生物学(ICBCB) 2019年 杭州,中国 35 38 Darmawan m F。 。Abidin 答:F。 Kasim 年代。 Sutikno T。 Budiarto R。 随机森林的年龄估计模型基于左手骨的长度对亚洲人口 国际电气和计算机工程杂志》(IJECE) 2020年 10 1 549年 10.11591 / ijece.v10i1.pp549 - 558 公园 年代。 月亮 J。 荣格 年代。 ρ 年代。 Baik s W。 E。 两级工业负荷预测方案日前联合冷却、加热和电力调度 能量 2020年 13 2 443年 10.3390 / en13020443 J。 T。 年代。 森林深处方法分类电子商务产品通过使用标题信息 《2020年国际会议上计算、网络和通信(ICNC) 2020年 大岛,嗨,美国 1 5 Papouškova M。 Hajek P。 造型使用随机森林鉴于对等贷款违约损失 智能决策技术学报》2019 2020年 马耳他,欧洲 施普林格 133年 141年 博勒 D。 克里斯坦森 b . J。 Muhlbach N。 尼尔森 m . S。 针对预测的影响在一个随机森林回归模型 2020年 Sikdar 年代。 Kadiyali V。 妓女 G。 亚马逊市场价格动态:多元随机森林变量选择方法 2019年 Giffon l 定位 C。 Bouscarrat l Milanesi P。 Cherfaoui F。 Koco 年代。 修剪随机森林与正交匹配树 2020年 实在 j·L。 b . J。 D。 Karvellas c·J。 科赫 d·G。 Durkalski 诉L。 BiMM森林:一个随机森林方法建模集群和纵向二进制的结果 化学计量学和智能实验室系统 2019年 185年 122年 134年 10.1016 / j.chemolab.2019.01.002 2 - s2.0 - 85060943926 Mohapatra N。 Shreya K。 Chinmay 一个。 随机森林算法的优化 数据科学的进步和管理 2020年 纽约,纽约,美国 施普林格 201年 208年 Q。 T。 D。 卷积神经网络的混合模型和回归森林深处人群计数 应用智能 2020年 1 15 Santra B。 保罗 一个。 穆克吉 d . P。 确定神经网络使用复合随机森林深处的辍学生 模式识别的字母 2020年 131年 205年 212年 10.1016 / j.patrec.2019.12.023 Ganaie m·A。 Tanveer M。 Suganthan p . N。 斜通过双界SVM决策树合奏 专家系统与应用程序 2020年 143年 113072年 10.1016 / j.eswa.2019.113072 Katuwal R。 Suganthan p . N。 l 异构斜随机森林 模式识别 2020年 99年 107078年 10.1016 / j.patcog.2019.107078 Probst P。 莱特 m . N。 Boulesteix A.-L。 Hyperparameters和调优策略随机森林 威利跨学科评论:数据挖掘和知识 2019年 9 3 e1301 10.1002 / widm.1301 2 - s2.0 - 85060779526 年代。 M。 Ko b . C。 解释和简化的森林深处 2020年 http://arxiv.org/abs/2001.04721 耆那教徒的 V。 沙玛 J。 Singhal K。 Phophalia 一个。 指数加权随机森林 模式识别与机器智能, 2019年 11941年 可汗、瑞士 施普林格 170年 178年 Stafoggia M。 Glantz P。 随机森林方法估计每日颗粒物,二氧化氮和臭氧在瑞典精细的空间分辨率 大气 2020年 11 3 239年 10.3390 / atmos11030239 Hauglin 年代。 Montesano P。 造型使用国家森林地上生物量的股票在挪威与ArcticDEM和Sentinel-2数据库存数据 环境遥感 2020年 236年 111501年 10.1016 / j.rse.2019.111501 Breidenbach h·R。 Saravi M . M。 使用随机森林的地面沉降空间建模数据挖掘技术 GIS中的空间建模和R为地球和环境科学 2019年 荷兰阿姆斯特丹 爱思唯尔 147年 159年 J。 K。 Y。 F。 l 预测和分析的净生态系统碳交换基于梯度提高回归和随机森林 应用能源 2020年 262年 114566年 10.1016 / j.apenergy.2020.114566 l X。 预测中国商业部门的二氧化碳排放,通过BP神经网络基于随机森林和算法 科学的环境 2020年 718年 137194年 10.1016 / j.scitotenv.2020.137194 Y.-S。 H。 X.-Y。 >。 B.-G。 一种新的随机森林方法在犯罪连锁不平衡的问题 2020年 以知识为基础的系统 105738年 Mohapatra 美国K。 莫汉蒂 m . N。 大数据分析和生物医学信号使用随机森林算法的分类 决策科学与管理的新范式 2020年 纽约,纽约,美国 施普林格 217年 224年 Joshi 一个。 Choudhury T。 赛Sabitha 一个。 Srujan拉 K。 数据挖掘在医疗和预测肥胖 诉讼第三国际会议上计算情报和信息 2020年 海得拉巴,印度 877年 888年 10.1007 / 978 - 981 - 15 - 1480 - 7 - _82 El-Sappagh 年代。 萨哈 R。 基于早期阿尔茨海默病进展检测模型具有成本效益的多通道数据的融合 未来一代计算机系统 2021年 115年 680年 699年 10.1016 / j.future.2020.10.005 萨利赫 Y。 Halidou 一个。 Kapen p . T。 回顾数学建模、人工智能和数据集在这项研究中,使用COVID-19的预测和管理 应用智能 2020年 50 11 3913年 3925年 10.1007 / s10489 - 020 - 01770 - 9 Khedkar 年代。 甘地 P。 Shinde G。 萨勃拉曼尼亚 V。 深入学习并使用EHR可辩解的AI在医疗保健 2020年 新工作,纽约,美国 施普林格 129年 148年 T。 Stone-Weiss N。 J。 戈埃尔 一个。 库马尔 一个。 机器学习作为一种工具来设计眼镜与控制医疗保健应用程序解散 《生物材料 2020年 107年 286年 298年 Subudhi 一个。 破折号 M。 Sabut 年代。 使用采用自动分割和分类的脑部中风和随机森林分类器 生物控制论和生物医学工程 2020年 40 1 277年 289年 10.1016 / j.bbe.2019.04.004 Javadi 一个。 Khamesipour 一个。 Monajemi F。 Ghazisaeedi M。 计算建模和分析预测细胞内寄生虫抗原决定基使用随机森林技术特征 公共卫生杂志 2020年 49 1 125年 Shaikhina T。 D。 数据的 年代。 布里格斯 D。 希金斯 R。 Khovanova N。 决策树和随机森林模型预测结果抗体不兼容的肾移植 生物医学信号处理和控制 2019年 52 456年 462年 10.1016 / j.bspc.2017.01.012 2 - s2.0 - 85030329482 辛格 K·K。 库马尔 年代。 迪克西特 P。 亚太区 m·K。 基于卡尔曼滤波器的短期预测模型COVID-19蔓延 应用智能 2020年 1 13 Na S.-J。 胫骨 J.-W。 加工 工程学系。 E.-H。 研究随机变化与森林有关的估算模型的自动行走模式高于膝盖假肢 《IKEEE 2020年 24 1 9 18 Alloghani M。 贝克 T。 Al-Jumeily D。 侯赛因 一个。 Mustafina J。 Aljaaf a·J。 机的前景和深度学习在分析生命体征的改善医疗保健服务 自然计算在数据挖掘和机器学习 2020年 纽约,纽约,美国 施普林格 113年 136年 Y。 W。 G。 H。 J。 W。 随机森林增强使用改进的人工鱼群内侧膝盖接触力的预测 人工智能在医学上 2020年 103年 101811年 10.1016 / j.artmed.2020.101811 H。 多模型基于CNN的级联方法和随机森林深处制药粒子检测 IEEE仪表和测量 2020年 69年 9 7028年 7042年 H。 荣格 E。 “年度变化的分析与随机森林老师附件的决定因素 2020年 纽约,纽约,美国 施普林格 463年 470年 X。 l 降尺度的solar-induced叶绿素荧光从树冠层光系统水平使用随机森林模型 环境遥感 2019年 231年 110772年 10.1016 / j.rse.2018.05.035 2 - s2.0 - 85048162790 Guanter 年代。 Santosh Kumar J。 绩效评估的随机森林预测糖尿病的特征选择方法 国际电气和计算机工程杂志》上 2020年 10 Subasi 一个。 艾哈迈德 一个。 Aličković E。 Rashik哈桑 一个。 光刺激对偏头痛的效果检测使用随机森林和离散小波变换 生物医学信号处理和控制 2019年 49 231年 239年 10.1016 / j.bspc.2018.12.011 2 - s2.0 - 85058502157 El Haouij N。 Poggi 人类。 Ghozi R。 Sevestre-Ghalila 年代。 Jaidane M。 随机与森林有关的生理功能的变量选择方法对司机的压力水平分类 统计方法与应用 2019年 28 1 157年 185年 10.1007 / s10260 - 018 - 0423 - 5 2 - s2.0 - 85041915721 Ayata D。 Yaslan Y。 Kamasak m E。 多通道生理信号的情感识别情感意识到卫生保健系统 医学和生物工程杂志》上 2020年 40 149年 157年 Zeraatpisheh M。 Bakhshandeh E。 Hosseini M。 Alavi s M。 评估森林砍伐和集约农业对土壤质量的影响通过数字土壤制图 Geoderma 2020年 363年 114139年 10.1016 / j.geoderma.2019.114139 X。 P。 l H。 Z。 C。 由拉曼光谱测定毒死蜱在梨用随机森林回归分析 分析信 2020年 53 6 821年 833年 10.1080 / 00032719.2019.1681439 J。 R。 Y。 映射矿物通过semi-supervised前瞻性随机森林 自然资源研究 2020年 29日 1 189年 202年 10.1007 / s11053 - 019 - 09510 - 8 2 - s2.0 - 85068326114 年代。 X。 王ydF4y2Ba H。 Z。 年代。 X。 人大三级逆变器开路故障诊断基于自适应电时期分区和随机森林 传感器和执行器网络杂志》上 2020年 2020年 18 9206579 10.1155 / 2020/9206579 拉索尔教授 美国年代。 库马尔 年代。 实证研究的整体软件故障预测技术 应用智能 2020年 1 30. 艾哈迈德 T。 程ydF4y2Ba H。 非线性自回归和随机森林方法预测电力负荷电力能源管理系统 可持续城市和社会 2019年 45 460年 473年 10.1016 / j.scs.2018.12.013 2 - s2.0 - 85058677354 古普塔 年代。 Sarkar J。 茶室 M。 Bandyopadhyay n R。 Ganguly 年代。 自动识别的SEM显微结构和阶段钢使用枸杞多糖和随机森林经营者的决定 测量 2020年 151年 107224年 10.1016 / j.measurement.2019.107224 l·T·T。 德布斯 l 德菲利斯 M。 Troccoli 一个。 在欧洲重建数十年country-aggregated水力发电基于随机森林模型 能量 2020年 13 7 1786年 10.3390 / en13071786 Y。 年代。 C。 H。 基于随机森林的智能方法在地铁车站深基坑的安全风险预测 计算机在土木工程杂志》上 2019年 33 1 05018004 10.1061 /(第3期)cp.1943 - 5487.0000796 2 - s2.0 - 85054099339 X。 张ydF4y2Ba Y。 预测地理认证的绿茶保护原产地名称使用随机森林模型 食品控制 2020年 107年 106807年 10.1016 / j.foodcont.2019.106807 美国一个。 Ngare P。 Ikpe D。 通过分位数的概率预测作物产量随机森林和Epanechnikov内核函数 农业和森林气象学 2020年 280年 107808年 10.1016 / j.agrformet.2019.107808 h·J。 m . H。 利用邻接的同事和类型的相关性增强链接预测 数据与知识工程 2020年 125年 101785年 10.1016 / j.datak.2019.101785 Khorshidpour Z。 Hashemi 年代。 Hamzeh 一个。 评价随机森林分类器的安全域 应用智能 2017年 47 2 558年 569年 10.1007 / s10489 - 017 - 0907 - 2 2 - s2.0 - 85017466763 J。 l F。 人工智能 Y。 R。 C。 多域entropy-random森林的融合诊断方法具有中介轴承故障声发射信号 2020年 22 1 57 B。 Suman 答:K。 Chakraborty B。 使用机器学习葡萄酒质量分析 2020年 纽约,纽约,美国 施普林格 239年 247年 Madhumathi K。 苏雷什 T。 在无线传感器网络中,节点定位使用多输出随机森林回归 2020年 纽约,纽约,美国 施普林格 177年 186年 Y。 Y。 C。 l l 针对恶意SSL / TLS加密:确定基于随机森林的恶意流量 第四届国际大会程序信息和通信技术 2020年 英国伦敦 99年 115年 Bhavani T . T。 m·K。 Reddy a . M。 网络入侵检测系统使用随机森林和决策树机器学习技术 第一届国际会议论文集可持续技术计算智能 2020年 英国伦敦 637年 643年 Chaithanya p S。 拉曼 m·r·G。 Nivethitha 年代。 k . S。 斯利 诉。 一个有效的入侵检测方法使用增强随机森林和moth-flame优化技术 计算智能模式识别 2020年 纽约,纽约,美国 施普林格 877年 884年 明镜 Z。 一种新型战略通过激光诱导击穿光谱定量分析土壤pH值加上随机森林 等离子体科学技术 2020年 22 7 74003年 M.-H。 基于鲁棒随机森林non-fullerene有机太阳能电池效率的预测 有机电子 2020年 76年 105465年 10.1016 / j.orgel.2019.105465 J。 G。 Y。 太阳 J。 Aslani F。 造型轻便的自密实混凝土的单轴抗压强度使用随机森林回归 建筑和建筑材料 2019年 210年 713年 719年 10.1016 / j.conbuildmat.2019.03.189 2 - s2.0 - 85063604391 夏威夷雁 W。 C。 H。 Y。 l 预测使用极端的不排水抗剪强度梯度的增加和随机森林基于贝叶斯优化 地球科学前沿 2020年 12 1 469年 477年 P。 Z.-Y。 Y.-F。 常ydF4y2Ba T·h·T。 一种新颖的混合代理智能蠕变指数预测模型基于粒子群优化和随机森林 工程地质 2020年 265年 105328年 10.1016 / j.enggeo.2019.105328 沙阿 K。 帕特尔 H。 Sanghvi D。 沙阿 M。 逻辑回归的比较分析,随机森林和资讯为文本分类模型 增强人体研究 2020年 5 1 1 16 10.1007 / s41133 - 020 - 00032 - 0 Hakak 年代。 Alazab M。 年代。 Gadekallu t·R。 Maddikunta p·k·R。 w Z。 一个机器学习方法通过有效的特征提取分类假新闻 未来一代计算机系统 2021年 117年 47 58 10.1016 / j.future.2020.11.022 辛格 s . N。 Sarraf T。 情绪分析产品使用随机森林算法基于用户评论 数据科学与工程 2020年 32 112年 116年 H。 N。 Y。 Z。 标签烙攻击朴素贝叶斯垃圾邮件过滤系统 应用智能 2021年 考尔 r P。 库马尔 M。 金达尔 m·K。 报纸的文字识别Gurumukhi脚本使用随机森林分类器 多媒体工具和应用程序日志 2019年 1 14 Madichetty 年代。 Sridevi M。 一个新颖的方法,识别在灾害损失评估tweet 将来时。总的来说。第一版。系统。 2020年 116年 440年 454年 Madasu 一个。 Elango 年代。 有效的特征选择情绪分析的技术 多媒体工具和应用程序 2020年 79年 9 - 10 6313年 6335年 10.1007 / s11042 - 019 - 08409 - z A.-C。 Trappey c V。 Trappey a . j . C。 程ydF4y2Ba L . w . L。 Web挖掘客户感知定义产品的位置和设计偏好 国际期刊在语义网和信息系统 2020年 16 2 42 58 10.4018 / ijswis.2020040103 库马尔 R。 考尔 J。 随机与森林有关的讽刺tweet分类使用多个功能集合 为物联网应用多媒体大数据计算 2020年 纽约,纽约,美国 施普林格 131年 160年 俄南 一个。 Tocouglu m·A。 加权词嵌入和clustering-based识别蕴藏论坛帖子的主题问题 计算机应用在工程教育 2020年 Baez-Villanueva o . M。 摩尔诺 M。 RF-MEP:随机森林方法合并网格降水和地面测量的产品 环境遥感 2020年 239年 111606年 10.1016 / j.rse.2019.111606 贝克 一个。 情绪分析大规模网络公开课程评价:文本挖掘和深度的学习方法 计算机应用在工程教育 2020年 俄南 一个。 情绪分析产品评论基于加权词嵌入和深层神经网络 计算机应用在工程教育 2020年 e5909 俄南 一个。 Tocoglu m·A。 一个词加权神经语言模型和基于堆叠双向LSTM讽刺识别框架 IEEE访问 2021年 9 7701年 7722年 10.1109 / access.2021.3049734 Rodriguez-Pardo C。 会长Patricio m·A。 Berlanga 一个。 莫利纳 j . M。 “智能机器学习旅游和零售 2020年 IGI全球 311年 333年 首歌 W。 Y。 基于随机森林模型的道路旅行时间预测方法 智能计算和通信的趋势 2020年 纽约,纽约,美国 施普林格 155年 163年 Jamatia 一个。 由捐款者驱动 U。 保罗 年代。 DebBarma 年代。 戴伊 年代。 评级预测基于监督机器学习算法的旅游目的地 计算智能数据挖掘 2020年 纽约,纽约,美国 施普林格 115年 125年 鲍迈斯特 c F。 Gerstenberg T。 Plieninger T。 Schraml U。 探索文化生态系统服务热点:连接多个城市森林特性与公众参与映射数据 城市森林与城市绿化 2020年 48 126561年 10.1016 / j.ufug.2019.126561 埃文斯 J。 Waterson B。 汉密尔顿 一个。 使用一个基于上下文的随机森林算法预测道路交通条件 交通规划和技术 2019年 42 6 554年 572年 10.1080 / 03081060.2019.1622250 2 - s2.0 - 85067574758 l 见鬼 X。 太阳 Q。 年代。 Multi-scenario上海城市土地变化的模拟随机森林和CA-Markov模型 可持续城市和社会 2020年 55 102045年 10.1016 / j.scs.2020.102045 H。 Z。 J。 程ydF4y2Ba Z。 在宁波城市GDP空间化基于NPP / VIIRS夜间使用随机森林回归光和辅助数据 太空研究的进步 2020年 65年 1 481年 493年 10.1016 / j.asr.2019.09.035 2 - s2.0 - 85073078607 Z。 W。 C。 l 基于随机森林的智能卡数据识别乘客 专业智能运输系统 2020年 14 4 207年 212年 10.1049 / iet-its.2019.0414 Q。 程ydF4y2Ba l X。 累进随机与森林有关的随机游走方法交互的半自动分割肺叶 国际期刊的机器学习和控制论 2020年 11 2221年 2235年 有德 S . l . S。 Jaidhar c, D。 实证研究估计随机森林分类器的稳定性基于推荐的混合特性滤波器的特征选择技术 国际期刊的机器学习和控制论 2020年 11 2 339年 358年 10.1007 / s13042 - 019 - 00978 - 7 2 - s2.0 - 85068847135 Lakshmanaprabu 美国K。 Shankar K。 Ilayaraja M。 纳西尔 答:W。 Vijayakumar V。 Chilamkurti N。 随机森林的大数据分类物联网使用的最佳特性 国际期刊的机器学习和控制论 2019年 10 10 2609年 2618年 10.1007 / s13042 - 018 - 00916 - z 2 - s2.0 - 85065869510 P。 X。 l B。 平面随机森林:一个新的整体学习法对更好的培训效率和自适应模型大小森林深处 国际期刊的机器学习和控制论 2020年 11 2501年 2513年 古德温 M。 Yazidi 一个。 分布式学习automata-based方案分类使用小说追求计划 应用智能 2020年 50 7 2222年 2238年 10.1007 / s10489 - 019 - 01627 - w 纳兰德拉 k . S。 Thathachar m·a·L。 学习自动机:介绍 2012年 切姆斯福德、钙、美国 快递公司 Rezvanian 一个。 Saghiri a . M。 Vahidipour s M。 Esnaashari M。 Meybodi m·R。 学习自动机的最新进展 2018年 754卷。 纽约,纽约,美国 施普林格 萨顿 r S。 Barto a·G。 强化学习:介绍 2017年 B。 l 看到明星:剥削阶级关系情绪分类等级量表 2005年 http://arxiv.org/abs/0506075 Maas 一个。 戴利 r·E。 范教授 p . T。 D。 Ng a . Y。 Potts C。 学习情绪分析词向量 美国第49计算语言学协会的年会:人类语言技术 2011年 美国纽约州布法罗 142年 150年 B。 l Vaithyanathan 年代。 大拇指?情绪分类使用机器学习技术 2002年 http://arxiv.org/abs/0205070 Dua D。 格拉夫 C。 UCI机器学习库 2019年 欧文, 加州大学,学校的信息和计算机科学 Lopez-Vazquez C。 Hochsztain E。 扩展和更新表弗里德曼等级测试 通信在统计理论和方法 2019年 48 2 268年 281年 10.1080 / 03610926.2017.1408829 2 - s2.0 - 85038625856