计算智能和神经科学

PDF
计算智能和神经科学/2021年/文章
特殊的问题

机器学习的解释:预测,2021年代表、建模和可视化

把这个特殊的问题

研究文章|开放获取

体积 2021年 |文章的ID 5572781 | https://doi.org/10.1155/2021/5572781

穆罕默德·Savargiv Behrooz Masoumi Mohammad Reza Keyvanpour, 一种新的随机森林算法基于学习自动机”,计算智能和神经科学, 卷。2021年, 文章的ID5572781, 19 页面, 2021年 https://doi.org/10.1155/2021/5572781

一种新的随机森林算法基于学习自动机

学术编辑器:张年
收到了 2021年2月12日
修改后的 2021年3月09
接受 2021年3月16日
发表 2021年3月27日

文摘

聚合基分类器的目标是实现一个聚合比单个分类器分类器有更高的分辨率。随机森林是一个类型的集成学习方法被认为是比其他乐团学习方法由于其结构简单、易于理解,以及更高的效率比类似的方法。经典方法的能力和效率总是受到数据。从数据域,独立的能力和适应能力问题空间条件下,是最具有挑战性的问题的不同类型的分类器。本文提出了一种基于学习自动机方法,通过自适应问题空间的能力,以及独立的数据域,被添加到随机森林来提高其效率。使用随机森林中强化学习的思想使得人们有可能解决问题数据的动态行为。动态行为是指行为的可变性的一个数据样本在不同领域。因此,评价该方法,创造一个环境与动态行为,不同领域的数据被认为是。在拟议的方法,添加到随机森林使用学习自动机。这种选择的原因是学习自动机的结构简单、学习自动机的兼容性问题空间。 The evaluation results confirm the improvement of random forest efficiency.

1。介绍

随机森林是集成学习的方法之一,在均匀基础学习者类别的建设性的分类器的类型。顾名思义,基础学习者都是决策树,因此他们有了一个更简单的结构比类似的方法1]。随机森林结构有两个优点。第一类是从计算的观点来看,第二类是从统计学的观点。优势,可以考虑从计算的观点是:随机森林有能力处理回归和分类问题。这个分类器的训练和预测流程执行在高速度,因此随机森林被称为经典的快速分类。随机森林的另一个优点是它能够直接使用高维问题[2]。第二种观点的随机森林的优点是它的特点,即优先级的功能,不同的权重系数不同的归因类,和插图和无监督学习能力。

根据文献,随机森林方法是整体学习最实用的方法之一。权重合奏的基础学习者学习的一个主要挑战聚合的基本分类器以达到更强的分类器(3]。重基础学习者的原因,或者换句话说,确定影响因子对于每一个基础的学习者,是提高数据挖掘算法的可伸缩性问题空间。这变得更加明显,当环境是动态的,和不同的或有时相互矛盾的行为是观察到的数据在不同的情况下。文本数据环境中有这样一个有趣的行为数据挖掘算法,它挑战。例如,将一个词在一个域可能创建一个积极的极性,但它也可能在另一个域上创建一个负极性。这种差异在极性创建没有任何改变单词的形式,没有任何变化的作用从语法的角度来看这个词。“小”这个词在电子领域和餐馆领域有如此行为。这种行为构成了重大挑战的观点挖掘算法(4]。

克服这一挑战的解决方案在古典文学是基于lexical-based的使用方法。这种方法是基于框架如unigram,语法,以面向方面为基础的,和类似的方法,都是视。除了迫切需要预定义的数据,这些方法失去效率如果他们会见了一个未指明的词或意见矿业领域的隐喻。换句话说,他们不兼容问题空间。随机森林的工作方式与训练数据的顺序放置,特征向量注入每一个基础的学习者,它试图找到最佳特征子集,并增加其影响因素分类器,实现最高的性能在所有聚合基础学习者(5]。然而,这种方法并不是有效的有关数据如文本,一个词可以在不同的领域有不同的极性,因为在分类算法,没有能力适应问题空间的条件。

在这篇文章中,我们打算让随机森林的强化学习,提高效率。在拟议的方法,学习自动机用于聚合和重基础的学习者。学习自动机的工作方式是从环境和接收反馈执行的操作基于反馈的类型。在学习自动机,反馈强化信号分为两类:奖励信号和点球信号。对于每一个强化学习自动机收到的信号,它更新的概率选择前一步骤中选择的行动。这一过程持续进行直到行动选择的概率收敛于一个行动;换句话说,运行在当前形势下的最佳选择。在拟议的方法,学习自动机行为是适当的,当一个人基础学习者选择导致的最大奖励,可以收到环境。在每个阶段的学习自动机执行以来,学习算法试图选择最好的选择,实现全球问题空间的最适条件保证。这是证明该方法的适应性。 In the proposed method, the subprocess of replacing features in the feature vector is removed, and all the features in the feature vector are used. As a practical application in the field of opinion mining, if the Bag of Word (BoW) method is used to create the feature vector, the advantage of considering all the features of the feature vector will also cover cases that occur rarely. In other words, in the proposed method, the aspect of independence from the domain in the processes such as opinion mining is considered.

我们的贡献是总结如下:本文简要回顾随机森林的应用范围。本文提出一个学习automata-based法提高随机森林的性能。该方法独立运作的领域,它是适应问题空间的条件。

剩下的纸是组织如下。节2介绍了相关工作。部分3介绍了介绍学习自动机。该方法在部分说明4。部分5包括评估。讨论了部分6,最后,节中描述的结论和未来的工作7

在本节中,理论和随机森林是检查的有关这一课题的文献。本节的目的是回顾介绍了创新在近年来随机森林。

随机森林是一个齐次乐团的合奏的方法学习学习小组。在随机森林,每一个决策树,或者换句话说,每个基本学习者,能够访问一个随机子集的特征向量(6]。因此,特征向量的定义如下: ,在那里p是可用的维度属性向量为基础的学习者。的主要目标是寻找预测功能f(x),预测Y参数。预测函数定义如下: 在哪里l被称为损失函数,目的是减少损失的期望值。对于回归的应用程序和分类应用程序,平方误差损失和损失0 - 1是常见的选择,分别。这两个函数定义如下方程(3)和(4),分别。

创建一个乐团,一组基础学习者聚在一起。如果基础学习者定义如下: 对于回归的应用程序,将基于方程(平均6),对于分类应用程序,投票将基于方程(7)。

随机森林分类应用程序所示算法的伪代码1

D= {(x1,y1),(x2,y2),…,(xN,yN)}表示训练数据x= (x,1,x,2、…x我,p)T
jJ = 1:
采取引导样本的大小为N D。
使用引导样本,Dj作为训练数据树。
(一) 从单个节点的所有观测。
(b) 重复以下步骤为每个节点递归,直到满足停止准则:()选择预测的随机p可用的预测因子。
所有的二元分裂中找到最好的二元分裂步骤(i)的预测。
将节点分为两个后代节点使用步骤(2)的分裂。
在一个新的x作出预测。
在哪里 响应变量的预测在哪里x使用j树。

我们可以看到在算法1随机森林,试图找到一个子集的功能使用各种替代的训练数据和功能最大化输出的效率和准确性。这组的功能是用来识别一个新实例。

以下是简要回顾随机森林的文学主题。应该注意,我们打算介绍课题的背景,这纸不是一个审查,提出审查是一个简短的回顾和没有提到的所有以前的作品无疑。然而,作者试图把最新、最权威的研究工作近年来出版。

2.1。天文学、生物信息学、和经济学领域

在天文学领域,马克尔和贝里斯7)使用射频IA型的分类和核坍缩超新星。陈等人。8]提出一种方法来检测潜在的信号通过射频光子。生物信息学,彭日成et al。9)提出一个方法来减少计算复杂度的RNA仿真软件通过一个典型的随机森林。Darmawan et al。10)提出一个估计模型在生物信息学领域的时代。在经济学领域,公园等。11]提出两个阶段的短期负荷预测随机森林和深层神经网络,以减少能源成本。12用一个典型的射频解决电子商务产品分类问题。通过射频建模消费信贷风险的主要目标是(13]。14增加树的相关性通过控制将分裂的概率随着有力预测来解决高维设置。Sikdar et al。15)提出了一种基于射频识别的变量选择方法的关键预测价格变化在亚马逊。

2.2。一般和全球性问题领域

在通用领域,Giffon et al。16)使用的正交匹配追踪算法计算权重的线性组合生产树与最小训练误差的线性组合。结合射频和广义线性混合模型的主要思想17集群和纵向二进制结果)模型。Mohapatra et al。18)优化随机森林利用不平等权重投票策略。霁et al。19)提出一个混合模型的人群计数卷积神经网络(CNN)和回归森林深处。Santra et al。20.)提出一个确定性辍学删除不重要的神经网络连接的射频。提出了斜射频没有显式的正则化技术的主要目标是通过最小化结构风险(21]。Katuwal et al。22)使用一个斜超平面将增加的数据树的准确性,减少射频的深度。Probst et al。23)调整hyper-parameters达到更高的性能改善射频。金等。24]提出一个解释方法和简化的黑箱模型深射频通过量化特征的贡献和训练有素的深射频频率。耆那教等。25]目的动态称重方案射频使用决策树和数据样本之间的相关性。在全球性问题领域,Stafoggia et al。26]估计每日天气预报的颗粒物射频。建模全球森林面积由射频的主要目标27]。Breidenbach和Saravi28]研究地面沉降空间建模和评估。分析净生态系统碳交换的目标(29日]。使用指数量化预测全球气候问题的能力随机森林算法的优化能力的神经网络预测模型的主要目的是(30.]。李等人。31日)解决类失衡通过检测串行双。

2.3。医疗保健领域

肥胖患者的诊断检测和预测的主要目标是通过射频(32,33),分别。El-Sappagh et al。34)使用简单的表单中射频检测阿尔茨海默病的进展。在[35),介绍了射频作为一个有用的机器学习工具对于医疗领域,特别是对于COVID-19建模。Khedkar et al。36)使用患者电子健康记录供射频预测心力衰竭的风险。羽根等。37提出一个预测模型的各种氧化物的溶解行为的眼镜。Subudhi et al。38)提出一个方法通过射频检测缺血性中风的MRI图像序列。Javadi et al。39)提出一个方法来预测细胞内寄生虫的免疫原性肽。识别关键风险因素与器官移植急性排斥反应的主要建议(40]。在辛格et al。41),射频已经作为一个分类器分类covid-19蔓延。Na et al。42]提出一种自动模式更改的膝上假肢行走。集群和预测由射频生命体征的目标(43]。朱et al。44)优化参数的随机森林改善鱼类群算法预测膝盖接触力。方法确定外国粒子液体药品的质量检测提出了(45]。李和荣格(46)考虑老师附件和学生成长之间的关系。47提出一种实用的SIF降尺度方法。Guanter et al。48基于RF)提出一个方法预测糖尿病。Subasi et al。49)提出了一个决策支持系统由射频对偏头痛的诊断。司机的压力水平分类的主要目的是(50]。Ayata et al。51]提出一种情感识别算法的多通道生理信号通过使用随机森林作为识别的机器学习方法之一。

2.4。工业和网络领域

Zeraatpisheh et al。52)使用生产的典型射频特性映射在工业领域。杜et al。53)提出一个快速、准确检测农药的检测射频技术构建一个定量检测模型。改善性能的映射矿物的主要目标是文献[54]。刘等人。55]提出一种自适应电时期分区开路故障检测算法。软件故障预测整体技术调查(56]。在[57),RF id是用于构建分布式能源系统。提出了一种综合图像处理模型,58]。何鸿燊et al。59]利用射频来提出一个气候数据模型框架,利用水力发电。周et al。60]使用射频小和不平衡的数据集来创建一个风险预测模型的决策工具。邓et al。61年提出一个保护高附加值食品射频身份验证方法。提出的预测农产品由射频(62年]。宋和金63年)使用加权随机森林预测模型的链接。Khorshidpour et al。64年)提供了一个模型与nondifferentiable攻击分类方法决策边界。多域融合熵和射频的主要目标是(65年)提出了一种具有中介轴承的故障诊断方法。分析了葡萄酒质量提出了(66年]。在网络领域,Madhumathi和苏雷什67年)开发一个模型来预测未来动态传感器节点在无线通信的位置。方等。68年)提出一个加密的恶意流量识别方法。检测网络入侵的典型射频是提出的69年),和网络中的入侵检测安全通过调优Moth-Flame的射频参数优化算法,70年]。

2.5。物理、文本处理、旅游和城市规划领域

在物理领域,明镜(71年)射频测量和量化土壤的pH值。72年提出一个模型来提取能量调制之间的复杂关系和设备效率。Zhang et al。73年)提出一个模型来准确而有效地预测UCS LWSCC的甲虫为调优的hyper-parameters射频天线搜索算法。岩土参数的预测典型射频是由(74年]。蠕变指数预测的RF算法来确定变量的最优组合的主要目标是(75年]。在文本处理领域,射频和其他分类器之间的比较是由(76年)寻找最好的分类主题文学文本的分类。随机森林作为一个基础学习者的假新闻的整体模型的检测(77年]。分析评论家的评论情感分析的主要目标是(78年]。Zhang et al。79年)提出了两种新颖的标签翻攻击来评估森林NB根据随机噪声的鲁棒性。认识报纸文本由射频是由(80年]。Madichetty和Sridevi81年)使用射频的分类器来检测损伤评估的微博。Madasu和Elango82年)使用的典型射频特性选择情绪分析。Chang et al。83年)使用在线客户评论意见挖掘的射频。文本分类通过简单的射频的目标是(84年]。奥南和Tocouglu85年)提供一个文档聚类和主题建模方法在大规模网络公开课。情感分析技术英文单词的基尼指数特征选择是由(86年]。贝克(87年]使用整体学习和深度学习情绪分类方案预测性能高的大规模网络公开课的评论。俄南(88年]目前基于深度学习的情感分析方法。这种方法使用TF-IDF加权手套字嵌入与CNN LSTM架构。奥南和Tocoglu89年)存在一个有效的讽刺识别框架对社交媒体数据通过追求神经语言的范例模型和神经网络。在旅游领域,Rodriguez-Pardo et al。90年基于简单的射频)提出一个方法预测游客的行为。预测旅行时间减少交通拥堵的主要目标是(91年]。Jamatia et al。92年提出一个旅游目的地的预测方法。在城市规划中,鲍迈斯特et al。93年排名的城市森林文化生态系统服务供给特征典型的射频。由[预测道路交通条件94年]。城市空间发展的模拟射频提出了(95年]。调查信息经济发展的国内生产总值(gdp)为分析提出了(96年]。梅等。97年)提出一个方法来识别交通系统的时空通勤模式。在这个简短回顾,提到引用分类和功能方面的创新。

从表可以看出1,RF高范围的应用程序和范围的变化。相比之下,在数量和质量方面,他们的创新通常仅限于设置不同的参数,而且没有重大创新基地学习者组合。


类型

功能 天文学 (7]、[8]
生物信息学 (9]、[10]
经济学 (11]、[12]、[13]
全球性的问题 (26]、[27]、[28]
医疗保健 (32]、[33]、[34]、[35]、[36]、[41]、[98年]、[37]、[39]、[40]、[42]、[43]、[45]、[46]、[47]、[48]、[49]、[50]、[51),
工业 (52]、[53]、[54]、[55]、[56]、[57]、[58]、[59]、[60]、[61年]、[62年]
网络 (63年]、[67年]、[68年]、[69年]、[99年]、[One hundred.]
物理 (71年]、[72年]
文本处理 (76年]、[77年]、[78年),80年(81年]、[82年]、[83年]、[84年]
旅游 (91年]、[92年]
城市规划 (93年]、[94年]、[95年]、[96年]、[97年]
创新的方法 经济学 (14]、[15]
一般 (16]、[17]、[18]、[19]、[101年]、[21]、[22]、[23]、[24]、[25]
全球性的问题 (30.]、[31日]
医疗保健 (44]
工业 (65年]
网络 (64年]
物理 (73年]、[75年]
文本处理 (79年]、[86年]

3所示。学习自动机

学习自动机(LA)的学习算法,在不同的时间选择不同的动作后,确定反应的最佳实践方面收到从一个随机的环境。拉选择一个动作从向量的集合行为的概率,这行动是评估环境中。通过接收到的信号环境,洛杉矶更新概率向量,通过重复这个过程,逐渐确定最优行动。可以制定分类问题作为一个团队的共同运作优化一个目标函数102年]。在图1,学习自动机和环境之间的相互作用。

找到全局最优解空间中使用的另一个优点。洛杉矶可以正式代表的四倍 在这 是行动的集合(输出)的洛杉矶;换句话说,组输入的环境。 是洛杉矶的组输入;换句话说,设置的输出环境。 是洛杉矶的概率向量操作和 学习算法。

在洛杉矶,在环境中可以定义三种不同的模型。P-Model,环境提出了0或1的值作为输出。Q-Model,环境的输出值是离散数字0和1之间。s模式,环境是连续的输出值在0和1之间。所选的行动拉更新信号来自环境和使用奖励和惩罚函数。的数量分配奖励和惩罚的LA行动可以被定义在四个方面:含碘,奖励和处罚的数量被认为是相同的;LRεP量的惩罚比奖励小几次;LRI的罚款金额是0;和唇,奖励金额是0 (103年]。

在每一个瞬间n,操作概率向量π(n)更新线性学习算法给出了方程(13)如果选择行动ai (k)奖励的环境,并更新根据方程(14)如果选择行动惩罚104年]。 ,“一个“是奖励参数”,b“是惩罚参数,和“r“是操作的数量。作者应用了该方法拉的,因为:(我)洛杉矶在不确定的情况下提供了一个可接受的性能。(2)洛杉矶并在概率空间搜索行动。(3)洛杉矶需要简单的反馈环境优化其状态。(iv)自洛杉矶有一个简单的结构,它有一个简单的软件和硬件实现。(v)洛杉矶不限制使用精度标准优化使用。(vi)洛杉矶是适用于实时使用自洛杉矶并不涉及光计算复杂性(105年]。

4所示。该方法

随机森林是集成学习的方法之一,同一类型(即所有构造函数分类器。决策树)。因此,随机森林是一个齐次整体学习法。在这篇文章中,我们打算用强化学习的想法增加随机森林的效率和适应能力添加到环境问题的数据挖掘算法。下面将描述该方法的细节。

方法提出了基于强化学习的想法,它采用学习自动机来实现这个想法。学习自动机是该方法的核心,并通过接收反馈从环境中对于每一个动作,它更新的概率选择行动。在该方法中,每个基地学习者,决策树,都视为学习自动机动作。

在拟议的方法,训练数据首先被随机分为N部分。在这个部门,N对应于树的数量我们想要在森林里。与随机森林,树木之间的预测模型是通过平均或投票,该方法,创建了预测模型使用学习自动机,形成的核心算法。该方法的框图如图2

该方法的预处理步骤是一个通用的步骤,并基于何种类型的数据处理面积处理,这个阶段确定的细节。在拟议的方法中,首先,类似于随机森林方法,训练数据随机分为基础学习者的数量和注入基础的学习者。这一步的区别和相似的步骤随机森林的所有特性的特征向量给出所有基础的学习者,和删除功能替代选项。

第一次运行后,预测模型创建基础学习者和放置在一个池中,实际上是一个交互式的环境,有学习自动机。从学习者获得的结果为每个新样本的形式给出学习自动机的强化信号,我们知道作为主要的环境的反馈。取决于收到强化信号奖励或惩罚,选择的机会每一个基础的学习者,——他们的行动学习自动机——更新。应该注意的是,最初的概率选择这些行动被认为是相等的。如果我们有R基础学习者形成整体,他们每个人的初始选择的概率等于

很明显,所有行动的概率之和等于1。

初始概率选择的行为被认为是平等的,因为他们都是均匀的分离能力。

在拟议的方法,集成的基础学习者是由洛杉矶。因此,对于每个输入的测试集,定义了线性拉,每个LA对应选择的行动基础的学习者。跑步基础学习者和接收反馈的过程从环境中持续进行直到选择行为的概率收敛于一个基础的学习者,或重复学习自动机的数量超过预先确定的极限。一旦选择的概率收敛,然后基地学习的结果,选择的概率最高,坚定的合奏特定输入的结果。在这种情况下,担保的找到全局最优算法,因为所有的功能特征向量检查,罕见的模式也覆盖,和适应环境的能力问题空间和独立的域是稳定的。方法,随机选择的子集原因之间的相互依存关系树。所有的决策树的深度方法被认为是相等的。每个决策树在叶级别将训练数据不同。显示了该方法算法的伪代码2

输入D={(x1y1),(x2y2),…(xNyN),}与x表示训练数据x = (我,1,x我2x、…我,p)
(1) 输出分类测试数据
(2) 假设
(3) :学习自动机
(4) DTr= {DT1DT2,DT…R}表示基础的学习者
(5) α/ /选择DT: LA行动r
(6) 一个:奖励参数
(7) b:惩罚参数
(8) :所有的学习者训练基地
(9) 算法
(10) r = 1 r
(11) 创建一个数据集Dt通过抽样(N / R)项目,随机的替代D
(12) 火车DTr使用Dt,增加了
(13) 结束/ /
(14) 每一个测试样本
(15) {
(16) =新/ /创建一个从LA LA对象类
(17) ((收敛到一个操作)或(超过了预定义的迭代数量))
(18) {
(19) 选择一个随机的操作和执行,由,让它去α
(20) 如果(α预计新测试样本正确)然后/ /更新选择的概率向量
(21) / /选中的奖励α
(22) 其他的
(23) / /惩罚所选α
(24) }/ /而结束
(25) }/ /结束
(26) 返回DTr
(27) 分类测试数据的预测DTr
(28) 结束。/ /算法

在学习自动机块图2,有两个函数称为奖励函数和罚函数。激活这两个函数之一是基于强化信号来自环境的类型。接收到的信号从环境决定的结果基础学习者活动或前一步骤中选择的行动是否有用。如果结果是有用的,行动必须得到回报,或者换句话说,增加其选择的概率。选择行动的概率的增加是由参数决定的“a”、“b”称为奖励参数和惩罚参数,分别。

符合(16),也就是说,所有操作的概率之和等于1,所有其他行为的概率减少根据参数”的大小。“如果选择行动的结果不是有用的,这一行动也必须受到处罚。换句话说,行动必须的概率降低。为此,选择行动的概率降低的大小参数“b”和作为一个奖励模式,和观察(16),选择其他操作的概率增加的大小参数”b。”

在拟议的方法,学习自动机模型环境被认为是P-Model,那里的环境定义0和1值作为输出。零意味着奖励,意味着惩罚。如果正确的答案是来自所选基础学习者的洛杉矶,选择的行动会得到回报;否则,它将被处罚。

5。评价

为了全面评价该方法的效率,在本节中,评价该方法的细节提出了分开使用的数据和实验结果。

5.1。数据集

为了评估该方法和创造一个环境的动态行为数据,不同领域的应用程序已经被选中了。如前面几节中所述,动态行为指的是不同的结果,实例展示在不同的环境条件。不同结果的环境是由一个特定的领域。文本数据是最知名的数据类型之一,表现出这样的动态行为。换句话说,这些类型的数据的一个最佳选项创建一个动态环境中,证明了该方法的适应性。选定的数据评估阶段的细节如表所示2


的名字 #特性 #实例

文本 Stanford-Sentiment 140语料库[106年] 袋的话 1600000
大数据集的电影评论(107年] 袋的话 50000年
句子极性数据集v1.0 (108年] 袋的话 10662年
互联网电影数据库(105年] 袋的话 1400年
Yelp审查(105年] 袋的话 598000年
亚马逊评论(105年] 袋的话 1000000
医疗保健 心脏病数据集(105年] 13 200年
乳腺癌数据集(105年] 30. 569年
心律失常的数据集(105年] 279年 454年
帕金森数据集(105年] 45 241年
剖腹产数据集(105年] 5 81年
基因表达数据集(105年] 255年 801年
糖尿病数据集(105年] 7 765年
Statlog(心)数据集105年] 13 271年
物理 电离层数据集(105年] 34 352年
声纳、矿山与岩石数据集(105年] 60 208年
声音 声音数据集(105年] 20. 3168年
情绪从音乐数据集(105年] 28 592年

5.2。实验结果

为了评估该方法,18个数据集在不同领域介绍了在前面的小节中已经被使用。在文献中学习自动机,不同的模式被认为是优化学习自动机;在这篇文章中,三种模式被用来评估该方法。唇模式不被认为是由于贫穷的结果。每个LRI的评价结果,LRɛP,单体模式显示在单独的数据。为了确定最优值的奖励和惩罚参数,六个文本数据集已经被选中了。这种选择的原因是高多样性在文本数据的行为以及大量的样品和这六个数据集的大量的特征。LRI模式,惩罚参数的值被认为是零,在这种模式下和该方法的结果如图所示3

基于文献学习自动机LRɛP模式,惩罚参数的值被认为是比奖励参数的值小得多。该方法的结果LRɛP模式如图所示4

正如学习自动机节中提到的,在单体模式,惩罚和奖励参数的值被认为是相等的。该方法的结果在这种模式下也显示在图5

比较的结果的实现方法在三个可调模式学习自动机显示含上设置模式导致了识别的精度最高。还有LRɛP和LRI模式。LRɛP模式的设置一个= 0.01,b= 0.01不考虑,因为这些值等于第一个值中设置单体模式,和为了防止重复的结果在不同的表,这些设置了LRɛP模式。出于这个原因,许多实验上执行LRɛP模式评估是一个小于其他两个。考虑到奖励和惩罚参数的设置在单体模式的值一个= 0.5,b= 0.5导致最高效率,评价已经完成其他数据集与这些设置。该方法的比较和主题文献中类似的方法如表所示3


数据集 平均 多数投票 随机森林 我们的方法

文本 Sentiment140数据集 74.54 75.50 74.30 76.30
大型数据集的电影评论 86.28 86.86 86.42 86.62
句子极性数据集 73.75 74.63 73.38 77.03
电影评论数据集 81.58 81.58 81.67 85.92
Yelp评论极性 89.47 90.32 89.74 90.76
亚马逊评论极性 80.86 81.66 80.97 82.58
医疗保健 心脏病的数据集 58.00 57.50 57.50 65.00
乳腺癌数据集 97.41 97.36 96.49 98.24
心律失常的数据集 80.71 85.71 81.31 85.71
帕金森的数据集 63.95 64.58 64.58 68.75
剖腹产的数据集 60.31 62.50 43.75 68.75
基因表达数据集 95.59 95.62 96.27 98.75
糖尿病数据集 75.77 75.32 74.67 76.62
Statlog(心)数据集 81.20 81.48 79.62 85.18
物理 电离层数据集 91.05 91.54 92.95 95.77
声纳、矿山与岩石数据集 85.23 85.71 73.80 88.09
声音 声音数据集 76.38 76.18 76.49 88.95
情绪从音乐数据集 78.23 78.15 82.35 84.03

我们可以看到在桌子上3的观点的准确性,该方法提供了更好的性能比主题文献的方法,这表明改善学习者的聚合模型基础。这个改善是由于使用强化学习的思想聚合的基本分类器的方法,称为基础的学习者。利用强化学习的思想创造了合奏的能力有所提高,而且提高了解决问题的能力,数据展示动态行为。实验的结果上执行不同的数据证实了功能添加到随机森林的方法。如前所述,矿业领域的意见,文本数据的类型是最明显的表现出这种动态行为的数据。因此,奖励和惩罚参数最优值已经确定在这些类型的数据,和这些设置用于其他类型的数据。

除了精度标准,其他统计标准检查来评估该方法。我们可以看到在桌子上4,该方法显示在正面和负面类更好的结果比文献中可用的方法。在统计标准,精密(P)决定从分类器的精确结果,和回忆R)确定分类器结果的完整性。提到的测试的结果统计标准表明,该方法具有很高的性能。


积极的课堂 负类 积极的课堂 负类
方法 P (%) R (%) F1 (%) P (%) R (%) F1 (%) 方法 P (%) R (%) F1 (%) P (%) R (%) F1 (%)

Sentiment140数据集 帕金森的数据集
MV 72.44 70.35 71.38 70.90 72.96 71.92 MV 69.23 66.67 67.92 59.09 61.9 60.47
射频 72.44 74.58 73.49 76.46 74.43 75.43 射频 69.23 66.67 67.92 59.09 61.9 60.47
OM 75.20 80.36 77.69 81.17 76.16 78.59 OM 76.92 68.97 72.73 59.09 68.42 63.41
大型数据集的电影评论 剖腹产的数据集
MV 87.50 87.33 87.41 87.41 87.59 87.50 MV 55.56 71.43 62.5 71.43 55.56 62.5
射频 85.83 76.16 80.70 73.37 83.93 78.29 射频 33.33 50 40 57.14 40 47.06
OM 87.80 87.97 87.88 88.10 87.93 88.01 OM 66.67 75年 70.59 71.43 62.5 66.67
句子极性数据集 基因表达数据集
MV 75.63 72.83 74.20 72.80 75.61 74.18 MV 92.31 94.12 93.2 97.25 96.36 96.8
射频 74.62 67.78 71.08 65.95 72.94 69.27 射频 94.23 93.23 94.23 97.25 97.25 97.25
OM 76.04 73.29 74.64 73.29 76.04 76.64 OM 98.08 98.08 98.08 99.08 99.08 99.08
电影评论数据集 糖尿病数据集
MV 83.10 82.52 82.81 81.84 82.09 81.78 MV 90.29 76.86 83.04 45.1 69.7 54.76
射频 77.46 71.43 74.32 76.41 73.98 70.54 射频 90.29 76.23 82.67 43.14 68.75 53.01
OM 84.51 83.33 83.92 82.22 83.46 82.84 OM 91.26 77.69 83.93 47.07 72.73 57.14
Yelp评论极性 声音数据集
MV 90.85 88.04 88.42 87.11 90.11 88.59 MV 64.58 76.09 69.86 84.85 76.24 80.31
射频 80.64 85.94 83.21 86.22 81.00 83.53 射频 64.58 76.75 70.14 85.4 76.35 80.62
OM 90.00 89.43 89.71 88.89 89.49 89.19 OM 87.82 86.55 87.18 89.81 90.81 90.3
亚马逊评论极性 情绪从音乐数据集
MV 82.68 79.45 81.03 79.38 82.62 80.97 MV 83.58 78.87 81.16 71.15 77.08 74年
射频 79.12 74.56 76.77 73.98 87.61 76.22 射频 88.06 81.94 84.89 75年 82.98 78.79
OM 83.70 79.52 81.56 79.21 83.45 81.28 OM 92.54 81.58 86.71 73.08 88.37 80年
心脏病的数据集 声纳、矿山与岩石数据集
MV 61.90 59.09 60.47 52.63 55.56 54.05 MV 87.5 87.5 87.5 83.33 83.33 83.33
射频 61.90 59.09 60.47 52.63 55.56 54.05 射频 79.17 76年 77.55 66.67 70.59 68.57
OM 61.90 68.42 65.00 68.42 61.90 65.00 OM 87.5 87.5 87.5 83.33 83.33 83.33
乳腺癌数据集 Statlog(心)数据集
MV 95.74 97.83 96.77 98.51 97.06 97.78 MV 79.19 79.19 79.19 83.33 83.33 83.33
射频 97.87 93.88 95.83 95.52 98.46 96.97 射频 75年 78.26 76.6 83.33 80.65 81.67
OM 97.87 97.87 97.87 98.51 98.51 98.51 OM 79.19 86.36 82.61 90年 84.38 87.1
心律失常的数据集 电离层数据集
MV 88.37 82.61 85.39 83.33 88.89 86.02 MV 82.14 95.83 88.46 97.67 89.36 93.33
射频 83.72 78.26 80.9 79.17 79.74 73.85 射频 85.71 96年 90.57 97.67 91.3 94.38
OM 93.02 80年 86.02 79.19 92.68 85.39 OM 89.29 One hundred. 94.34 One hundred. 93.48 96.63

P,R,F1参考精度、召回和F1-score。MV:多数投票,射频:随机森林,和OM:我们的方法。

6。讨论

在本节中,该方法的更多细节解释的原因以及需要解决这些细节。这些包括预处理步骤的细节,优化学习自动机参数,以及排名根据他们的表现这些参数的设置。

6.1。预处理

在方法部分解释,预处理步骤是一个通用的步骤。为了评估,检查不同来自不同领域的数据。文本数据的预处理,以及相关的细节,描述如下。应该注意的是,其他类型的数据预处理,如特征提取、特征选择,规范化,去除噪声、和其他相关预处理,没有执行,因为他们所有的人都作为清洁UCI数据存储库(109年]。和准确性的基础是基于以前的研究工作已经使用这些数据。

为了准备文本数据的主要过程,认为矿业领域选择和相关预处理如下。的细节意见文本数据挖掘的预处理步骤如图所示6富有表现力的延长。延长或词延伸是指词的细长的表达特定的情感强烈,和单词拼写错误纠正,取而代之的是原来的。表情符号处理。它指的是表情符号替换的文本中提到他们的意义,这使得它更容易分析表情符号。HTML标记删除。HTML标记的文本被删除,因为他们没有任何情感价值。语言处理。语言用于编写一个给定的单词,总之音节,描述相同的意义,但保存的时间打字。在语言处理、语言的文本替换为原来的单词。标点符号处理。标点符号在文本用于单独的句子和它们的元素,并阐明它们的含义。在标点符号处理,一旦处理撇号,所有剩余的标点符号和数字都删除。Stopwords去除。Stopwords意义不多,没有文本中的重要性。Stopwords被简化的文本。阻止。它指找出根或茎的一个字。消除各种后缀来减少单词的目的是阻止。词元化。它返回基或字典的一个词,它被称为引理。它非常类似于阻止,但它更接近于同义词替换。弓的创造。词创作的包是最新的预处理进行文本的准备。

6.2。奖励和惩罚的调优参数

文学主题的学习自动机,定义了三种不同的模式来优化参数的奖励和惩罚。在该方法中,强化学习的想法是使用学习自动机,实现这三个可调参数的方式奖励和惩罚是检查。这三种模式的结果在实验结果部分。摘要弗里德曼测试统计验证用于确定哪些模式和设置是最好的奖励和惩罚参数可调。设置参数值”一个”和“b“如表所示5。确定这些参数的数值是基于主题学习自动机的文学。当然,各种各样的值可以考虑这两个参数。本文尝试调整参数以这样一种方式,所有的模式被认为是,这样他们可以用来证明了该方法的效率相比以前的方法。


模式 参数

LRI 一个 0 0.1 0.1 0.3 0.5 0.7
b 0 0 0 0 0 0
LRεP 一个 0.1 0.1 0.3 0.5 0.7
b 0 0 0 0 0
含碘 一个 0 0.1 0.1 0.3 0.5 0.7
b 0 0.1 0.1 0.3 0.5 0.7

6.3。排名

弗里德曼测试统计验证(110年)是一个排名的方法,不同的等级分配给每个输入样本,确定每个选项的最优水平。本文这种验证方法被用来确定奖励和惩罚参数的最优值和比较该方法与传统方法的主题文学整体学习。结果如表所示6


方法 调优 意思是排名 最终排名

含碘 一个= 0.5,b= 0.5 19.17 1
含碘 一个= 0.3,b= 0.3 16.83 2
含碘 一个= 0.7,b= 0.7 15.58 3
MV 多数投票 14.67 4
含碘 一个= 0.1,b= 0.1 13.92 5
LReP 一个= 0.05,b= 0.01 12.17 6
LReP 一个= 0.1,b= 0.01 11.83 7
LReP 一个= 0.5,b= 0.01 10.08 8
含碘 一个= 0.05,b= 0.05 9.58 9
射频 随机森林 9.17 10
含碘 一个= 0.01,b= 0.01 8.75 11
LIR 一个= 0.01,b= 0 8.42 12
LIR 一个= 0.05,b= 0 7.67 13
LIR 一个= 0.1,b= 0 7.67 13
LIR 一个= 0.3,b= 0 7.67 13
LIR 一个= 0.5,b= 0 7.67 13
LIR 一个= 0.7,b= 0 7.67 13
AV 平均 7.58 14
LReP 一个= 0.3,b= 0.01 7.17 15
LReP 一个= 0.7,b= 0.01 6.75 16

我们可以看到在桌子上6之间有显著差异,排名的方法和传统方法的排名,这表明该方法效率的改善与其他方法相比。三种模式中考虑优化奖励和惩罚参数,可以看出LRI排名上升,LReP,分别和单体模式。在单体模式,奖励和惩罚参数的值被认为是相同的,最高的效率也观察到。之间有显著差异的平均排名最好的奖励和惩罚参数的设置方法和这个等级随机森林方法。队伍的区别是证明该方法优化与传统方法聚合分类器实现一个强大的分类方法。

6.4。检查收敛速度

更准确地解决该方法在效率方面,LA融合已被调查。图7显示了不同数量的LA行为的收敛奖励和惩罚变量。在大多数的不同设置这两个参数,收敛速度高,收敛到一个行为通常发生在达到一定数量的迭代。如表所示5,收敛速度较低发生在其他的一些设置,在弗里德曼的测试中得分较低。

6.5。噪声电阻

为了更准确地评估该方法并确定该方法的抗噪音,另一个评价是在前一节中给出的数据上执行。这个评估是由将20%噪声注入干净的数据。评价数据的结果表明,该方法,由于学习自动机的使用,具有较高的适应性问题的条件下,噪声的存在,与传统文学中的方法,该方法不受急剧下降,在这种情况下,它显示了比传统方法效率高。评价该方法在噪声图所示8

7所示。结论和未来的工作

基础学习者聚合在整体学习应该以这样一种方式,以下几点。第一点:选择一个基础的学习者会导致最高的性能可实现的现状。第二点:如果情况变化的动力学问题,整体的结构将会改变以这样一种方式,它最大的兼容性与新环境的条件。因此,为了满足上面的点,实现一个能够适应动态环境的问题,在这篇文章中,新方法提出了基于强化学习的想法整合基础学习者在随机森林。在拟议的方法,学习自动机用于接收反馈的环境和执行操作。一般程序是接收反馈的环境,环境是一组基础的学习者,我们打算将比独立基础学习者实现更好的性能。学习自动机的行为包括选择一个基础学习者学习者的最佳基地。行动的选择是根据收到的反馈环境。这将导致数据的动态行为由使用强化学习的想法。另一方面,考虑到在每个阶段,学习自动机努力实现最高的可实现的回报,这是保证找到全球最佳状态空间的问题。 Adaptability is another advantage of the proposed method compared to similar methods in the subject literature.

因为在每一步学习自动机运行根据环境条件和接收反馈从环境中适应能力问题是满足。评估的结果执行不同的数据表明,该方法能够实现以上所有所需的项目。尽管事实上,与随机森林机制,所有功能都注入基础学习者在拟议的方法,该方法的效率在处理大容量数据并没有减少,结果比传统方法更有利。该方法是独立的数据类型和有能力处理任何其他类型的数据在任何领域。为了证实这一说法,为了评估方法,选择不同类型的数据。然而,没有任何限制的方法处理不同类型的数据。在本文中,一种新的聚合方法的基本学习者使用学习自动机,提出了随机森林。确定参数的最优值的奖励和处罚的形式自调优是一个未来的作品,作者打算做。

数据可用性

作者公开宣布所有可用的数据在UCI库。

的利益冲突

作者宣称没有利益冲突有关的出版。

引用

  1. c .张和y .马整体机器学习:方法和应用施普林格,纽约,纽约,美国,2012年。
  2. 答:加利西亚,r . Talavera-Llames a . Troncoso Koprinska, f . Martinez-Alvarez,“大数据时间序列的多步预测基于整体学习,”以知识为基础的系统卷,163年,第841 - 830页,2019年。视图:出版商的网站|谷歌学术搜索
  3. m . Savargiv b Masoumi, m . r . Keyvanpour”一个新的基于学习自动机,集成学习方法”环境智能和人性化计算杂志》上,硕士论文,2020页。视图:谷歌学术搜索
  4. m·康、j·安和k·李,“意见挖掘使用合奏文本隐马尔可夫模型的文本分类,“专家系统与应用程序卷,94年,第227 - 218页,2018年。视图:出版商的网站|谷歌学术搜索
  5. d . y . Zhang苗,j . Wang和z,“厂商三方组合对集成学习技术在情绪分类,“国际期刊的近似推理卷,105年,第97 - 85页,2019年。视图:出版商的网站|谷歌学术搜索
  6. 郭宏源。李,a Ullah r·王,“引导聚合和随机森林施普林格,纽约,纽约,美国,2020年。
  7. j .马克尔和a·j·贝里斯”,随机森林的机器学习算法的性能在二进制超新星分类,”2019年,http://arxiv.org/abs/1907.00088视图:谷歌学术搜索
  8. 陈,李z . et al .,“森林对光子计数激光雷达信号检测使用随机森林,”遥感信,11卷,不。1,37-46,2020页。视图:出版商的网站|谷歌学术搜索
  9. w·庞x, z . Wang y风扇,和j·王,“通过随机森林预测特定RNA分子杂交,”学报2019年IEEE第七届国际会议上生物信息学和计算生物学(ICBCB),页35-38,杭州,中国,2019。视图:谷歌学术搜索
  10. m·f·Darmawan a . f .。Abidin s Kasim t . Sutikno和r . Budiarto“随机森林的年龄估计模型基于左手骨的长度对亚洲人口,”国际电气和计算机工程杂志》(IJECE),10卷,不。1,p。549年,2020。视图:出版商的网站|谷歌学术搜索
  11. 美国公园,j .月亮,荣格,ρ,s . w . Baik和e .黄”两级工业负荷预测方案日前联合冷却、加热和电力调度,“能量,13卷,不。2,p。443年,2020年。视图:出版商的网站|谷歌学术搜索
  12. j·戴·t·王,王,“森林深处方法分类电子商务产品通过使用标题信息,”《2020年国际会议上计算、网络和通信(ICNC)大岛,页1 - 5,嗨,美国,2020年。视图:谷歌学术搜索
  13. m . Papouškova和p . Hajek造型使用随机森林,鉴于对等贷款违约损失”智能决策技术学报》2019施普林格,页133 - 141年,马耳他,欧洲,2020年。视图:谷歌学术搜索
  14. d·博b·j·克里斯滕森n . Muhlbach和m . s .尼尔森针对预测的影响在一个随机森林回归模型,2020年。
  15. s . Sikdar诉Kadiyali g·胡克,亚马逊市场价格动态:多元随机森林变量选择方法,2019年。
  16. l . Giffon c .定位l . Bouscarrat p . Milanesi f . Cherfaoui和s . Koco修剪随机森林与正交匹配树,2020年。
  17. b . j ., j·l·实在狼,d .钟c . j . Karvellas d·g·科赫和v . l . Durkalski”BiMM森林:一个随机森林方法建模集群和纵向二进制结果,“化学计量学和智能实验室系统卷,185年,第134 - 122页,2019年。视图:出版商的网站|谷歌学术搜索
  18. n . Mohapatra k Shreya, a . Chinmay“随机森林算法的优化,”数据科学的进步和管理施普林格,页201 - 208年,纽约,纽约,美国,2020年。视图:谷歌学术搜索
  19. 问:霁,t·朱和d·鲍”卷积神经网络的混合模型和回归森林深处人群计数,“应用智能,2020年1 - 15页。视图:谷歌学术搜索
  20. b . Santra a .保罗,和d·p·穆克吉“确定性辍学深层神经网络使用复合随机森林,”模式识别的字母卷,131年,第212 - 205页,2020年。视图:出版商的网站|谷歌学术搜索
  21. m·a·Ganaie m . Tanveer, p . n . Suganthan“斜通过双界SVM决策树合奏,”专家系统与应用程序文章ID 113072卷,143年,2020年。视图:出版商的网站|谷歌学术搜索
  22. r . Katuwal p . n . Suganthan和l .张“异构斜随机森林,”模式识别文章ID 107078卷,99年,2020年。视图:出版商的网站|谷歌学术搜索
  23. Probst p、m·n·赖特和A.-L。Boulesteix”Hyperparameters和调优策略随机森林,”威利跨学科评论:数据挖掘和知识,9卷,不。第三条ID e1301, 2019。视图:出版商的网站|谷歌学术搜索
  24. m . s . Kim Jeong, b . c . Ko,“解释和简化的森林深处,”2020年,http://arxiv.org/abs/2001.04721视图:谷歌学术搜索
  25. 诉Jain, j·沙玛,k . Singhal和a . Phophalia“指数加权随机森林,”模式识别与机器智能,施普林格可汗,瑞士,11941卷,第178 - 170页,2019年。视图:谷歌学术搜索
  26. m . Stafoggia Glantz p . et al .,”一个随机森林方法估计每日颗粒物,二氧化氮,在精细的空间分辨率和臭氧在瑞典,”大气,11卷,不。3,p。239年,2020年。视图:出版商的网站|谷歌学术搜索
  27. ,Hauglin和p .蒙特沙诺”造型在挪威使用国家森林地上生物量股票库存数据与ArcticDEM Sentinel-2数据,”环境遥感,第236卷,第111501页,2020年。视图:出版商的网站|谷歌学术搜索
  28. h . r . Breidenbach和m . m . Saravi”,使用随机森林的地面沉降空间建模数据挖掘技术,”GIS中的空间建模和R为地球和环境科学爱思唯尔,荷兰阿姆斯特丹,2019年。视图:谷歌学术搜索
  29. j . Cai k .徐朱y, f . Hu和l·李”的预测和分析净生态系统碳交换基于梯度提高回归和随机森林,”应用能源文章ID 114566卷,262年,2020年。视图:出版商的网站|谷歌学术搜索
  30. l .温家宝和x元”,预测中国的商业部门的二氧化碳排放,通过基于随机森林和BP神经网络算法,”科学的环境文章ID 137194卷,718年,2020年。视图:出版商的网站|谷歌学术搜索
  31. Y.-S。李,h .气X.-Y。邵,>。气,B.-G。许”,小说随机森林方法在犯罪连锁不平衡的问题,“以知识为基础的系统,2020年。视图:谷歌学术搜索
  32. s . k . Mohapatra m·n·莫汉蒂,“大数据分析和生物医学信号使用随机森林算法,分类”决策科学与管理的新范式施普林格,纽约,纽约,美国,2020年。视图:谷歌学术搜索
  33. a . Joshi t . Choudhury a .赛Sabitha和k Srujan拉,“在医疗数据挖掘和预测肥胖,”诉讼第三国际会议上计算情报和信息,页877 - 888,海得拉巴,印度,2020。视图:出版商的网站|谷歌学术搜索
  34. s . El-Sappagh r·萨哈et al .,”阿尔茨海默病进展基于早期检测模型具有成本效益的多通道数据的融合,“未来一代计算机系统卷,115年,第699 - 680页,2021年。视图:出版商的网站|谷歌学术搜索
  35. y萨利赫,A . Halidou和p . t . Kapen”回顾数学建模、人工智能和数据集用于研究、预测和管理COVID-19,”应用智能,50卷,不。11日,第3925 - 3913页,2020年。视图:出版商的网站|谷歌学术搜索
  36. s . Khedkar p·甘地,g . Shinde诉萨勃拉曼尼亚,深入学习并使用EHR可辩解的AI在医疗保健美国纽约,施普林格,新的Y兽人,2020。
  37. t·汉n . Stone-Weiss j .黄a·高尔和a . Kumar“机器学习作为一种工具来设计眼镜与控制医疗保健应用程序解散,“《生物材料卷,107年,第298 - 286页,2020年。视图:谷歌学术搜索
  38. a . Subudhi m .破折号,s . Sabut”自动分割和分类使用采用脑卒中和随机森林分类器”生物控制论和生物医学工程,40卷,不。1,第289 - 277页,2020。视图:出版商的网站|谷歌学术搜索
  39. a . Javadi a Khamesipour、f . Monajemi和m . Ghazisaeedi”计算建模和分析预测细胞内寄生虫抗原决定基使用随机森林技术特点,“公共卫生杂志卷,49号1,p。125年,2020。视图:谷歌学术搜索
  40. t . Shaikhina d·劳s数据d·布里格斯r·希金斯和n . Khovanova“决策树和随机森林模型预测结果抗体不兼容的肾移植,”生物医学信号处理和控制52卷,第462 - 456页,2019年。视图:出版商的网站|谷歌学术搜索
  41. k·k·辛格,s·库马尔,p .武断的话,和m . k .亚太区“基于卡尔曼滤波器的短期预测模型COVID-19蔓延,“应用智能,1-13,2020页。视图:谷歌学术搜索
  42. S.-J。Na, J.-W。Shin工程学系。加工和E.-H。李”,研究随机变化与森林有关的估算模型的自动行走模式高于膝盖假肢,”《IKEEE,24卷,不。1,9到18,2020页。视图:谷歌学术搜索
  43. m . Alloghani t·贝克,d . Al-Jumeily a·侯赛因j . Mustafina和a·j·Aljaaf”前景的机器和深度学习在分析生命体征的改善医疗服务,“自然计算在数据挖掘和机器学习施普林格,纽约,纽约,美国,2020年。视图:谷歌学术搜索
  44. 朱y, w . Xu g .罗h . Wang j .杨和w·鲁,“随机森林增强使用改进的人工鱼群内侧膝盖接触力预测,“人工智能在医学上,第103卷,第101811页,2020年。视图:出版商的网站|谷歌学术搜索
  45. h . Zhang et al .,“深多模型基于CNN的级联方法和随机森林制药粒子检测”IEEE仪表和测量,卷69,不。9日,第7042 - 7028页,2020年。视图:谷歌学术搜索
  46. h·李和e·荣格“年度变化的分析与随机森林老师附件的决定因素施普林格,纽约,纽约,美国,2020年。
  47. x刘,刘l . et al .,“降尺度的solar-induced叶绿素荧光从树冠层使用随机森林模型,光系统水平”环境遥感文章ID 110772卷,231年,2019年。视图:出版商的网站|谷歌学术搜索
  48. Guanter和j . Santosh Kumar“绩效评估随机森林的特征选择方法在预测糖尿病,”国际电气和计算机工程杂志》上,10卷,2020年。视图:谷歌学术搜索
  49. a . Subasi a·艾哈迈德·e·Aličković,a . Rashik哈桑“光刺激对偏头痛的效果检测使用随机森林和离散小波变换,“生物医学信号处理和控制49卷,第239 - 231页,2019年。视图:出版商的网站|谷歌学术搜索
  50. n . El Haouij人类。Poggi r . Ghozi s . Sevestre-Ghalila, m . Jaidane“随机生理功能与森林有关的方法变量选择司机的压力水平分类,“统计方法与应用,28卷,不。1,第185 - 157页,2019。视图:出版商的网站|谷歌学术搜索
  51. d . Ayata y Yaslan, m . e . Kamasak”情感识别多通道生理信号的情感意识到卫生保健系统,”医学和生物工程杂志》上40卷,第157 - 149页,2020年。视图:谷歌学术搜索
  52. m . Zeraatpisheh e . Bakhshandeh m . Hosseini, s m . Alavi”评估森林砍伐和集约农业对土壤质量的影响通过数字土壤制图,”Geoderma文章ID 114139卷,363年,2020年。视图:出版商的网站|谷歌学术搜索
  53. l .傅x Du, p . Wang h·刘,z,和c姚明,“梨毒死蜱的拉曼光谱测定用随机森林回归分析,“分析信,53卷,不。6,821 - 833年,2020页。视图:出版商的网站|谷歌学术搜索
  54. r . j . Wang左,y,“映射通过semi-supervised矿产前瞻性随机森林,”自然资源研究卷,29号1,第202 - 189页,2020。视图:出版商的网站|谷歌学术搜索
  55. 刘,x钱,h .广域网,z, s .吴x任,“人大三级逆变器开路故障诊断基于自适应电时期分区和随机森林,”传感器和执行器网络杂志》上卷,2020篇文章ID 9206579, 18页,2020年。视图:出版商的网站|谷歌学术搜索
  56. 拉索尔教授和美国Kumar”实证研究的整体技术软件故障预测,“应用智能,行,2020页。视图:谷歌学术搜索
  57. t·艾哈迈德·h·陈,“非线性自回归预测电力负荷和随机森林方法对于电力能源管理系统,“可持续城市和社会,45卷,第473 - 460页,2019年。视图:出版商的网站|谷歌学术搜索
  58. 古普塔,j . Sarkar m .茶室,n . r . Bandyopadhyay和s . Ganguly”自动识别扫描电镜微观结构和阶段的钢铁森林经营者使用枸杞多糖和随机决定,”测量文章ID 107224卷,151年,2020年。视图:出版商的网站|谷歌学术搜索
  59. l·t·t·Ho l .德布斯·m·德·菲利斯和a . Troccoli”重建欧洲的数十年country-aggregated水力发电基于随机森林模型,”能量,13卷,不。7,1786年,页2020。视图:出版商的网站|谷歌学术搜索
  60. y周,李,周,h·罗,“基于随机森林的智能方法在地铁车站深基坑的安全风险预测,“计算机在土木工程杂志》上,33卷,不。1,文章ID 05018004, 2019。视图:出版商的网站|谷歌学术搜索
  61. 邓x, y詹et al .,“预测地理认证的绿茶保护原产地名称使用随机森林模型,”食品控制文章ID 106807卷,107年,2020年。视图:出版商的网站|谷歌学术搜索
  62. p . s . a . Liu Ngare, d . Ikpe”的概率预测作物产量通过分位数随机森林和Epanechnikov内核函数,“农业和森林气象学文章ID 107808卷,280年,2020年。视图:出版商的网站|谷歌学术搜索
  63. h·j·宋和m·h·金”,利用邻接的同事和类型的相关性增强链接预测,“数据与知识工程文章ID 101785卷,125年,2020年。视图:出版商的网站|谷歌学术搜索
  64. z Khorshidpour、美国Hashemi和a . Hamzeh”评价随机森林分类器的安全域,“应用智能卷,47号2、558 - 569年,2017页。视图:出版商的网站|谷歌学术搜索
  65. f . j .田l . Liu, y Ai, r . Wang和c·范,“多域entropy-random森林的融合诊断方法具有中介轴承故障声发射信号,”,22卷,不。1,57页,2020年。视图:谷歌学术搜索
  66. b . Shaw, a . k . Suman和b . Chakraborty使用机器学习葡萄酒质量分析施普林格,纽约,纽约,美国,2020年。
  67. k·Madhumathi和t .苏雷什在无线传感器网络中,节点定位使用多输出随机森林回归施普林格,纽约,纽约,美国,2020年。
  68. y, y,黄c . l . Liu和l .张“对恶意的SSL / TLS加密:识别恶意流量基于随机森林”第四届国际大会程序信息和通信技术,页99 - 115,伦敦,英国,2020年。视图:谷歌学术搜索
  69. t·t·Bhavani m . k . Rao, a . m . Reddy”网络入侵检测系统使用随机决策树森林和机器学习技术,”第一届国际会议论文集可持续技术计算智能,页637 - 643,伦敦,英国,2020年。视图:谷歌学术搜索
  70. p . s . Chaithanya m·r·g·拉曼s Nivethitha k . s .珊和v . s .斯,”一个高效的入侵检测方法使用增强的随机森林和moth-flame优化技术,”计算智能模式识别施普林格,纽约,纽约,美国,2020年。视图:谷歌学术搜索
  71. z明镜》小说策略通过激光诱导击穿光谱定量分析土壤pH值加上随机森林,”等离子体科学技术,22卷,不。7,74003年,页2020。视图:谷歌学术搜索
  72. M.-H。李,“强大的基于随机森林的non-fullerene有机太阳能电池效率的预测,”有机电子文章ID 105465卷,76年,2020年。视图:出版商的网站|谷歌学术搜索
  73. j . Zhang g . Ma y黄,j .太阳和f . Aslani”造型轻自密实混凝土的单轴抗压强度使用随机森林回归,”建筑和建筑材料卷,210年,第719 - 713页,2019年。视图:出版商的网站|谷歌学术搜索
  74. h . w . nene c . Wu钟,y,和l .王”的预测使用极端的不排水抗剪强度梯度增加和随机森林基于贝叶斯优化”地球科学前沿,12卷,不。1,第477 - 469页,2020。视图:谷歌学术搜索
  75. 张平,Z.-Y。阴,Y.-F。金,t·h·t·陈,“一种新型混合代理智能模型蠕变指数预测基于粒子群优化和随机森林,”工程地质,第265卷,第105328页,2020年。视图:出版商的网站|谷歌学术搜索
  76. k .沙h·帕特尔,d . Sanghvi和m .沙”逻辑回归的比较分析,随机森林和资讯为文本分类模型,”增强人体研究,5卷,不。1,硕士论文,2020页。视图:出版商的网站|谷歌学术搜索
  77. s . Hakak m . Alazab汗,t·r·Gadekallu p . k . r . Maddikunta z和w·汗”一个机器学习方法通过有效的特征提取分类假新闻,“未来一代计算机系统卷。117年,47-58,2021页。视图:出版商的网站|谷歌学术搜索
  78. 辛格s . n和t . Sarraf情绪分析产品使用随机森林算法基于用户评论,”数据科学与工程32卷,第116 - 112页,2020年。视图:谷歌学术搜索
  79. h .张:程,y,和z,”标签烙上攻击朴素贝叶斯垃圾邮件过滤系统,”应用智能,2021年。视图:谷歌学术搜索
  80. r·p·考尔·m·库马尔,m k金达尔,”报纸文字识别Gurumukhi脚本使用随机森林分类器”多媒体工具和应用程序日志,2019年,页1 - 14。视图:谷歌学术搜索
  81. Madichetty和m . Sridevi”,一个新颖的方法来识别损伤评估微博在灾难期间,“将来时。总的来说。第一版。系统。卷,116年,第454 - 440页,2020年。视图:谷歌学术搜索
  82. a . Madasu和s . Elango“情绪分析,有效的特征选择技术”多媒体工具和应用程序,卷79,不。9 - 10,6313 - 6335年,2020页。视图:出版商的网站|谷歌学术搜索
  83. A.-C。Chang c . v . Trappey a . j . c . Trappey和l·w·l·陈,“Web挖掘客户感知定义产品的位置和设计偏好,“国际期刊在语义网和信息系统,16卷,不。2,42-58,2020页。视图:出版商的网站|谷歌学术搜索
  84. r·库马尔和j·考尔“随机与森林有关的讽刺tweet分类使用多个功能集合,”为物联网应用多媒体大数据计算施普林格,页131 - 160年,纽约,纽约,美国,2020年。视图:谷歌学术搜索
  85. 答:俄南和m . a . Tocouglu”加权词嵌入和clustering-based蕴藏的识别问题主题论坛帖子,“计算机应用在工程教育,2020年。视图:谷歌学术搜索
  86. o . m . Baez-Villanueva和m .摩尔诺”RF-MEP:随机森林方法合并网格降水产品和地面测量,”环境遥感文章ID 111606卷,239年,2020年。视图:出版商的网站|谷歌学术搜索
  87. 贝克:“情绪分析大规模网络公开课程评价:文本挖掘和深度学习的方法,”计算机应用在工程教育,2020年。视图:谷歌学术搜索
  88. 答:俄南”,情绪分析产品评论基于加权词嵌入和深层神经网络,”计算机应用在工程教育2020年,文章ID e5909。视图:谷歌学术搜索
  89. ”俄南和m . A . Tocoglu加权神经语言模型和基于堆叠双向LSTM讽刺识别框架,“IEEE访问9卷,第7722 - 7701页,2021年。视图:出版商的网站|谷歌学术搜索
  90. c . Rodriguez-Pardo m·a·会长Patricio a . Berlanga和j·m·莫利纳“智能机器学习旅游和零售,2020年IGI全球。
  91. w .歌曲和y周”,道路旅行时间预测方法基于随机森林模型,”智能计算和通信的趋势施普林格,页155 - 163年,纽约,纽约,美国,2020年。视图:谷歌学术搜索
  92. a . Jamatia美国由捐款者驱动的,美国保罗,s . DebBarma和s·戴伊,”评级预测旅游目的地监督机器学习算法的基础上,“计算智能数据挖掘施普林格,纽约,纽约,美国,2020年。视图:谷歌学术搜索
  93. c·鲍迈斯特,t . Gerstenberg t . Plieninger和Schraml,“探索文化生态系统服务热点:连接多个城市森林特性与公众参与映射数据,”城市森林与城市绿化卷,48条ID 126561, 2020。视图:出版商的网站|谷歌学术搜索
  94. j·埃文斯、b . Waterson和a·汉密尔顿”使用一种基于上下文的随机森林算法预测道路交通条件,”交通规划和技术,42卷,不。6,554 - 572年,2019页。视图:出版商的网站|谷歌学术搜索
  95. l .周x见鬼,问:太阳,小王,“Multi-scenario模拟城市土地变化的随机森林和CA-Markov模型在上海,“可持续城市和社会卷,55 ID 102045条,2020年。视图:出版商的网站|谷歌学术搜索
  96. h .梁郭z, j . Wu, z . Chen”GDP空间化宁波市基于NPP / VIIRS夜间光和辅助数据使用随机森林回归,”太空研究的进步,卷65,不。1,第493 - 481页,2020。视图:出版商的网站|谷歌学术搜索
  97. z梅,w·丁、c·冯和l .沈”识别乘客基于随机森林的智能卡数据,”专业智能运输系统,14卷,不。4、207 - 212年,2020页。视图:出版商的网站|谷歌学术搜索
  98. 问:李·l·陈,李x et al .,“累进随机交互的半自动肺叶与森林有关的随机游走方法分割,“国际期刊的机器学习和控制论11卷,第2235 - 2221页,2020年。视图:谷歌学术搜索
  99. s . l . s .沾光和c d . Jaidhar”实证研究估计随机森林分类器的稳定性基于推荐的混合特性滤波器的特征选择技术,”国际期刊的机器学习和控制论,11卷,不。2、339 - 358年,2020页。视图:出版商的网站|谷歌学术搜索
  100. s . k . Lakshmanaprabu k . Shankar m . Ilayaraja a·w·纳西尔诉Vijayakumar和n . Chilamkurti”大数据的随机森林分类在互联网使用最优特性的东西,“国际期刊的机器学习和控制论,10卷,不。10日,2609 - 2618年,2019页。视图:出版商的网站|谷歌学术搜索
  101. l . x p . Liu Wang阴,b . Liu“整体学习平面随机森林:一个新的方法对更好的培训效率和适应性模型大小森林深处,“国际期刊的机器学习和控制论11卷,第2513 - 2501页,2020年。视图:谷歌学术搜索
  102. m·古德温,a . Yazidi“分布式学习automata-based方案分类使用小说追求计划,”应用智能,50卷,不。7,2222 - 2238年,2020页。视图:出版商的网站|谷歌学术搜索
  103. 纳兰德拉k . s和m·a·l·Thathachar学习自动机:介绍美国CA、快递公司、切姆斯福德,2012。
  104. a . Rezvanian a . m . Saghiri s . m . Vahidipour m . Esnaashari和m . r . Meybodi学习自动机的最新进展施普林格,vol.卷。754年,纽约,纽约,美国,2018年。
  105. r·s·萨顿和a·g·Barto强化学习:介绍,2017年。
  106. 庞b和l·李,“看星星:剥削阶级关系情绪分类等级量表,”2005年,http://arxiv.org/abs/0506075视图:谷歌学术搜索
  107. a .马斯河r·e·戴利·t·范教授黄d . a . y . Ng和c . Potts“学习词向量情绪分析,”美国第49计算语言学协会的年会:人类语言技术,页142 - 150,布法罗,纽约,美国,2011年。视图:谷歌学术搜索
  108. 庞,l·李和美国Vaithyanathan大拇指?情绪分类使用机器学习技术,”2002年,http://arxiv.org/abs/0205070视图:谷歌学术搜索
  109. d . Dua和c·格拉夫UCI机器学习库,加州大学,学校的信息和计算机科学,欧文,CA, 2019。
  110. c . Lopez-Vazquez和大肠Hochsztain扩展和更新表弗里德曼等级测试,”通信在统计理论和方法,48卷,不。2、268 - 281年,2019页。视图:出版商的网站|谷歌学术搜索

版权©2021年穆罕默德Savargiv等。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。


更多相关文章

PDF 下载引用 引用
下载其他格式更多的
订单打印副本订单
的观点471年
下载259年
引用

相关文章

文章奖:2020年杰出的研究贡献,选择由我们的首席编辑。获奖的文章阅读