复杂性

在这一页上

文摘介绍讨论结论数据可用性的利益冲突确认引用版权相关文章

特殊的问题

深入学习方法应用到复杂的大数据分析2021

把这个特殊的问题

研究文章|开放获取

体积2022年| 文章的ID7330823| https://doi.org/10.1155/2022/7330823

EW-CACTUs-MAML:一个健壮的Metalearning系统对大量任务快速分类

Wen-Feng王 ,^1、2 晶晶张,¹ 和彭一个²

学术编辑器: Zhijie王

收到了 2021年9月27日

接受 2021年12月16日

发表 2022年2月3日

文摘

本研究旨在开发一个健壮的metalearning系统对大量任务快速分类。的model-agnostic metalearning (MAML)仙人掌方法(无监督metalearning集群自动构建任务)后改善,因EW-CACTUs-MAML与熵权综合(EW)方法。Few-shot机制中引入大量的深层网络高效学习的任务。实现的过程从理论上解释为“基因情报。”在一个典型的数据集上验证EW-CACTUs-MAML (Omniglot)表明一个精度为97.42%,表现优于CACTUs-MAML(验证准确率= 97.22%)。在本文的最后,我们的思想来提高另一个metalearning系统的可用性(EW-CACTUs-ProtoNets)也初步讨论了基于交叉验证的另一个典型数据集(Miniimagenet)。

1。介绍

一般而言,一个学习算法被定义为一个过程处理数据D进行预测从每一个输入(1]。也就是说,是一个特定的函数映射来。从这个意义上讲,机器学习的目的是恢复数据的函数,包括学习分类器,回归,和政策(2]。因此,学习算法据说如果一致

不同与传统机器学习,metalearning被解释为“学会学习”,可以实现(1),这个函数来其实可以作为一个通用metalearner [3]。metalearning的主要研究方向包括metalearning基于度量空间(例如,典型的网络),metalearning基于参数优化(例如,model-agnostic metalearning),和基于模型metalearning(例如,强化metalearning) [1- - - - - -5]。metalearning非常大的数据集,因此,学习任务的自动分类一直是一个巨大的挑战(6]。由于这一挑战,一些工程应用metalearning报告(7,8]。

本研究的目标是(1)挑战,分析主要原因(2)为应对挑战,开发一种方法,(3)提出一个方案metalearning的工程应用。整个论文的组织如下。节2,我们制定一个挑战的问题在一个大规模的矩阵运算,并在部分3,我们从理论上分析如何进一步提高分类的精度和效率。节中给出了实验和讨论4在参数优化,改进的余地也突出显示。

2。问题公式化

2.1。模型的表示

我们利用熵权法改善metalearning流程,在model-agnostic metalearning采用(MAML)作为典型的网络(9- - - - - -12]。

让向量的初始参数模型f和表示更新后的参数。让非零学习速率。为K拍摄的学习中,我们使用5-way-5-shot构建预测模型(13- - - - - -15]。

根据万能函数逼近定理16- - - - - -20.),也可以表示为一个函数的近似者

2.2。口译学习过程

让l是lth任务和表示输入特征值计算的参数 ,偏见 ,和转换变量。让代表权重矩阵,其中包括一组与非负线性层输入和激活。让输出函数。让学参数。

我们改善传统的梯度下降法利用典型的网络更新权重的学习者f,它可以表示为

选择和这样

让表示一个函数,生成一个K拍摄离散化的输入。选择和这样

损失分类计算熵函数

一个简化的解释metalearning流程如图1。

3所示。理论分析

3.1。建设任务

假设有一个嵌入学习算法在D;然后,我们可以获得数据的映射从嵌入空间。为集群 ,集群的重心计算从

给定一个源矩阵

矩阵计算出重量r熵权法

的原型k类是生成的

因此,标记示例类的集合k是

我们利用k——聚类划分P和一组分区(21- - - - - -28]。让N是一个支持组一次性标签和问是一组查询,每个任务可以从一次性标签排列取样从仙人掌中获得。也就是说,

3.2。参数的优化

利用熵权法计算相对权重对于每一个数据的任务D_J和适应新任务D_霁也确定模型的参数通过计算梯度下降(29日,30.]。让是全球学习速率(固定metalearning参数)。然后,

通过抽样任务参数进行了优化P(J)相关。

优化过程的目标是使用更新后的参数计算外层更新。让内层的学习速率。在优化过程中参数的遗传

总损失之间的关系和任务损失参数的优化过程如图2。

3.3。理论实现

EW-CACTUs-MAML的实现包括两个步骤,可以从理论上解释为“基因情报”(强调参数的遗传)。

首先,为了实现多步梯度的更新,定义一个初始基因(即初始化参数)。多步梯度的更新可以实现通过输入的计算训练任务的更新的基因。第二,继续加入每个任务的训练数据和更新的基因。将获得最优基因在多个梯度下降。当然,一个特定任务的参数可能需要更新几次,得到的最优结果,如图3。

为了简化的遗传过程,未来预期最好的情况是,一个更新是足够的寻找一个基因,并在整个过程中,只有有限的数据小样本学习是必要的,如图4。

4所示。实验和讨论

4.1。模型的性能

两个典型数据集,Omniglot数据集和Miniimagenet数据集,将在这一节中。Miniimagenet数据集已广泛应用领域的metalearning few-shot学习(31日- - - - - -37]。著名的原始参考的数据集37一次性学习),匹配网络提出了解决机器学习的一个关键挑战的几个例子。到目前为止,Miniimagenet已成为一个领域的基准数据集metalearning few-shot学习(38- - - - - -40]。数据集包含60000彩色图片大小84×84 100类别,包括600个样本在每个类别(41]。Omniglot数据集包含1623份手写字符从50个不同的字母,由20个不同的人吸引在线亚马逊的土耳其机器人(42]。每个图像搭配中风数据和坐标序列(x,y,t每个中风数据),时间t以毫秒为单位(43]。Omniglot是一个领域的基准数据集一次性和few-shot学习(40,44- - - - - -49]。我们利用Omniglot数据集作为训练集的60%和40%的这个数据集作为验证集,如图5。

根据300年的训练和测试数据集的迭代的深集群Omniglot数据集,验证精度的平均值是97.42%,这表明EW-CACTUs-MAML Omniglot数据集是健壮的。

4.2。竞争力和实用性

的性能CACTUs-MAML Omniglot数据集如图6,包括细节的训练过程和验证过程。根据300年的训练和测试数据集的迭代的深集群Omniglot数据集,验证精度的平均值是97.22%。

比较火车损失的动态曲线,训练精度,验证,和验证与EW-CACTUs-MAML CACTUs-MAML图的准确性5,我们认为该模型是与CACTUs-MAML竞争。比较EW-CACTUs-MAML和CACTUs-MAML Omniglot数据集上的性能如表所示1。

EW-CACTUs-MAML损失确认为0.20578947,小于丧失CACTUs-MAML验证。EW-CACTUs-MAML在验证的准确性为97.42%,高于CACTUs-MAML的准确性的验证。必须指出CACTUs-MAML Omniglot数据集上可以代表一个最具竞争力的模型(50]。因此,这些结果已经证明该模型是有竞争力的和可行的。

4.3。不确定性分析和讨论

我们试图验证模型在另一个典型数据集Miniimagenet EW-CACTUs-MAML,但是这个数据集的大小太大所以电脑来源花了之前完成EW-CACTUs-MAML的性能。因为我们也想验证新方法的可用性在改善其他metalearning系统,然后试图提高另一个竞争metalearning系统CACTUs-ProtoNets [50EW-CACTUs-ProtoNets]。幸运的是,执行替代模型的计算机资源足够Miniimagenet数据集。细节的培训和验证过程CACTUs-ProtoNets和EW-CACTUs-ProtoNets Miniimagenet数据集在图所示7。

必须指出,我们利用Miniimagenet数据集作为训练集的80%和20%的这个数据集的验证集培训/测试EW-CACTUs-ProtoNets CACTUs-ProtoNets,类似与我们的策略培训/测试EW-CACTUs-MAML和CACTUs-MAML。我们显式模型的性能相比EW-CACTUs-ProtoNets和CACTUs-ProtoNets Miniimagenet数据集,如表所示2。

Miniimagenet数据集非常具有挑战性。在Miniimagenet CACTUs-ProtoNets模型已经是最有竞争力的数据集,但验证准确性仍不到50% (50]。低精度验证后没有改善与电子战集成方法。模型的交叉验证,性能EW-CACTUs-ProtoNets Miniimagenet数据集上透露一个挑战在实际应用中复杂的数据集(51- - - - - -54]。电子战的方法可以改善CACTUs-MAML,但不能改善CACTUs-ProtoNets。

一个可能的解释是,CACTUs-MAML是一个基于参数模型,虽然CACTUs-ProtoNets是基于指标模型。一个悬而未决的问题是如何提高性能的CACTUs-ProtoNets Miniimagenet数据集和其他复杂的数据集。尽管Omniglot数据集上的性能的方法意味着实际应用的可行性在光学字符识别(OCR)中,进一步验证其他工程数据集仍然是必要的(55- - - - - -59]。这些应该是下一个研究重点。

5。结论

我们应用few-shot机制建设和完成任务提出一个新方法来优化之前的算法,这是一个竞争metalearning系统。利用熵权法提高典型的网络。传统的梯度下降法是反过来改善,利用典型的网络更新权重基本的学习者。该方法的实现是解释为“基因情报”强调参数的遗传。EW-CACTUs-MAML表明一个健壮的性能的预测,竞争与CACTUs-MAML相提并论。下一个研究重点是进一步提高CACTUs-ProtoNets Miniimagenet数据集和的性能,进一步验证模型更复杂的工程数据集。

数据可用性

所有的数据利用支持理论和模型的研究可从相应的作者。

的利益冲突

作者宣称没有利益冲突有关这篇文章的出版。

确认

这项研究是由中国国家自然科学基金(41571299)和高级工业技术创新基地建设项目(1021 gn204005-a06)。

引用

p . b . Brazdil c·苏亚雷斯,j . p . da Costa”排序学习算法:使用ibl和元学习精度和时间的结果,“机器学习,50卷,不。3、251 - 277年,2003页。
视图: 出版商的网站 | 谷歌学术搜索
a·p·布拉德利“ROC曲线下的面积的使用机器学习算法的评价,“模式识别,30卷,不。7,1145 - 1159年,1997页。
视图: 出版商的网站 | 谷歌学术搜索
c . Giraud-Carrier r . Vilalta, p . Brazdil”介绍特刊元学习。”机器学习,54卷,不。3、187 - 193年,2004页。
视图: 出版商的网站 | 谷歌学术搜索
r .公元前领域和t . b . Ludermir元学习方法选择时间序列模型,”Neurocomputing,卷61,不。1,第137 - 121页,2004。
视图: 出版商的网站 | 谷歌学术搜索
z . y . k . Zhang汉、陈、张、王,“语义分割基于rgb的遥感图像和激光雷达数据使用model-agnostic元学习和质点群优化”IFAC-PapersOnLine,53卷,不。5,397 - 402年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
p . Kordik j . Koutnik j . Drchal o .终于,m . Cepek和m . Snorek“元学习的神经网络优化方法,”神经网络,23卷,不。4、568 - 582年,2010页。
视图: 出版商的网站 | 谷歌学术搜索
a . Delgado和罗梅罗,“环境冲突分析使用一个集成的灰色聚类和熵权法:一个案例研究在秘鲁采矿项目,“环境建模与软件,卷77,不。3、108 - 121年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
h·安和t .山口建设性与机器学习方法库,元学习”创新应用人工智能果园,b、c·杨和m·阿里。施普林格,柏林,德国,2004年。
视图: 出版商的网站 | 谷歌学术搜索
k .邹z . Wang和h .明,“新的模糊c均值算法初始化方法,”模糊优化和决策,7卷,不。4、409 - 416年,2008页。
视图: 出版商的网站 | 谷歌学术搜索
k·李,s . Maji a Ravichandran, s . Soatto“与可微凸优化、元学习”《IEEE / CVF计算机视觉与模式识别会议(CVPR)美国IEEE长滩,CA, 2019年6月。
视图: 谷歌学术搜索
n .江泽民和j·王,信息理论与编码理论,清华大学出版社,Bejjing,中国,2010。
林,度量空间和功能空间的拓扑结构,科学出版社,Bejjing,中国,2004。
d .一楼,“师散度相对熵算子”,Acta Mathematica Hungarica,卷116,不。1 - 2、127 - 131年,2007页。
视图: 出版商的网站 | 谷歌学术搜索
r·辛格诉Bharti诉Purohit, a·库马尔a·k·辛格和s . k .辛格“Metamed: few-shot基于医学图像分类使用梯度元学习,”模式识别,卷120,不。1,第111 - 108页,2021。
视图: 出版商的网站 | 谷歌学术搜索
s .副食”Hebbian spike-driven突触可塑性的学习模式意味着发射率,”生物控制论,卷87,不。5 - 6,459 - 470年,2002页。
视图: 出版商的网站 | 谷歌学术搜索
m·r·贝克和r·b·帕蒂尔“普遍为区间神经网络逼近定理,”可靠的计算,4卷,不。3、235 - 239年,1998页。
视图: 出版商的网站 | 谷歌学术搜索
p . l . Lu, g .彭日成z,和g . e . Karniadakis”学习非线性运营商通过DeepONet基于运营商的万能逼近定理,”自然机器智能,3卷,不。3、218 - 229年,2021页。
视图: 出版商的网站 | 谷歌学术搜索
r . r .狙击兵和诉Kreinovich uninorm-based模糊系统建模、万能逼近定理”模糊集和系统,卷140,不。2、331 - 339年,2003页。
视图: 出版商的网站 | 谷歌学术搜索
王l . x和j·m·孟德尔,“模糊基函数、万能逼近和正交最小二乘学习,”IEEE神经网络,3卷,不。5,807 - 814年,1992页。
视图: 出版商的网站 | 谷歌学术搜索
美国金枪鱼和b .通“小说分段多变量函数近似法通过通用矩阵表示,“数学化学杂志,51卷,不。7,1784 - 1801年,2013页。
视图: 出版商的网站 | 谷歌学术搜索
d . Steinley“k - means聚类:半个世纪合成,”英国心理学杂志上的数学和统计卷,59号1,猴,2011页。
视图: 出版商的网站 | 谷歌学术搜索
k . v .蒂尔堡”,确定了与N-subjettiness和线性k - means聚类对象,“高能物理学杂志》上,卷2011,不。3,28,2011页。
视图: 谷歌学术搜索
k·j·金和h·安”,推荐系统使用GA k - means聚类在一个在线购物市场,”专家系统与应用程序,34卷,不。2、1200 - 1209年,2008页。
视图: 出版商的网站 | 谷歌学术搜索
m·拉兹洛和s·穆克吉”,遗传算法,邻近的k - means聚类中心交流,“模式识别的字母,28卷,不。16,2359 - 2366年,2007页。
视图: 出版商的网站 | 谷歌学术搜索
m . j . Brusco和j·d·信誉“k - means聚类的变量选择启发式,”心理测量学,卷66,不。2、249 - 270年,2001页。
视图: 出版商的网站 | 谷歌学术搜索
z (g .阿尔金r·哈里森p c . Tai和y锅,“改进的k - means聚类算法探索当地的蛋白质序列图案代表共同的结构属性,“IEEE生物科学,4卷,不。3、255 - 265年,2005页。
视图: 出版商的网站 | 谷歌学术搜索
m . h . m . Mahdavi Chehreghani, h . Abolhassani和r . Forsati“小说meta-heuristic算法对于集群web文档,”应用数学和计算,卷201,不。1 - 2、441 - 451年,2008页。
视图: 出版商的网站 | 谷歌学术搜索
a . m .纽曼和j·b·库珀”常染色体:聚类方法确定基因表达模块没有先验知识集群数量,”BMC生物信息学,11卷,不。1,p。117年,2010。
视图: 出版商的网站 | 谷歌学术搜索
s . Hochreiter a . s .年轻,p·r·康威尔“学会学习使用梯度下降,”人工神经网络的国际会议施普林格,维也纳,奥地利,2001年8月。
视图: 谷歌学术搜索
a . s .年轻、美国Hochreiter和p·r·康威尔“元学习与反向传播,”国际神经网络联合会议学报》上IEEE,华盛顿,美国,2001年7月。
视图: 谷歌学术搜索
c .冰斗湖和w·f·曾“pDeep3:对更精确的频谱预测与快速few-shot学习,”分析化学,卷93,不。14日,第5822 - 5815页,2021年。
视图: 出版商的网站 | 谷歌学术搜索
杨唱,y, l·张,t,“学习比较:关系网络few-shot学习,”2017年,https://arxiv.org/abs/1711.06025。
视图: 谷歌学术搜索
f . z . Li周、c·范和l .挂“Meta-SGD:学会学习很快few-shot学习,”2017年,https://arxiv.org/abs/1707.09835。
视图: 谷歌学术搜索
Gidaris和n . Komodakis”动态few-shot视觉学而不忘”《IEEE / CVF计算机视觉与模式识别会议美国IEEE,盐湖城犹他,2018年6月。
视图: 谷歌学术搜索
bla和t . Burwick”通过全球原型Few-shot学习深陷网络,”神经网络:国际神经网络协会的官方杂志,卷94,不。10日,159 - 172年,2017页。
视图: 出版商的网站 | 谷歌学术搜索
问:Cai, y, t .姚明,c .严t·梅,“一次性图像识别内存匹配网络,”《IEEE / CVF计算机视觉与模式识别会议美国IEEE,盐湖城犹他,2018年6月。
视图: 谷歌学术搜索
o . Vinyals c . Blundell t . Lillicrap k . Kavukcuoglu和d . Wierstra“匹配网络一次机会学习,”2017年,https://arxiv.org/abs/1606.04080。
视图: 谷歌学术搜索
c . c . Liu, y . Wang l . Zhang和傅y,“令人难堪的简单的基线一次性学习,”《IEEE CVF计算机视觉与模式识别会议/研讨会美国IEEE,西雅图,佤邦,2020年6月。
视图: 谷歌学术搜索
s . Doveh e·施瓦茨c .雪et al .,“MetAdapt: meta-learned task-adaptive few-shot分类架构,”模式识别的字母,卷94,不。10日,130 - 136年,2021页。
视图: 出版商的网站 | 谷歌学术搜索
h·张,t·詹和戴维森,“self-supervised深无监督学习框架few-shot学习和聚类,“模式识别的字母卷,148年,第81 - 75页,2021年。
视图: 出版商的网站 | 谷歌学术搜索
c . f . Wang,曾z、x客,“基础网络特征提取器:一个基于指标few-shot模型对中国自然手语,”应用智能,51卷,不。5,7139 - 7150年,2021页。
视图: 出版商的网站 | 谷歌学术搜索
j . c . s . r .江y . r . Chen Yang c . Zhang和t .赵”混合变分autoencoders。”模式识别的字母,卷128,不。12日,第269 - 263页,2019年。
视图: 出版商的网站 | 谷歌学术搜索
b . m .湖、r . Salakhutdinov和j·b·特南鲍姆“人类通过概率计划学习归纳概念”,科学,卷350,不。6266年,第1338 - 1332页,2015年。
视图: 出版商的网站 | 谷歌学术搜索
张y、m .方和n . Wang“Channel-spatial注意fewshot分类、网络”《公共科学图书馆•综合》,14卷,不。12篇文章ID e0225426 2019。
视图: 出版商的网站 | 谷歌学术搜索
g . Karunaratne m .笨蛋m·l·盖洛和g . Cherubini“健壮的高维memory-augmented神经网络,”自然通讯,12卷,不。1,2021。
视图: 出版商的网站 | 谷歌学术搜索
崔y,廖,d . Hu w·一个l·刘,“而且伪监督指导meta-task优化few-shot对象分类,“模式识别,卷122,不。6、文章ID 108296, 2021。
视图: 出版商的网站 | 谷歌学术搜索
谢y, b . Yu h . Wang和z,“安全协作few-shot学习”,以知识为基础的系统,卷203,不。7553年,文章ID 106157, 2020。
视图: 出版商的网站 | 谷歌学术搜索
d·h·h·徐j . Wang Li欧阳,j . Shao,“无监督为few-shot元学习学习,”模式识别,卷116,不。6、文章ID 107951, 2021。
视图: 出版商的网站 | 谷歌学术搜索
j.y. Lim k . m . Lim郑胜耀Ooi和c·p·李”与自我认识蒸馏Efficient-PrototypicalNet few-shot学习,”Neurocomputing,卷459,不。12日,第337 - 327页,2021年。
视图: 出版商的网站 | 谷歌学术搜索
s•k .许和c·芬恩,“通过元学习无监督学习,”2018年,https://arxiv.org/abs/1810.02334。
视图: 谷歌学术搜索
a . Vailaya a . Jain和h . j .,“图像分类:城市形象与景观”,模式识别没有,卷。31日。12日,第1935 - 1921页,1998年。
视图: 出版商的网站 | 谷歌学术搜索
程m . Ohi y, y, t . Walz“负染法和图像分类——强大的工具在现代电子显微镜中,“生物过程在线》第六卷,没有。1,23-34,2004页。
视图: 出版商的网站 | 谷歌学术搜索
c . l . Blanc-Feraud参孙,g .《, j . Zerubia”图像分类的水平集模型”,国际计算机视觉杂志》上,40卷,不。3、187 - 197年,1999页。
视图: 谷歌学术搜索
n .奥洛夫·l·沙米尔,t . Macura j·约翰斯顿,d . m . Eckley l·g·戈德堡,“WND-CHARM:多用途使用复合图像变换、图像分类”模式识别的字母卷,29号11日,第1693 - 1684页,2008年。
视图: 出版商的网站 | 谷歌学术搜索
张,m . Bennamoun n·w·伯格曼,”一个阿拉伯语使用实现分割,光学字符识别系统”模式识别,34卷,不。2、215 - 233年,2001页。
视图: 出版商的网站 | 谷歌学术搜索
纳兹,k .‘m . i Razzak m·w·瓦尔s . a . Madani和美国汗”Urdu-like草书的光学字符识别,”模式识别卷,47号3、1229 - 1248年,2014页。
视图: 出版商的网站 | 谷歌学术搜索
b . Braunecker r·豪克和a·w·罗曼”光学字符识别基于nonredundant相关测量,”应用光学,18卷,不。16,2746 - 2753年,1979页。
视图: 出版商的网站 | 谷歌学术搜索
l . d . Jackel d·沙曼c . e . Stenard调查局斯特罗姆,d . Zuckert,“自助银行、光学字符识别”贝尔实验室技术杂志,卷74,不。4 - 24,2013页。
视图: 出版商的网站 | 谷歌学术搜索
f . Bensaali r . Sotudeh x翟,“现场可编程门阵列的实时光学字符识别车牌自动识别系统中,“专业电路、设备和系统,7卷,不。6,337 - 344年,2013页。
视图: 出版商的网站 | 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

407年

下载

626年

引用