最近机器学习在图像分析和理解方面的进展

近日，人工智能和机器学习已经吸引了越来越多的关注，特别是在多媒体领域取得了在研究界和产业界巨大的成功。随着机器的深度学习特别学习的最新进展，在图像分析和理解许多任务已经应用到解决实际问题。例如，由于深学习的分类器在图像分类成功应用于2012年，深学习也被广泛应用在其他计算机视觉任务，如视频分类和影像超分辨率。从大量的数据的学习有效特征表示能够提取的底层结构的数据中，由于了解到特征很好地适应手头的任务，其产生比手工制作的特征更好的代表性的特征。然而，大多数的现有深度学习为基础的方法需要学习的参数数量庞大尤其是与日益复杂的网络，这限制了他们的应用程序中的图像分析和实时环境的理解。

这个特别问题的主要目的是组织最近发展的机器学习方法的集合以及它们在图像分析和理解中的应用。本期特刊旨在成为一个国际论坛，供研究人员以原创研究论文的形式报道这一领域的最新发展。也欢迎描述当前技术状况的综述文章。从16篇论文中，有7篇发表在本期特刊上。每篇论文至少由两名审稿人进行审评，并根据审评意见进行修改。这些论文涉及到图像分类、图像分割、视觉跟踪、人物再识别等。

在F. Yang等人的论文中，作者在体积数据上实现了MLP神经网络，在保持边界的同时去噪。该方法可以显著提高设备获取的体积数据的质量。然后对LH方法进行改进，结合区域深度信息实现了传递函数的半自动生成。该方法可以避免噪声的影响，使体素更加集中。LH直方图中对角线处体素分布更加集中，有效地强调了重要物体的边界。将对应于LH直方图中点的边界体素的标量值映射到适当的不透明度和颜色上，就可以准确地找到数据中感兴趣的特征。

在W.刘和Y.赵的文章中，作者做出了使用的发光字结构对物体表面重建的深入研究。用于去噪的图像后，可以最小化的其他光的摄影图象的影响，增加的读取照片的相容性;以获得每个的总和和内插操作的高度线的，它们然后获得对象的表面的平滑三维重建。研究过程的后一部分将集中在三维高精度，高速，并为进一步的研究实时重建。

在K. Zhang等人的论文中，作者专心通过转印学习使用深卷积神经网络识别番茄叶病。所利用的网络基于AlexNet，GoogLeNet和RESNET的预训练的深度学习模式。首先，我们通过使用SGD和亚当优化方法相比，这些网络的相对性能，其显露RESNET与SGD优化方法与获得最佳精度96.51％的最高成绩。然后，批量大小和影响转移学习RESNET的迭代次数的性能评价进行。小批量大小16组合中等数量的迭代4992是这项工作的最佳选择。我们的研究结果表明，对于一个特定的任务，无论是大批量的大小，也大量迭代可能不会提高目标模型的准确性。批量大小和迭代次数的设定取决于您的数据集和利用网络。其次，最好的组合模型是用来微调结构。从37微调RESNET层“FC”识别番茄叶病获得最高的精度97.28％。基于可用的数据量，逐层微调可以提供一种实用的方法来实现手边的应用的最佳性能。 We believe that the results obtained in this work will bring some inspiration to other similar visual recognition problems, and the practical study of this work can be easily extended to other plant leaf disease identification problem.

在M. Sun等人的论文中，使用所提出的方法的两个不同的数据源后试验，得出如下结论可以得出：通过大量的实验，得到了一组适用于随机森林最优组合的参数。也就是说，我们设置决策树中的300和数量的节点的数量在当随机森林参数为最佳，5％的样品和被选作实验的总数的10％，和5％的样品和10％分别加入时间。加权熵算法来选择具有最大熵值的样本来训练本文提出了新的训练集。分类器中使用的剩余的数据作为测试数据来评估分类器的性能，并测试分类器的普遍性。基于监督分类和SVM传统的分类相比，我们通过大量的实验，基于随机森林所提出的加权熵半监督分辨器表现出较好的分类性能和更好的普遍性证明。

在R. J. Hemalatha等人的论文中，提出了一种评估主动轮廓分割算法从关节炎影响的手指超声图像中分割滑膜区域的方法。性能分析指标如Dice系数、Hausdroff距离，统计分析指标如standard error、F-test，表明两种分割方法(Caselles和Lankton)在滑膜区有显著差异。对派生的特性(如性能指标和统计值)进行进一步分类。更高的精度描述为Lankton分类过程的结果。因此，研究结果表明Lankton方法是超声图像中滑膜区域分割的最佳方法。

在W. Liu和H. Wang的文章中，作者建议使用压缩功能来追踪对象的外观模型，然后使用SVM进行跟踪。实验结果表明，所提出的方法优于状态的最先进的几种方法。所提出的方法的优点是双重的：（1）它是擅长因为所使用的特征由多尺度的小波变换而获得的随时间的处理目标的尺度变化。（2）所提出的方法能够实现实时，因为所使用的特征的维数减少了压缩传感技术的速度。

M. A. Syed等人的文章提出，它利用两个多变换和交叉观点骗子，以提高度量的能力不同的人之间的区分，以及加强抑制能力下降大量现实世界不同的骗子的度量学习方法。在现实世界中大部分的行人图像多式联运，并在公共场所几个人有着相似的服装;因此，我们的IRM3据悉在公共场所，以解决重新识别和人物跟踪等问题。三个有挑战性的数据集（VIPER，CUHK01和CUHK03）大量的实验证明，其表现优于现有技术指标的许多以前的状态我们IRM3度量的有效性。此外，我们还打算扩大我们的方法在真实世界场景测试，并打算解决实时实现其他各种问题。

被录用的论文介绍了机器学习在图像分析和理解方面的最新进展。我们希望这一特刊能引起同行的主要注意。

利益冲突

编辑们宣布，他们有关于这期特刊的出版没有利益冲突。

致谢

感谢所有作者、评论家和主编的大力支持，使本期特刊得以出版。

升平告诉记者张
宋周
张磊

多媒体的发展

最近机器学习在图像分析和理解方面的进展

利益冲突

致谢

版权

更多相关文章

相关文章