复杂的深度学习与进化计算模型在计算机视觉

计算机视觉,这涉及到如何使用电脑获得高层次的理解有关信息包含在数字图像或视频,是一个重要的挑战,技术。深度学习和相关范式的出现如进化计算模型推动了计算机视觉到下一个水平,解决各种复杂的问题在不同的应用程序,例如对象检测、运动跟踪、语义分割和情感识别。在这个特殊的问题,最近的进步对数学建模、仿真、分析和/或深度学习和进化计算模型在计算机视觉进行复杂现象,。各种各样的问题,其中包括自动对象跟踪、理解图像内容,光学字符识别,个性化推荐和电影总结系统和水下视频覆盖。每一篇文章的描述,如下。

篇题为“多通道深度特征融合(MMDFF) RGB-D跟踪“地址限制现有的跟踪方法在处理几何特征提取深度图像通过使用多通道深特征融合模型。该模型包括四个深卷积神经网络(cnn)。它提取RGB(红、绿、蓝)和深度特性从图像使用RGB-specific和depth-specific CNN模型并利用其相关关系使用RGB-depth CNN模型相关。此外,motion-specific CNN是用来提供高级运动对象跟踪的信息。实证评估两个RGB-depth数据表明,该方法实现更好的性能,特别是在阻塞发生的情况下,运动速度快,和目标尺寸很小,相比与其他先进的追踪器。

语义图像分割是有用的对于理解语义信息包含在一个图像。改善耗时进行像素级注释过程中,弱监督语义分割方法使用CNN和极端学习机在论文中提出了名为“弱监督深层语义分割使用CNN和榆树和语义候选区域”。候选区域的语义推理实现了基于粗糙集和邻居的关系与语义相关的标签。在完成所有语义标签的推理步骤,使用极端的学习机器学习的候选区域。两个基准数据集的实验结果表明该方法能够胜过几个深层语义分割的最先进的替代品。

进行不平衡数据集,不平衡分布的深度学习模型字符识别基于焦联结主义时间分类(CTC)损失函数提出了本文题为“焦CTC损失为中国光学字符识别在不平衡数据集”。该模型包括三个主要组件:卷积,复发,转录层。剩余网络作为卷积层,从输入图像中提取特征序列。双向长短期记忆作为经常性的层,这对每一帧标签分布预测。焦CTC函数用于转录层,这意味着每帧预测到最终的标签序列。一系列实验研究使用合成和真实图像序列数据表明,该模型能够实现更好的性能与传统相比CTC在不平衡数据集。

篇题为“一种新型的基于递归神经网络的眼球运动模型模拟人类阅读”的目光行为解决注视人类阅读的行为作为一个基于序列标签在自然语言处理任务。眼动数据用于训练模型,该模型可以预测的眼球运动相同的读者阅读一个前所未有的文本。基于CNN模型的结合,双向长期短期记忆网络,递归神经网络和条件随机域,一个用于生成一个注视点预测序列。实证结果表明,递归神经网络模型能达到类似的准确性预测用户的固定分在阅读,更少的依赖数据的优势特点和预处理比一些现有的机器学习模型。

在电子商务服务,个性化推荐系统的学习是很重要的潜在用户和项目陈述隐含的用户和项目之间的相互作用。神经个性化排序模型的协同过滤与隐式频率反馈是介绍了名为“神经个性化的排名通过泊松系数模型项目推荐”。排名泊松系数模型中,采用双向的学习方法学习偏好条目之间的排名。使用多层感知器学习非线性user-item互动关系。个性化的排名模型能够捕捉user-item交互的复杂结构。实证结果表明该方法的优越性在先进的推荐算法。

让观众了解电影的语义在很短的时间内,一个电影总结系统产生一个短的视频序列,其中包含从这部电影最重要的场景。本文题为“个性化的电影总结使用深CNN-Assisted面部表情识别”,用户个性化电影摘要技术是使用深度开发CNN模型来分析人物的情绪状态通过面部表情识别。电影镜头分割面临使用熵方法进行。然后,总结关于用户偏好从七个基本情绪类。主观评价使用五个好莱坞电影展示了该方案的有效性在用户满意度方面,在客观评价表明其优势最先进的电影总结方法。

交通负荷和拥塞管理是无线传感器网络的重要问题。积极的缓存策略基于堆叠稀疏autoencoder预测数据包内容流行设计篇题为“基于深度学习的主动缓存有效WSN-Enabled视觉应用程序”。一个简单的框架结构的软件定义网络虚拟化技术和网络功能,加上autoencoder水槽和控制节点的无线传感器网络,是构造。的结构和模型参数与堆叠稀疏autoencoder通过训练进行了优化。一系列的模拟研究比较该方法与传统的古典缓存策略表明,堆放稀疏autoencoder能够提高预测精度提高无线传感器网络的性能。

大多数的古典单眼视觉同步定位和映射(大满贯)方法不考虑运动平台在初始化阶段的特征。因此,一个运动的假设将相机运动的解决方案转换成一个错误消除问题在初始化过程中介绍了题为“被动初始化方法基于运动特征的单眼大满贯”。错误减少了使用多帧基于包的优化方法调整,从而提高初始化过程的准确性。建立了固定翼飞机上的半实物仿真系统测试平台。结果表明,单眼大满贯的成功率初始化可以大大提高,与现有方法相比。然而,这种方法不能使用任意平台上随机运动的特征。

本文题为“设计和实现一个辅助实时红狮子鱼检测系统对AUV /器”,一个遥控水下机器人系统的车辆潜水员通过实时目标识别与定位红狮子鱼CNN-based模型设计和实现。辅助机器人能够识别红狮子鱼,潜水员可以最大限度地发挥各自的抓住每个潜水之前。水下车辆配备摄像头采集视频水下生活,和处理视频流实时检测红狮子鱼。发达系统评估目前入侵的地区红狮子鱼在墨西哥湾。结果表明系统的有用性与高信心实时检测红狮子鱼。

希望这个特殊问题作为基石,进一步刺激和促进研究的相关理论和应用深度学习和进化计算模型发展的计算机视觉技术和交付我们的社会福利。

的利益冲突

编辑声明没有利益冲突。

确认

客人编辑要感谢作者的贡献他们的文章和评论者对提高文章的质量通过建设性的意见和建议。

李张
齐川阳彭Lim
Jungong汉

复杂性

复杂的深度学习与进化计算模型在计算机视觉

的利益冲突

确认

版权

更多相关文章

相关文章