科学的规划

PDF
科学的规划/2019年/文章

研究文章|开放获取

体积 2019年 |文章的ID 1371328 | https://doi.org/10.1155/2019/1371328

Gabriel Alejandro Leon-Paredes莉莉安娜Ibeth Barbosa-Santillan, Jaime Sanchez-Escobar胡安安东尼奥Pareja-Lora, Ship-SIBISCaS:第一步识别潜在的海事法侵权行为通过LSA-Based形象”,科学的规划, 卷。2019年, 文章的ID1371328, 14 页面, 2019年 https://doi.org/10.1155/2019/1371328

Ship-SIBISCaS:第一步识别潜在的海事法侵权行为通过LSA-Based形象

学术编辑器:朱塞佩Scanniello
收到了 08年8月2018年
接受 2019年1月27日
发表 2019年3月3日

文摘

海事安全被不断的破坏。因此,确定海上流动违规行为(半)自动可能是至关重要的,以确保在未来海上安全。介绍了船的语义信息,图像相似度计算系统(Ship-SIBISCaS),构成第一步这种海上违规行为的自动识别。特别是Ship-SIBISCaS的主要目标是自动识别类型的船中描述一个给定的图像(如废弃、货物、集装箱、医院、乘客,海盗,潜水器,有三层,或军舰),因此,它相应的分类。这个分类是实现Ship-SIBISCaS通过发现船的相似图像和/或与其他船舶图片和描述描述包含在它的知识库。这种相似性计算的LSA算法实现,运行在一个cpu和gpu(即组成的并行体系结构。异构系统)。这个实现的LSA算法训练了文本的集合,从维基百科,这副一些语义信息ImageNet船图像。由于其并行体系结构,这种图像检索系统的索引过程一直加速十倍ImageNet(包括1261艘船只的)。图像相似度方法的精度的范围是46% - 92% 100%召回(即100%覆盖率的数据库)。

1。介绍

如今,许多海事法律侵权行为处理船舶和货物(或交易)船涉及(i)的不规则交通这类船只通过他们的存在是绝对的限制或地区,另外,和(2)他们的停泊,系泊、加载、和/或卸货的区域不怀孕。例如,(a)的运输油轮和其他休闲工艺会导致严重的环境破坏,因此,禁止在保护海洋环境中(例如,科苏梅尔岛的环境);和(b)交通、靠泊、系泊、加载、和/或卸货船舶和/或交易和货船在海上休闲区通常是与航运相关的黑市交易。因此,大量的海上安全程序必须实现,为了尽可能地阻止这种违规行为发生,不可能时,立即检测和阻止他们。

到目前为止,当前海事安全程序(即主要依赖人类。海岸警卫队)。然而,海事法侵权行为可以无处不在,控制是巨大的,和合适的人力和运输资源对抗他们通常是稀缺的。因此,人性化的海上安全程序被证明是不够的,以控制这些违规行为。出于这个原因,目前越来越需要一些额外的部署(半)自动程序,可以补充他们,最终确保海上保护至少在问题最多的地区。

一个额外的程序可以和可能对检测船舶交通违规行为分析(半)自动一些由一个或多个卫星拍摄的图像的某些海上区域。事实上,它是全球公认的“卫星(…)观察服务是不可或缺的在任何有效,现代海上监视系统。卫星图像数据是必不可少的,以确保持续的海上监视”1]。在这种情况下,图像分析的主要目的是检测当给定类型的船在一个不规则的区域(或限制)。这个主要目标可以分解在三个不同的子目标或问题,即(1)确定船的问题,也就是说,分类船;(2)识别区域,它位于的类型;和(3)检查如果船是凌日的允许或禁止区域。

介绍Ship-SIBISCaS原型系统,作为一个概念证据,作为第一次尝试解决子目标(1),即分类,对一艘位于一个感兴趣的领域。Ship-SIBISCaS是一个混合文本和图像检索系统,允许分类一艘船通过两种不同类型的输入,即,(a)一个文本定义和/或描述或(b)一幅描述它。系统的输出都是船所属阶级和船只在其最相似的图像数据库(或者,在理想的情况下,匹配)相关联的输入文本或图像。这个检索系统包括软件和硬件子系统。一方面,Ship-SIBISCaS软件子系统一直围绕的一个实例潜在语义分析(LSA)算法,为此特别训练。另一方面,其硬件子系统是一种异构的、并行硬件架构(即。,包括cpu和gpu)之前开发的2),但方便地定制,以适应这种新的用例。

如图所示的实验结果与Ship-SIBISCaS系统,(1)将LSA算法应用于解决这个问题帮助避免一些以前的图像匹配方法的缺点和/或检索,而达到一个令人满意的水平的精度和召回,而(2)重用异构、并行硬件架构允许加快LSA算法的执行和实现(几乎)实时响应系统的查询。

剩下的论文主要描述了系统的建设和实验,以评估它。组织如下。首先,部分2概述了相关的工作。其次,部分3礼物Ship-SIBISCaS系统如何设计为了检索船图片,评论也其主要设计问题和需求。第三,部分4描述最相关的细节开发和实验进行测试和评估。第四,部分5显示了这些实验的结果。最后,部分6总结了这项工作得出的结论。

在过去的几年,越来越多的船舶和/或船数据已经生成,共享,可在线观看。这些船数据被表示为文本,图像,音频或视频在不同的格式。特别是私人或公共船数字图像集合的数量正在迅速增加。这些图像数据和集合目前正在使用,例如,在视觉信息处理领域,提供健壮的模型对于许多类型的图像处理,如船舶识别和分类。

神经网络分类器,需要一个先前的训练来预测对象的类属(一个图像,在这种情况下)。训练神经网络的主要缺点是,他们经常失败由于存在一个局部最优3]。然而,当他们可以训练时,他们常常取得好结果的精度。在任何情况下,神经网络方法没有实现这个任务需求。实际上,除了训练分类模型,这是要求算法添加到图像语义描述。这允许进一步丰富相关信息和启用增强后处理。因此,神经网络已经为这项研究被丢弃。

Smeulders et al。4)为这一特定领域的研究人员提出了新的方向。其中之一是如何确定适当的图像特征(i)代表一个图像的意义;(2)可以适当标签图像来描述它;和(3)必要时可以用来检索图像。处理这类问题的研究领域被称为基于内容的图像检索(CBIR)。之一CBIR研究人员面临的主要问题是他们所说的语义鸿沟。在这种背景下,语义鸿沟可以被定义为“缺乏巧合之间的信息可以从视觉数据提取和解释”,特定用户“相同的数据(…)在一个给定的情况下。”

减少这种语义鸿沟,几位至今已开展工作5- - - - - -8]。如图所示通过这些作品,主要有两种类型的特性,可以用来描述和检索图像,即视觉和文本特征。一方面,可以通过检索图像的视觉特征,如颜色、形状、纹理(9- - - - - -11]。另一方面,可以通过他们的文本特征检索图像文本的(也就是说,特性描述)如关键词、标签、标题、注释(12- - - - - -14]。

除此之外,其他作品在这一领域已经显示,只使用一种类型的功能可能会导致糟糕的结果。例如,一些作者报告,使用专门的视觉特性不帮助描述图像的语义15]。此外,一些其他作者证明,CBIR系统在文本功能或基于视觉特性往往产生无关的结果(16,17]因为图像文本描述的质量取决于(a)的技能写他们的人(例如,他们的知识,智慧,经验,和词汇)和(b)不同的图像可能的潜在的解释。

幸运的是,潜在语义分析(LSA)方法已经成功地克服文本检索的问题,与一个概念性的内容(文本18]。此外,LSA方法也被用于检索图像很有前景的结果(17,19,20.,21]。然而,计算复杂度和内存需求的LSA方法近年来被证明是非常高(22- - - - - -24),尤其是当其奇异值分解)过程被认为是。此外,图像相似度评估和/或图像匹配高耗时的任务,由于高计算成本相关的索引和检索过程。迄今为止,这种极高的复杂性使得它几乎不可能LSA应用于图像检索在大型图像集合,由于内存限制。因此,这将是最有用的这种复杂性问题提供一个解决方案,从而使LSA的执行在任何规模的图像集合。

最近的一些作品在上述领域值得特别注意,由于他们的相关性对目前的工作。他们是如下:(我)Anandh等人提出了一个技术的生成图像内容描述符的特征颜色autocorrelogram,伽柏小波,小波变换以减少CBIR的语义鸿沟。他们取得了83%的准确率Corel数据库,88%为李数据库,70%的加州理工学院- 101数据库(9]。(2)汉等人描述的语义图像处理机制基于云计算的自动化环境敏感。他们应用一些强大的高计算资源来表示计算图像语义和/或如何感知形象的相似之处。语义推理是通过用户创建的多媒体内容添加到图像。用户的感知和用户相互匹配和语义定义的图像,因此,图像可以根据用户的定义及其语义分类(12]。(3)广域网等人显示的发展框架CBIR的深度学习任务。更具体地说,一些实验进行了评估工作先进的深卷积神经网络是否适合CBIR任务,从而找出如果深度学习有可能CBIR的语义鸿沟的桥梁。图像检索的对象,作者评估Caltech256图像数据库上的数据集,结果表明一些pretrained模型能够捕捉一些高度语义信息从原始像素(25]。(iv)Stathopoulos和Kalamboukis提出一个创新的应用程序可以跳过的LSA算法需要计算的完整计算特征矩阵,因此,克服了这个算法的缺陷在大规模数据集上运行。这个应用程序测试了一组提供ImageCLEFs 2012 & 2013医学图像检索代表大会。结果表明,视觉技术本身并不能够满足用户的语义信息需求(17]。(v)京等人提供了一个成本效益的发展和大规模的视觉搜索方法系统使用分布式计算平台和开放源码工具。在他们的实验中,作者作为输入图像注释中生成Pinterest计划,如销描述和标题。这些图像注释提供了大量的文本图像的信息。因此,实验表明,目标检测的任务使用文本和视觉数据取得了很低的误报率(低于1%)16]。

特别是,目前的工作是最相似(12),因为它还使用(i)定义和分类根据语义(尽管维基百科和WordNet被使用在我们的例子中)和(2)船舶协同标记图像,为了丰富他们的语义。然而,这项工作结合LSA和并行处理,以加快计算过程。与[17),这有助于克服应用的缺陷LSA算法对大规模数据集,但在一个更健壮的和一般方法。

3所示。船的设计问题和需求的语义信息,图像相似度计算系统(Ship-SIBISCaS)

正如前面介绍的,本文提出了一种船舶语义信息,图像相似度计算系统(Ship-SIBISCaS) LSA算法应用于图像检索,并提供一个解决方案来克服这个算法运行时的复杂性问题在大型图像集合。Ship-SIBISCaS的主要目的是,因此,检索集合中的船只与一种特定的船舶为了(i)计算其相似度,(2)使一个特定的分类查询船舶的援助船只检索相似。获得的结果的第一个原型Ship-SIBISCaS将被应用在未来,试图确保海上安全(半)自动。

Ship-SIBISCaS的发展不得不面临两大挑战,即(1)生成知识库的一个方便的图像数据集作为输入和铀浓缩通过图像与一些适当的文本和/或语义特征,和(2)学习语义信息对这些图像的文本和/或特性有关。概述的过程用于Ship-SIBISCaS如图1

3.1。生成和丰富知识库:图像数据采集和文本链接和/或语义特征

最重要的一个要求培训机器学习算法是使用准确的数据作为输入。事实上,如果机器学习算法流程模糊或不正确的图像训练时,那么它将,例如,把不正确的文本信息图像。因为这个原因,当Ship-SIBISCaS系统设计是决定其知识库(a)填充船图像数据集方便清洁,以减少噪音和(b)有这艘船的图像数据集丰富了关联船图像文本特征。这是设计也应该执行通过以下四个阶段:(1)图像数据集爬行,(2)协作标记,(3)连接,(4)清洗。

3.1.1。图像数据集爬行

的输入数据集知识库的人口必须ImageNet [26]。ImageNet,每个节点的层次结构是由成百上千的图片可以让Ship-SIBISCaS图像数据集。朝着这个目标,只有ImageNet节点对应于船只必须选择并纳入Ship-SIBISCaS的知识库。知识库必须丰富之后通过提取从WordNet (WordNet®,https://wordnet.princeton.edu)词法特性相关的图片。

3.1.2。协作的标签

一个在线协同标记系统(http://cloudcomputing.ups.edu.ec/ImageTagProject)必须建立以附加一些注释数据库中的图像。通过使用这个标签系统,人工注释器可以把船图像与一个或多个标签,应该尽可能忠实地描述船舶中描述图像的类型。这些信息会被保存在一个结构化的数据库内的知识库包含图像的标识符(ID),它的名字,它的URL,其类别,和一个标签图像,以及其他相关信息船协同标记系统。

3.1.3。链接

结构化数据库中存储的信息将被用于获得进一步的标签之间的关联一个图像和一个或多个标记。然后,web搜索引擎必须开发和应用于抓取万维网为了将一些文本信息附加到船图像标记的关系。这个文本信息,一般来说,将包括船舶类型定义或描述中描述的图像(如图像标记中详细说明)。

3.1.4。清洁

收集的文本信息的web搜索引擎将自动清洗以去除所有不必要的吵闹的段落和字符,因此获得一个干净的知识库Ship-SIBISCaS系统。因此,知识库将包括文本文档,每个文档的文件名应该对应于图像的文件名,及其图像标记的关系。

这将使用知识库之后火车Ship-SIBISCaS系统中的语义空间。图2显示Ship-SIBISCaS如何生成和丰富知识库与船舶相关的文本信息图像数据集。

3.2。如何学习语义信息与Ship-SIBISCaS LSA算法

正如前面提到的部分1,火车Ship-SIBISCaS和检索图像从其知识基础,现有的异构潜在语义分析(hLSA)系统(2)必须重用实现一个数据密集型LSA算法的实例。

这hLSA系统使用异构体系结构(包括cpu和gpu)为了加快LSA的执行方法,特别是使它运行在大规模数据集。已经使用(i)开发的GPU计算更快地解决大型数值问题通过数千个并发线程的多个CUDA核心多处理器和(2)cpu计算解决问题更快的文本通过共享memory-programming模型在多处理环境中。

hLSA系统可以训练一个知识库和检索信息在不到两分钟的一组5000个文档,或者等价于一个文档矩阵包含一百五十几百万的价值观。因此,hLSA系统已经用于Ship-SIBISCaS培训知识库和船舶实时图像检索相似。表1显示加速度达到hLSA系统相比,经典的LSA系统使用5000输入文档,两个权重方案(即日志熵和TF-IDF),和减少k=300维提出的三个使用案例(2]。


双相情感障碍 红斑狼疮疾病 托吡酯减肥
日志熵(sec) TF-IDF (sec) 日志熵(sec) TF-IDF (sec) 日志熵(sec) TF-IDF (sec)

hLSA 96.29 110.16 87.42 86.40 181.93 180.25
文理学院 770.50 610.82 756.33 590.01 848.97 689.12
加速度 8.00 5.54 8.65 6.83 4.67 3.82

hLSA系统分为三个主要阶段,如图3。第一阶段产生的语义空间,第二阶段减少方便其维度(即k值),第三阶段所请求的信息检索数据库相关联的语义空间。

3.2.1之上。语义空间创造

hLSA系统文本进行预处理,以删除任何剩余的奇怪的字符,空格,常用单词(stopwords)文本文档知识库。然后,hLSA系统生成文档矩阵,每个条目表示一个给定的频率在给定文档。这个文档矩阵的生成具有高计算成本由于大量的文本包含在知识库中。因此,hLSA系统实现了一种并行数据密集型算法共享内存,cpu体系结构。这样做是为了减少所需的处理时间指数和构建文档矩阵。

3.2.2。降维

生成的文档矩阵是相当大的,它主要用零填充。因此,它需要分别减少和规范化。正常化,hLSA系统利用知名term-weighting指标,如对数本地号码(对数熵)和术语frequency-inverse文档频率(TF-IDF)公式。减少hLSA规范化矩阵,系统使用一个截断奇异值分解矩阵来反映其主要的关联模式(以小数量的维度k值,生成的行或列的数量在减少矩阵)。奇异值分解算法具有很高的计算成本对于大型矩阵,因此hLSA系统实现了一种并行数据密集型计算算法使用GPU的体系结构加快计算的好处。

3.2.3。信息检索

上面的两个阶段是用来学会计算相似性度量和分类图像知识库为了获得减少语义空间。然后,相似度值降序排名,最相似的文档有最高的值和最相关的文档有最低的值。因此,一个监督学习模型,以检索船与用户查询相关的图片。hLSA系统比较文档中的每个文档向量矩阵与用户查询向量。此外,hLSA系统显示相关的图像和文件(文本)的一个图形用户界面,如图4

4所示。Ship-SIBISCaS发展和实验的细节

本节描述详细,首先,最发展的有关问题的主要设计组件Ship-SIBISCaS系统(部分中描述3),其次,到目前为止,实验是为了测试和评估。

首先,发展的最相关的细节Ship-SIBISCaS下面讨论,即(1)船的图像数据集收购,(2)集注释船形象是如何确定的,(3)船图像是如何协作标记,(4)是如何丰富知识库的链接图片合适的文字,(5)到知识库中相关的语义空间是如何训练,和(6)类似的图像是如何从训练有素的语义检索空间。(1)图像数据采集。这是决定使用ImageNet数据库为主要输入(26)测试和评估Ship-SIBISCaS的第一个原型。ImageNet由以下结构的节点组织提供的WordNet名词同义词集及其对应的层次关系。因此,在这个数据库中,每个节点包含成百上千的图片的内容可以用WordNet的代表名词同义词集描述。因此,数据库有100000多个节点和一个大约1400万张照片。ImageNet提供约1000每synset品质管理和human-annotated图像。为了创建和生成Ship-SIBISCaS的知识库,只有这艘船是从ImageNet提取的图像集合。这个集合的定义是“携带乘客或货物的船,”,它包含了78个孩子,如废弃的船、货船,货船,医院船、客船、和运输船舶。这艘船由1261图像集合。图5显示了一个分类的一部分和一些图像有关这艘船的图像集合。(2)集的决心。不过,名词的数量可以用来标记(分类)船图片太大。为了减少数量的标签最终用于此目的,一个在线协同标记系统。这个系统的主要目的是要确定哪些是最常用的和/或最有用WordNet名词来描述这些船的图片。然后,这个协作系统是人类注释器所使用的一组(称为一个焦点小组),并发现只有43个条款需要标签和分类中出现的船只ImageNet船图像集合。这些43标记(Ship-SIBISCaS集)如表所示2(3)协作的标签。然后,在线协同标记系统是Ship-SIBISCaS gdp8 %注释图像知识库使用集之前确定。为此,控制焦点小组的大约有120人中间知识雇船领域的图像。每个人在20国集团的平均标记图像。2320一个图像之间的联系及其标签了。必须做出下列事项:(一)相同的图像可以由不同的人标记,那么一个给定的图像可以有几个(重复)协会;和(b)焦点小组的成员标记的图像根据他们的知识领域,因此,相应的协会(标签)的图像能一致。结果,至少711图像与一个标签和至少550图像与一个以上的标签。(4)链接。Ship-SIBISCaS系统然后将图像通过使用相应的标记一些合适的文本描述。达到通过其基于网络的搜索引擎,它使用一组web服务查找文本信息通过相关链接到一个图像标记(s)。特别是,这个引擎被用来从维基百科(Wikipedia(获取文本信息http://wikipedia.com)是一个著名的在线免费的百科全书)通过其API(应用程序编程接口)。此外,基于网络的搜索引擎丰富知识库与进一步的语义信息,如描述。知识库中每个文档的文件名对应的图片的名字有关,它包含一些相关文本信息为每个图像标记。(5)语义空间(LSA)培训。知识库,富含图像标签和图像的文本信息和/或描述,当时作为输入训练hLSA系统在前一节中描述。评论,hLSA系统降低矩阵的维数一个,(或等价的语义空间)用截断奇异值分解一个为了反映其主要关联模式和忽略了更小的,更重要的影响。它限制了矩阵的维数一个其第一k维度,k必须小于最小的总数中条款和文件,也就是说,k<敏(条款、文件)。尺寸的数量k等于50。这个过程获得的执行时间为8秒。(6)类似的图像检索。系统使用余弦度量为了获得训练的语义的相似性图像向量空间和查询向量。Ship-SIBISCaS检索相似的图像为一个文本图像查询或查询。对于图像的查询,它使用一个索引图像训练有素的语义空间的查询,查询文本,它使用标签描述表2。训练有素的语义的方法比较了所有的向量空间与查询向量。结果,最高的五个图像相似性检索值。执行时间获得这一过程变化取决于查询的语义信息。执行时间10到30秒获得的图像查询和100到300毫秒的文本查询。图6显示五个图像查询和训练有素的语义空间中最相似的图像。此外,图7显示五个文本查询和最相似的图像检索的语义空间。


标签名 标签描述

1 废弃的船 一艘废弃的公海上
2 航空母舰 一个大型军舰,飞机和有一个长而扁平的甲板起飞和着陆
3 香蕉船 设计一艘船运输香蕉
4 战列巡洋舰 一艘巡洋舰的最大速度和火力
5 货船 一艘船运送货物而设计的
6 集装箱船 一艘货船设计用来保存集装箱货物;“文档的所有货物的重量在当代集装箱船可以超过90英镑”
7 游轮 客船使用商业为了乐趣
8 工厂的船 一个捕鲸船在海上装备过程鲸鱼产品
9 渔船 渔船船上或船用来抓鱼在海里,或在湖或河。许多不同种类的船只被用于商业和休闲钓鱼。
10 旗舰 这艘船的指挥官,他旗舰队和苍蝇
11 导弹护卫舰 一个携带导弹护卫舰
12 医院船 一艘船建造作为医院;用于在战时受伤
13 破冰船 船和钢筋屈服于分手冰,保持渠道打开导航
14 打不破的 19世纪的一个木制军舰镀铁或钢护甲
15 灯塔船 装备一艘船像一座灯塔和锚定在一个永久的灯塔是不切实际的
16 豪华游艇 班轮装备豪华的生活
17 商船 一艘货船;“他们做了很多外国底部”的海外贸易
18 扫雷艇 船舶装备检测海洋矿,然后摧毁或压制或删除
19 远洋班轮 一艘大型商业(尤其是定期携带乘客)
20. 油轮 一艘货船设计携带大量原油
21 客船 一艘船建造携带乘客
22 巡逻船 一个容器分配给一个地区巡逻。
23 海盗船 一艘载人的海盗
24 私掠船 私人拥有的军舰委托捕食商船或军舰敌人的国家
25 研究潜艇 研究目的的潜艇
26 帆船 帆船或帆船船推动部分或完全由小帆帆船
27 帆船 现代帆船是任何大型风力船。传统帆船(或只是船)是一个带有三个或更多桅杆的帆船广场帆
28 军舰航行 一艘军舰的帆和配备了许多沉重的枪;不是建立在19世纪中期之后
29日 海难 一艘失事的船只(或部分)
30. 奴隶船 船舶用于运输奴隶从家里奴仆的地方
31日 小型船 一艘船很小
32 轮船 一艘船由一个或多个蒸汽机
33 潜艇 潜水军舰通常配备鱼雷
34 补给舰 一艘船,通常提供供应其他船只
35 水面舰艇 一艘军舰运行在水面上
36 有三层 任何船有三个甲板
37 鱼雷快艇 小型高速战舰设计用于鱼雷袭击沿海水域
38 训练船 一艘用于培养学生作为水手
39 宝船 一个16世纪的船满载财宝
40 运兵舰 一艘载有士兵或军事设备
41 军舰 政府可用船发动战争
42 小木船 海岸附近的一个小木船操作
43 游艇 一个中型的帆船装备巡航或赛车

5。结果

首先,我们现在合作的结果标记过程,其次是规模指标相关ImageNet样本用于我们的实验。然后,我们表现出的性能估计Ship-SIBISCaS通过通常的精度和召回措施。最后,我们详细的结果系统关于其执行时间。

因此,首先,结果有关协作标记过程对于每个船标记(或类别)如图8

如表所示3,我们发现总共有15921独特的词汇知识库中。因此,索引文档矩阵生成的知识库的过程一个有15921项。这个索引过程执行1261个文档。应该说,这个矩阵一个是主要由零填充。因此,我们归一化矩阵一个通过使用term-weighting计划称为词Frequency-Inverse文档频率(TF-IDF)。最后的总数值矩阵一个是20076381,这相当于161字节。这个过程在9.5秒被处决。


的文档数 单词量 独特的单词数量 知识库的大小(Mb)

1261年 5767357年 15921年 35

其次,规模指标相关ImageNet样本用于我们的实验如表所示3,独特的词的数量是15921。

第三,我们表现出的性能估计Ship-SIBISCaS通过通常的精度和召回措施。基本上,精度值给信息系统的有效性,而回忆值提供一些信息对于系统的覆盖范围,如表所示4。例如,“游艇”的文本查询返回一些假阳性,因为相关的标签描述是不正确的,精度2%。然而,图像查询过程使用一个更好的描述集装箱船,及其相关的答案得到平均精度为87%。


标签 图像查询 文本查询
回忆(%) 精度(%) 回忆(%) 精度(%)

废弃的船 One hundred. 73年 One hundred. 73年
游艇 One hundred. 77年 0 2
集装箱船 One hundred. 92年 One hundred. 83年
帆船 One hundred. 46 One hundred. 46
海盗船 One hundred. 92年 One hundred. 92年

最后,结果涉及到矩阵相关联的执行时间还原过程和船舶检索图像基于语义信息如图9

结论的描述实验,必须说,Ship-SIBISCaS软件子系统测试GPU上配置的全局内存3064 mb和2.5 GHz的时钟速度。同时,每个多处理器的最大线程数是2048,每个块的最大线程数是1028。线程阻塞的GPU最大尺寸大小(1024、1024、64)(x,y,z)维度。

6。结论

本文介绍了船的语义信息,图像相似度计算系统(Ship-SIBISCaS)帮助船中描述一个图像分类。这里的分类被认为作为一个概念证明和第一步海洋流的(半)自动识别违规行为,因此,作为一个潜在的机制,确保海上安全最有帮助。

为了实现这一目标,首先,ImageNet船舶相关图像数据导致的数据库中提取和加载到知识库系统已经建立。这艘船的图像数据集包含1261张图片不同的类别。

其次,船图片在这个数据集注释通过在线协同标记系统上开发的目的。这有助于明确2320船图片和注释之间的关联。

第三,Ship-SIBISCaS收集了一些文本信息的语义推理程序相关船图像标记协会为了丰富知识库与文本描述。

第四,加速数据密集型算法(hLSA)被用来训练系统通过学习这些文本描述的语义关联到船的图像。

最后,培训系统已成功应用于一些实验(i)分类输入船(可以是描述在一个图像,或者通过一些文字描述);和(2)来检索图像相似的船只从知识库中。一方面,查询由船的图像时,系统可以在10 ~ 30秒内提供答案。另一方面,当查询包含一些文本描述的船,这个系统可以回答仅在100 - 300毫秒,由于不同类型的语义信息应用的reasoner在每种情况下。的确,对于图像查询,Ship-SIBISCaS使用一个索引图像,而语义描述用于查询的文本。

这些实验也证明了以下几点:(1)可以自动识别船舶的类型,也就是说,如果是,例如,一个废弃的船,集装箱船,一艘货船,医院船或客船。(2)重用在Ship-SIBISCaS hLSA架构已经被开发来实现LSA算法可以加快算法的执行,甚至让它跑快10倍。

关于系统性能,它花费了17.5秒的时间来训练该模型与1261年输入元素(船)。生成的文档矩阵包含20076381个值,大小为161 mb。此外,更具体地说,它花费了9.5秒的时间来执行索引阶段和8秒(平均)检索答案(k=50维度)。

最后,至于答案的质量提供的系统,他们可能被描述为令人满意,但是可利用的。一方面,100%的召回已经获得两个实验进行Ship-SIBISCaS。另一方面,Ship-SIBISCaS精度值从2%到92%不等。最值得注意的是,图像相似度算法有更好的精度与图像查询,而不是文本查询。例如,集装箱船与查询图像精度达到92%比83%精度与文本查询。然而,Ship-SIBISCaS检索文本查询的假阳性由于噪声图像协同标记过程有关。实际上,一些注释器注释相同的图像不同(甚至错误),根据图像的相应的解释,这是以后用来标记,使其语义明确。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作是支持的科学研究委员会(CONACYT)研究项目。262756年称为“GNSS数据跟踪海上流的使用海上安全。”作者从大学里感谢他们的同事为Salesiana (UPS)通过云计算研究小组,智能城市和高性能计算(GIHP4C)和项目tin2014 - 52010 r称为RedR +人力由西班牙经济和竞争力。

引用

  1. t·斯托尔滕贝格”提案提交给北欧外长特别会议的2009年2月9日在奥斯陆,”技术报告,芬兰,冰岛和瑞典外交部,奥斯陆,挪威,2009,http://www.fride.org/download/OP_Stoltenberg_mante_paz_eng_jul09.pdf视图:谷歌学术搜索
  2. g . A . Leon-Paredes l . i Barbosa-Santillan和j·j . Sanchez-Escobar“异构系统基于潜在语义分析(hlsa)使用gpu和cpu,”科学的规划卷,2017篇文章ID 8131390, 19页,2017。视图:出版商的网站|谷歌学术搜索
  3. o .路德维希jr .)和美国Nunes”,提高神经网络的泛化特性:申请车辆检测,”学报2008年11日国际IEEE会议在智能交通系统中,第315 - 310页,北京,中国,2008年10月。视图:出版商的网站|谷歌学术搜索
  4. a·w·m·Smeulders m .不用Santini, a·古普塔和r . Jain,“基于内容的图像检索的早期,“IEEE模式分析与机器智能,22卷,不。12日,第1380 - 1349页,2000年。视图:出版商的网站|谷歌学术搜索
  5. 黄懿慧阿里和w·n·阿卜杜拉,“web图片搜索相似措施的调查,“国际新兴趋势技术在计算机科学杂志》上,4卷,不。4、2016。视图:谷歌学术搜索
  6. a . Alzu 'bi、a .阿米拉和n .拉姆赞•“语义基于内容的图像检索:综合研究”,杂志的视觉传达和图像表示32卷,20-54,2015页。视图:谷歌学术搜索
  7. 李x t . Uricchio l . Ballan m·贝尔蒂尼c·g·m·杖鱼和a . Del女人“社交语义鸿沟:比较调查图像标记任务,细化,和检索,“ACM计算调查卷,49号1,2016。视图:谷歌学术搜索
  8. c·f·蔡“Bag-of-words表示在图像注释:审查。”ISRN人工智能文章ID 376804卷,2012年,19页,2012。视图:出版商的网站|谷歌学术搜索
  9. a . Anandh k磨面,s . Suganya“基于语义信息的基于内容的图像检索系统使用颜色、纹理和形状特征,”学报2016年国际会议上计算技术和智能数据工程,ICCTIDE2016年1月,Kovilpatti,印度,。视图:谷歌学术搜索
  10. c . w . Niblack r .理发师,w . Equitz et al .,“QBIC项目:查询图像的内容,使用的颜色,纹理,形状,”学报学报为图片和视频数据库存储和检索方法相比,卷。1908年,华盛顿,美国,1993年4月。视图:出版商的网站|谷歌学术搜索
  11. l . j .悦z . Li Liu和傅z,“基于内容的图像检索使用颜色和纹理融合特性,”数学和计算机模拟,54卷,不。3还是4,1121 - 1127年,2011页。视图:出版商的网站|谷歌学术搜索
  12. b . k . s . h .汉h·w·Kim公园,y . a . Heo和y s .,“有效的语义图像处理自动上下文感知机制基于云基础设施,”先进的多媒体和无处不在的工程施普林格,新加坡,2016年。视图:谷歌学术搜索
  13. s . Sclaroff m . l . Cascia s Sethi和l . Taycher”统一文本和视觉线索对基于内容的图像检索在万维网上,“计算机视觉和图像理解,卷75,不。1/2,86 - 98年,1999页。视图:谷歌学术搜索
  14. x周”,CBIR:从低层特征到高层语义,”SPIE-The国际光学工程学会2000年学报》上美国纽约大学出版社,纽约,2000年4月。视图:谷歌学术搜索
  15. t . l . Berg a·c·伯格爱德华j . et al .,“名字和脸的新闻,”2004年IEEE计算机学会学报计算机视觉与模式识别会议(CVPR)美国,华盛顿特区,6 - 2004。视图:谷歌学术搜索
  16. d . y, d . Liu Kislyuk et al .,“视觉搜索pinterest,”21 ACM SIGKDD学报》国际会议悉尼新南威尔士,澳大利亚,2015年8月。视图:谷歌学术搜索
  17. Stathopoulos和t . Kalamboukis”,将潜在语义分析应用于大规模的医学图像数据库,”计算机医学影像和图形39卷,27-34,2015页。视图:出版商的网站|谷歌学术搜索
  18. s . Deerwester s Deerwester s t·杜et al .,“索引通过潜在语义分析,”美国信息科学学会杂志》上第41卷。。6,391 - 407年,1990页。视图:谷歌学术搜索
  19. m . Bakalem: Benblidia, s . Oukid“潜在语义分析图像自动标注,”学报2010年国际会议上机器和网络智能(ICMWI)2010年10月,阿尔及利亚阿尔及尔。视图:谷歌学术搜索
  20. c·h·李和k . c .蒋介石“潜在语义分析分类的场景图像,”学报2010年工程师和计算机科学家国际多大会,IMECS2010年6月,香港,。视图:谷歌学术搜索
  21. 张平,y, t·托马斯,伊曼纽尔,“移动人跟踪视觉监视应用程序检测到潜在语义分析,“多媒体工具和应用程序,卷68,不。3、991 - 1021年,2014页。视图:谷歌学术搜索
  22. s t·杜”,潜在语义分析,“信息科学和技术的年度审查,38卷,不。1,第230 - 188页,2004。视图:谷歌学术搜索
  23. j . r . Herrera-Morales和l . i Barbosa-Santillan”医学出版物与潜在语义分析方法,分析”诉讼的第三国际会议信息挖掘和经营管理的进步,页1 - 6,里斯本,葡萄牙,2013年11月。视图:谷歌学术搜索
  24. 罗萨里奥,“潜在语义索引:概述,田纳西大学诺克斯维尔,TN,美国,2000年,技术报告印孚瑟斯240年春季。视图:谷歌学术搜索
  25. s . c . h . j . Wan d . Wang海et al .,“深度学习,基于内容的图像检索”2014年学报ACM国际会议美国,纽约,纽约,2014年2月。视图:谷歌学术搜索
  26. j .邓w .咚,r . Socher k, l . j . Li和l .菲菲”Imagenet:大规模的分层图像数据库”学报2009年IEEE计算机视觉与模式识别会议(CVPR)美国佛罗里达州,迈阿密,2009年6月。视图:谷歌学术搜索

版权©2019 Gabriel Alejandro Leon-Paredes等。这是一个开放分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。


更多相关文章

PDF 下载引用 引用
下载其他格式更多的
订单打印副本订单
的观点1003年
下载548年
引用

相关文章