研究文章|开放获取
黄Yikun Xingsi雪,曹国伟江, ”语义集成人工物联网传感器的知识”,无线通信和移动计算, 卷。2020年, 文章的ID8815001, 8 页面, 2020年。 https://doi.org/10.1155/2020/8815001
语义集成人工物联网传感器的知识
文摘
人工物联网(AIoT)集成了人工智能(AI)与物联网的传感器网络(物联网)来创建可以沟通和处理数据。实现AIoT智能系统之间的沟通和合作,有必要注释传感器数据的语义含义克服不同传感器之间的异构性问题,这就需要利用传感器本体。传感器本体正式模型知识AIoT通过定义的概念、属性描述一个概念,和两个概念之间的关系。由于人类的主体性,这一概念在不同的传感器本体可以定义不同的术语和背景,产生本体异构性问题。因此,在使用这些本体之前,有必要整合自己的知识通过寻找他们的概念之间的对应关系,即。,所谓的本体匹配。在这项工作中,新型传感器本体匹配框架,提出了聚合三种概念相似性措施(csm)和一个对齐提取方法来确定传感器本体对齐。确保校准的质量,我们进一步提出一个紧凑的粒子群优化算法(复)优化csm的聚合权重和阈值过滤对齐。实验利用本体一致性评估计划(OAEI)会议跟踪和两对真实传感器本体测试复形的性能。实验结果表明,校准的质量得到了复形统计上优于其他先进的传感器本体匹配技术。
1。介绍
物联网(物联网)1)由相互关联的事物内置传感器,和人工物联网(AIoT) [2)进一步集成人工智能(AI)创建传感器网络和物联网可以沟通和处理数据。实现AIoT智能系统之间的沟通和合作,有必要注释传感器数据的语义含义克服不同传感器之间的异构性问题,这就需要利用传感器本体(3]。传感器本体正式模型知识AIoT通过定义的概念、属性描述一个概念,和两个概念之间的关系。由于传感器本体被视为解决数据异构AIoT,近年来,许多传感器本体(4已经开发出来。然而,由于人类的主体性,重叠的信息在这些本体可以定义不同的术语和背景,产生本体异构性问题。因此,在使用它们之前,有必要整合自己的知识通过寻找他们的概念之间的通讯。本体匹配可以把传感器本体到双方协议自动确定相同的概念对应(即。本体对齐),被认为是一个有效的技术来解决本体异构性问题。
由于高计算复杂度在匹配过程中,群体智能算法(SI)已经成为一种流行的方法整合异构本体(5- - - - - -9]。Martinez-Gil和蒙特斯10]提出的基因本体比对(目标),首先为每个生成相似矩阵的相似度指标,然后使用遗传算法(GA)优化聚合这些矩阵的权重。聚合权重取决于目标可以重用的本体匹配相似的异构特性。Ginsca和Iftene11]不仅优化匹配过程中的参数也对齐的阈值过滤过程。Acampora et al。12]试图提高遗传算法的收敛速度以及解决方案的质量通过引入局部搜索策略。雪和王13)提出一种新的衡量标准大约测量校准的f-measure [14],在此基础上,利用混合遗传算法的执行实例级匹配相关公开数据云(LOD)。最近,他et al。15)提出基于人工蜂群算法(ABC)的匹配技术聚合不同的相似性措施,可以提高校准的质量。这些SI-based匹配技术需要第一家店相似矩阵由相似措施,大幅增加了计算复杂度。为此,基于遗传算法的本体匹配(GAOM) [16)模型的本体匹配两偶图匹配过程,并试图使用遗传算法来直接确定符合高质量。因为实例信息可以有效地提高对准的精度值,阿尔维斯et al。17)首先提出一个基于实例的相似性度量,然后利用混合遗传算法确定最优映射。MapPSO [18)模型本体匹配两偶图匹配问题,并提出了利用粒子群优化算法(PSO) (19)来解决这个问题。MapPSO利用对齐的统计信息大约评估其质量和指导算法的搜索方向,可以自动确定高质量比对。有关量的动态应用程序,需要集成传感器本体网络,因此,除了质量比对,匹配效率也是至关重要的。被紧凑的成功激发了SI在各种应用程序20.- - - - - -23),这项工作提出了一个紧凑的PSO(复)集成传感器AIoT知识。我们的建议的使用概率表示人口执行优化过程,模拟了人口的行为,因为它广泛探讨了决策空间的优化过程,逐步搜索关注最有前途的基因型和缩小搜索范围。因此,复形的运行需要更有限的内存消耗比较标准的算法。特别是,我们正式定义传感器本体匹配问题,提出一个问题特定的复形来有效地解决问题和集成传感器知识在里面。
剩下的纸是组织如下:部分2介绍了概念相似性度量和传感器本体匹配问题的数学模型;部分3给出了复形的细节;部分4给出了实验结果;最后;部分5结论。
2。预赛
2.1。概念相似度测量
概念相似性度量(CMS)是一个函数,输入两个概念的信息,输出一个实数[0,1]代表他们的相似度值。一般来说,有三种CMS,即。,string-based CMS, linguistic-based CMS, and structure-based CMS. In particular, string-based CMS takes as input two concepts’ labels and compares their syntax information, linguistic-based CMS also compares two concepts’ labels but it uses the external digital dictionary such as Wordnet [24计算其相似值,基于结构的CMS计算两个概念的相似性值基于直接super-concepts和subconcepts。
给定两个概念和 ,我们第一次去掉那些无意义的词(如停止词)从他们的标签,并将其转换成两个标记集和 ,然后基于字符串的相似度值计算如下: 在哪里和的基数,分别是和 。第一个比率表明重叠部分关于 ,第二个表示关于 ,和最小值被选中作为他们的基于字符串的相似度值。linguistic-based相似性值定义如下: 在哪里表示th的令牌和是th的令牌 , 如果他们是同义的Wordnet,否则为0。最后,假设superC1和superC2分别super-concept组和 , 和分别是直接subconcept组吗和 ,结构相似度值定义如下: 在哪里表示th的父类和的th的父类 , 是th的直接子类和的th的子类 。
因为没有csm可以确保所有上下文中的有效性,即。,distinguishing all the heterogeneous concepts, usually they are combined together to enhance the result’s confidence. Due to its flexibility, the weighted average strategy becomes a popular way of aggregating CSMs, which is defined as follows: 在哪里 。
2.2。对齐提取
每个聚合权重集对应于一个独特的聚合CSM,可以进一步用来构造一个相似矩阵的元素之间的相似性值吗一个本体概念和其他概念。在此基础上,我们可以提取一个对齐的基数1:1(一只从源本体概念映射一个概念从目标本体,反之亦然)根据以下步骤:(1)所有的相似度值在降序排列;(2)输出元素的最大价值,说 ,作为一个概念对应( )在提取的对齐;(3)替换的元素在相同的行或列为0;(4)重复步骤(1)(3),直到所有的元素都是0。图1的提取过程,显示了一个示例和是两个本体,表示th本体的概念。最后,六通讯提取:( ),( ),( ),( ),( ),( )。对过去的信件,因为其相似值很低,被认为是不确实的,最终对准由五大通讯。
2.3。传感器本体匹配问题
自校准的质量成正比的平均相似度值的所有通讯发现和调整的基数,我们利用以下方程来计算一个对齐的质量: 在哪里 , ,和分别是两个本体的基数吗 , ,和 , 是对应的相似度值。
在此基础上,传感器本体匹配问题的数学模型可以定义如下: 在哪里 代表了th相似性度量的聚合重量,计算聚合权重集相应的对齐的质量。
3所示。紧凑的粒子群优化算法
PSO的灵感来源于鸟类的行为,每一只鸟(粒子)最好看的内存位置和移动到领先的鸟(精英粒子)与某种程度的随机化。这个过程可以用下面的更新顺序,描述的th粒子在代 : 在哪里是速度,即。,a perturbation vector,是在当前生成和th粒子的位置是它的最佳位置访问的历史,是最好的位置发现了所有的粒子,然后呢 ,是权重向量。情商。7和情商。8)表明PSO更新每个粒子通过交换与本地的基因值最佳粒子和全球最佳粒子找到一个更好的位置。显然,原算法是一个基于SI,在这项工作中,我们进一步提出一个紧凑版本的算法来提高算法的性能。
3.1。编码和解码机制
这项工作使用二进制编码机制,即。,Gray code, and each particle’s gene values can be divided into two parts, one stands for the weight set for aggregating the similarity measures and the other for the similarity threshold for filtering the correspondences with low similarity values. Concerning the characteristics of the weights in Section2.1解码时,我们正常化。我们利用一个概率向量(pv)代表一个人口,其元素数量等于一个粒子的长度。每个PV的元素表示的概率1对应于每个基因的粒子。我们可以使用太阳能来生成各种二进制粒子通过其概率在每个维度,当关闭每个维度值为1或0,该算法收敛。此外,PV应更新每一代走向精英,使生成的新粒子在未来更封闭的精英。
图2显示了一个示例生成的粒子通过PV。给定一个PV (0.1, 0.3, 0.5, 0.9)T生成四个随机数在[0,1],如0.2,0.4,0.6,和0.1,我们可以确定新粒子通过比较它们与PV的相应元素。具体而言, , , ,和 ,新生成的粒子是0001。在每一代,PV的元素是根据最好的粒子发现更新。如果精英粒子的比特值是1(或0),相应的PV的元素将会增加(减少),从而使新生成的粒子更接近精英粒子。例如,给定一个PV (0.1, 0.3, 0.5, 0.9)T1110年精英粒子和步长 ,因为精英粒子的初始比特值是1,因此,我们通过一步更新PV的第一个元素,使新生成的粒子的初始比特值更可能是1(此句与精英粒子的初始比特值)。因此,光伏更新所有元素后,新生成的粒子将接近精英粒子的每一位的值。当所有元素的PV是1或0,新生成的粒子将是相同的,该算法是收敛的。
3.2。交叉算子
给定两个粒子和 ,交叉算子生成一个通过交换他们的后代基因值。在这项工作中,我们产生后代的粒子通过复制一个序列的基因片段到相应的基因的 ,这从两个继承顺序的基因片段和 。为了清晰,显示了交叉算子算法的伪代码1。
|
||||||||||||||||
4所示。紧凑的粒子群优化算法的伪代码
复形是在算法的伪代码2。复第一个初始化概率向量光伏通过设置为0.5的所有元素,然后使用它来初始化当地最好的粒子和全球最好的粒子 。在每一代,复首先尝试更新通过它,一个新粒子之间的交叉,然后通过交换基因值 。最后,结合复PV根据更新将新生成的粒子。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
5。实验结果和分析
5.1。实验装置
在实验中,我们使用本体一致性评估计划(OAEI)会议跟踪“http://http://oaei.ontologymatching.org/2019/conference/index.html“真正和两双传感器本体测试复形的表现。实验比较复有四个最先进的传感器本体匹配技术,即。,ASMOV [25],CODI [26],SOBOM [27],FuzzyAlign [28),在所有的测试用例 - - - - - -衡量。我们经验设置复形的交叉概率为0.8,最大的3000一代,和复形的结果表的平均三十独立运行。在表1在这些测试中,我们简要介绍了本体的病例。
|
||||||||||||||||||||||||||||||||||
5.2。统计比较
我们利用两个流行的统计测试方法,即。弗里德曼的测试(英尺)29日),河中沙洲的测试(HT) [30.),比较不同竞争对手的表现。特别是,英国《金融时报》的目的是检查是否有差异竞争对手,和HT进一步用于查找一个竞争对手统计是否优于他人。首先,我们需要拒绝HT的零假设,所有竞争对手的表现都是一样的。为此,计算值必须等于或大于提出临界卡方值在指定级别的意义吗 。在这个工作中,因为我们比较5匹配器,4自由度的临界值是9.488。
在表2,因为 ,大于9.488,因此,零假设被拒绝。HT是进一步开展。自复排名最低的值,它将作为一个控制匹配器将与他人相比。HT的是比较的测试统计值th和th竞争对手,这是用于寻找值对应的概率表的正态分布。的然后与价值 ,根据表3我们指出复形统计f-measure在5%显著性水平上优于其他竞争对手。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||
6。结论
AIoT旨在创建一个传感器网络,可以沟通和处理数据,这可以通过使用传感器技术实现本体与语义标注传感器数据的含义。支持AIoT基于本体的应用程序之间的合作,有必要整合这些传感器本体通过寻找它们之间的一致性。在这项工作中,小说匹配框架,提出了聚合三种csm和对齐提取方法来确定本体对齐。我们提出一个简洁的算法,并用它来优化csm的聚合权重和阈值过滤对齐,确保结果的质量。实验结果表明,我们的建议可以有效地匹配不同的传感器本体,和复形统计获得的校准的质量优于其他先进的传感器本体匹配技术。
在未来,我们将进一步提高复相匹配的大规模传感器本体,并解决这一问题的实例算法(ICR)传感器网络领域,这需要大规模传感器实例匹配的相关公开数据云(LOD)。我们也希望延长复形匹配特定领域的本体等生物医学领域和地理领域。特定的策略和技巧需要提出,用于提高对准的精度和召回,因为这些匹配任务需要特定背景知识库和复杂形式的对齐。
数据可用性
使用的数据来支持本研究中可以找到http://oaei.ontologymatching.org。
的利益冲突
作者宣称没有利益冲突的工作。
确认
这项工作是支持的福建省本科大学教学改革研究项目(没有。FBJG20190156), 2018项目为优秀青年科学研究福建省大学新世纪优秀人才项目福建省大学(没有。GY-Z18155),福建理工大学的科学研究基础(没有。GY-Z17162),在福州市科技计划项目(编号2019 - g - 40),福建省对外合作项目(2019号i0019)和自动检测技术和仪器的广西重点实验室(没有。YQ20206)。
引用
- p·潘德和a . r . Padwalkar”互联网的潜力的未来互联网:一项调查,“国际发展研究期刊》的研究在计算机科学和管理研究,2卷,第361 - 354页,2014年。视图:谷歌学术搜索
- g . Katare g . Padihar z .库雷希,“挑战人工智能与物联网的集成,”系统和软件工程的国际期刊》第六卷,10 - 15,2018页。视图:谷歌学术搜索
- a . Sheth c·亨森,s . s . Sahoo”语义传感器网络”,IEEE网络计算,12卷,不。4、78 - 83年,2008页。视图:出版商的网站|谷歌学术搜索
- 张x, x, m·李”在语义传感器网络的一项调查显示:传感器本体映射和查询,”国际期刊的u和e-Service、科学和技术,8卷,第342 - 325页,2015年。视图:谷歌学术搜索
- x雪和j·s·潘”,基于进化算法概述本体匹配,”信息隐藏和多媒体信号处理杂志》上9卷,第88 - 75页,2018年。视图:谷歌学术搜索
- 王薛x和y”,优化本体比对通过一个迷因算法使用MatchFmeasure和一致的改善比,”人工智能卷,223年,第81 - 65页,2015年。视图:出版商的网站|谷歌学术搜索
- x x天雪,j·陈,姚明,“有效用户参与半自动本体匹配,”IEEE新兴主题计算智能卷,2018年,页1 - 11,2018。视图:出版商的网站|谷歌学术搜索
- 使用紧凑的进化x雪和j·陈,“禁忌搜索算法匹配传感器本体,“群与进化计算卷,48岁,25 - 30,2019页。视图:出版商的网站|谷歌学术搜索
- 楚,x雪,js。锅,吴x”,优化本体对齐在向量空间中,“互联网技术杂志》,21卷,不。1、15 - 23,2020页。视图:谷歌学术搜索
- j . Martinez-Gil和j·f·a·蒙特斯”评价两种启发式的方法来解决本体元匹配问题,“知识和信息系统,26卷,不。2、225 - 247年,2011页。视图:出版商的网站|谷歌学术搜索
- a . l . Ginsca和a . Iftene”,利用遗传算法优化本体的相似性聚合一步对齐,”9日Roedunet国际会议乔安,页118 - 122年,罗马尼亚,2010年6月。视图:谷歌学术搜索
- g . Acampora诉Loia, a .主席,“加强本体一致性通过一个迷因聚合相似的措施,”信息科学卷,250年,页1 - 2013。视图:出版商的网站|谷歌学术搜索
- 王薛x和y”,使用迷因算法例如算法”,IEEE工程知识和数据28卷,第591 - 580页,2015年。视图:谷歌学术搜索
- c . j . v . Rijsberge信息检索格拉斯哥大学,巴特沃斯,伦敦,1975年。
- 张x y,雪和美国,“使用人工蜂群算法优化本体对齐,“信息隐藏和多媒体信号处理杂志》上,8卷,第773 - 766页,2017年。视图:谷歌学术搜索
- z . j . Wang叮,c .江”GAOM:基于遗传算法的本体匹配”,617 - 620页。视图:谷歌学术搜索
- 答:阿尔维斯、k . Revoredo和f·拜尔”本体对齐基于实例使用混合遗传算法,”第242 - 243页。视图:谷歌学术搜索
- j .烈性黑啤酒和j . Hettenhausen离散粒子群优化本体一致性。”信息科学卷,192年,第173 - 152页,2012年。视图:出版商的网站|谷歌学术搜索
- 进行j·肯尼迪和r·埃伯哈特,“粒子群优化”ICNN学报》95 -神经网络国际会议,页1942 - 1948,佤邦珀斯,澳大利亚,澳大利亚,1995年12月。视图:谷歌学术搜索
- 楚,“最优部署无线传感器网络基于微分进化紧凑,”网络情报杂志,卷2,不。3、263 - 274年,2017页。视图:谷歌学术搜索
- A.-Q。田,研究所。楚,js。锅、h·崔和W.-M。郑,“紧凑pigeon-inspired优化最大梯级水电站短期代模式,”可持续性,12卷,不。3,p。767年,2020年。视图:出版商的网站|谷歌学术搜索
- t·t·阮js。锅,t . k .刀”一个紧凑的蝙蝠不平等的聚类算法在无线传感器网络中,“应用科学,9卷,不。10队,2019页。视图:谷歌学术搜索
- js。锅,P.-C。歌,研究所。楚,Y.-J。彭”,改善紧凑布谷鸟搜索算法应用于无人机物流枢纽的位置,”数学,8卷,不。3,p。333年,2020年。视图:出版商的网站|谷歌学术搜索
- h·t·魏y Lu,问:周,x包,“语义方法用于文本聚类使用WordNet和词汇链,”专家系统与应用程序,42卷,不。4、2264 - 2275年,2015页。视图:出版商的网站|谷歌学术搜索
- j . Noessner m . Niepert c Meilicke, h . Stuckenschmidt“和解,利用术语的结构对象”语义Web:研究和应用程序。ESWC 2010。课堂讲稿在计算机科学中,第6089卷施普林格,页334 - 348年,柏林,海德堡,2010年。视图:谷歌学术搜索
- y . r . Jean-Mary e . p . Shironoshita, m . r . Kabuka“本体与语义验证匹配,”网络杂志的语义,7卷,不。3、235 - 251年,2009页。视图:出版商的网站|谷歌学术搜索
- l . p .徐y Wang Cheng和t .藏,“对齐SOBOM OAEI 2010的结果,”本体匹配,卷203,7 - 11,2010页。视图:谷歌学术搜索
- 费尔南德斯,即Marsa-Maestre j•贝拉斯科,b . Alarcos”本体一致性语义传感器网络集成架构,”传感器,13卷,不。9日,第12604 - 12581页,2013年。视图:出版商的网站|谷歌学术搜索
- m·弗里德曼“使用中避免正常隐式的假设方差分析,“美国统计协会杂志》上,32卷,不。200年,第701 - 675页,1937年。视图:出版商的网站|谷歌学术搜索
- 美国河中沙洲”,一个简单的顺序排斥的多个测试过程中,“斯堪的纳维亚杂志统计》第六卷,第70 - 65页,1979年。视图:谷歌学术搜索
版权
版权©2020 Yikun黄等。这是一个开放分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。