文摘
旨在提高下一代之间的通信和信息安全的工业物联网(Nx-IIoT)传感器网络,关键是聚合传感器本体的异构传感器数据通过建立语义连接在不同传感器本体。传感器本体匹配技术致力于确定异构传感器在两个截然不同的概念对传感器本体,这是解决异构性问题的一种有效方法。现有的匹配技术忽视不同实体间的关系映射,这使得他们无法确保一致的高质量。摆脱这一缺点,在这个工作中,一个传感器本体使用模糊辩论机制提取方法技术(FDM)提出了聚集异构传感器数据,决定最终的对应的传感器概念进行辩论过程中不同的匹配器。模糊相似性度量提出了比以往任何时候都更有效地衡量两个实体的相似性由隶属函数值。它首先利用模糊隶属函数模型两个实体的相似向量空间,然后用余弦函数计算语义距离。书目数据的测试用例提供的本体一致性评估计划(OAEI)和六个传感器本体匹配任务是用来评估我们的方案的性能实验。该方法的鲁棒性和有效性,证明了通过比较先进的本体匹配技术。
1。介绍
研究下一代工业物联网时代(Nx-IIoT),网络技术与智能计算已经成为一个巨大的技术模型为政府建立一个智能的世界(1,2]。物联网的安全问题(物联网)也引发了关注研究滚滚而来。特别是,熊等。3)提出了一个LightPrivacy计划实现用户的个性化隐私保护之间的权衡和任务数据的可用性在移动集团意识,其计算效率显著提高。之后,他们进一步提出ATG框架,既有效和高效,适用于物联网移动边缘人群传感(mec) [4]。最近,林等。5)提出了一种蚁群优化(ACO)方法来保护交易信息的删除,这可以减少副作用,同时保持整体的计算成本低。以这种方式,大量的物理对象嵌入与传感器设备交换信息通过异构网络在不同的应用,如智能电网、电子医疗、智能城市(6- - - - - -10]。聚合系统有效的信息,他们的实体应该能够以有意义的方式相互作用,没有特殊的努力,人类或机器。值得一提的是,许多不同的传感器数据管理应用程序框架提出了团结和传感器。同时,增值空间数据源提供的信息对于公共应用程序,包括传感器网络,如全球传感器网络(https://gsn.sourceforge.net/)、沙漏(https://www.eecs.harvard.edu/∼席拉/沙漏)和IrisNet (https://www.intel-iris.net/)。然而,不同传感器网络的异质性导致缺乏互操作性。因此,构建一个安全的Nx-IIoT,骨料的异构传感器数据在不同的传感器网络是突出。
具体来说,有两个方面的工作要做;一是提高传感器网络模型的表达能力,另一个是提高传感器网络之间的交互来实现数据集成。地址第一个方面,越来越多的传感器本体出现由于传感器本体技术的优势,能够模型相应的网络整体。和解决其他方面,本体匹配技术近年来一直在历史的舞台上。此外,该领域的前沿研究机构之一,是本体一致性评估计划(OAEI) (https://oaei.ontologymatching.org/)。最近,本体定位提取技术已经被用于加强团队。推进相关工作,我们提出一个传感器本体匹配机制与基于模糊辩论机制(FDM)本体定位提取技术,旨在提取正确的传感器本体匹配的成对的不同排列所产生的不同的基本匹配措施。具体而言,我们首先表达两个传感器之间的相似度的三维向量空间中的实体通过一个模糊隶属函数,然后在多个维度和评价相似余弦定理介绍评估相似向量的距离和黄金。
下面的章节安排如下。部分2概述相关的工作。第三节提出了一个初步分析的相关概念。提供FDM的细节第四节。第五节具体化的实验结果并进行相应的分析,第六节总结了工作。
2。相关工作
越来越多的传感器本体出现由于传感器本体具有强大的传感器网络模型的表达能力,即。SensorOntology 2009本体,SSN本体和本体IoT-Lite等等(11- - - - - -13]。和提高传感器网络之间的交互来实现数据集成,传感器本体匹配技术带来了这些年来(14]。
的研究热潮,有两种技术路线:本体元匹配(石)技术和本体实体匹配技术。本体实体匹配技术来确定实体直接对应设置两个本体之间,虽然石技术试图解决总问题的不同的相似性措施以适当的权重15]。有很多受欢迎的技术方法计算智能(CI)解决石问题,例如,机器学习(ML),进化计算(EC)和群体智慧(SI)。例如,许多毫升技术(16- - - - - -21]提出了自动确定本体对齐,和实验表明,毫升大大提高匹配效率,和遗传学本体定位(目标),设计优化总重量设置为不同的匹配器(22- - - - - -25]。克服的缺点过度依赖参考对齐、雪等人提出了部分参考对齐(PRA)和一致的改善速度(国关)26]。此外,雪等人提出了一系列的解决方案使用紧凑算法(CA)和传感器本体元匹配技术总重量设置为不同的匹配器(27]。
然而,在现有的基于词的本体匹配方法,各种本体匹配器被视为工具用同样的效果,总输出通过确定最优权重(28]。匹配的质量会降低如果忽略的影响不同的实体映射不同的匹配设备的匹配结果。此外,用这种方法调整权重可以有问题;这意味着他们可能不是可重用在不同的本体匹配的场景。因此,实体映射对匹配结果的影响不容忽视,这是解决本体定位提取技术(29日]。最近,上下文中提取技术已经广泛应用于语义场(26,30.),OntoLT使用术语提取、本体结构映射,统计方法,定义提取本体概念的语言模型31日]。此外,盖塔等人实施一些统计和数据挖掘算法来识别和提取本体的概念以及它们的关系(32]。此外,提取过程的规则通常被描述为一系列的协议实现过程,如论证框架(33]。具体而言,Laera等人提出的论证框架依赖偏好之间的一个正式的参数操作模式和一个特定类型的参数,考虑基于本体的论点和主张特定匹配任务(34]。多斯桑托斯和Euzenat论证作为支持或拒绝参数,提出了一种计算策略来消除不一致结果校准和允许论证系统的一致性(35]。
值得一提的是,本体的相似性匹配和实体之间的关系和相似性阈值都可以视为不确定的问题,在模糊逻辑是高度熟练的36]。在的建议37),本体匹配概念或模糊集表示的参考实例,使新本体是直接与原来的相比。托多罗夫等人提出了一种模糊本体对齐使用背景知识(38]。UFOM采用模糊集理论的模糊本体匹配的一般框架,代表了许多类型的通讯和描述的不确定性在通信的过程中发现(39]。和交叉讨论如何扩展本体概念匹配的过程通过使用相似性度量和集成的模糊集(40]。
3所示。问题定义
3.1。传感器本体
本体是由概念集、属性集,和实例集,和本体指的是三元组 ,其中 , 引用概念集,属性的数据类型和属性的对象,分别称为本体实体。语义传感器网络(SSN) (https://purl.oclc.org/NET/ssnx/ssn本体可以被视为权威的祖先传感器本体(41]。它是一个OWL 2本体语义传感器网络由W3C提出孵化器集团(SSN-XG) (https://www.w3.org/2005/Incubator/ssn),该模型传感器观测数据和代表传感器按照功能,测量过程,观测数据等等。SensorOntology 2009 (https://www.w3.org/2005/Incubator/ssn/wiki/SensorOntology2009)本体由迈克尔·康普顿,即。,from CSIRO (Australia) has come into use as the source of the SSN Ontology. And OSSN (https://www.w3.org/ns/ssn)是一种本体由SSN-XG建立在从2009年到2011年42]。此外,资源、实体和服务物联网(物联网)由IoT-Lite总结(https://www.w3.org/Submission/2015/SUBM-iot-lite-20151126/)本体轮廓,这是一个轻量级本体和案例的SSN本体和2015年最新版本提交43]。传感器、观测、样本和致动器(索萨)(https://www.w3.org/ns/sosa)本体是专为一个广泛的目标受众和应用程序访问本体和在2017年被释放。此外,索萨作为最小互操作性回退层;即,它定义的公共类和属性数据可以安全地SSN之间交换,它的模块,和索萨所使用的所有信息。
3.2。本体匹配和传感器本体定位提取
本体匹配的过程确定实体之间的通信源本体和目标本体之间的语义鸿沟。如图1本体匹配过程的输入是一对本体匹配,并输出最终对准。本体匹配的研究主要包括相似性度量的计算和细化,但研究提取的最终对准相似性度量矩阵,即本体定位提取技术,降低了。
具体而言,传感器本体定位提取技术提取实体对应的作品从不同的匹配建议产生不同的相似性措施相同的传感器本体匹配任务,形成最终的定位(28]。本体的框架对齐提取如图1,系统完成匹配工作被视为本体匹配器。实体集的对应关系由本体匹配器叫做本体对齐。此外,相应的设置两个传感器本体之间的对齐,实体间的通信是指4-tuple , 和分别是两个本体的实体,然后呢 是他们的信心值,而作为等价关系。
3.3。模糊相似度测量
因为一些无线传感器网络(WSN)领域概念尚未纳入一个共同的字典,没有词汇工具来定义语言映射的所有概念之间的关系的目的。征服困难,我们建议使用多种度量相似度的计算工具。每个工具提供了不同的匹配的建议;实体之间的匹配结果变得不确定的信息。在这种情况下,一个统一的框架,代表了许多不同的模式的使用提供的不确定信息是模糊测度来描述不确定的信息(44]。出于这个原因,我们决定使用模糊化过程结合他们更准确的定位。换句话说,采用模糊相似度测量的工作这是辅以两部分;一个是基本的相似性度量,也称为实体匹配测量(EMM),另一个是隶属函数的模糊化。
电解加工一个总是被描述为函数的输出值和两个实体的信息作为输入区间[0,1],它总是扮演的角色基本本体匹配器。电解加工可以分为三种类型:一是基于字符串类型,第二个是基于语言学的类型,第三个叫taxonomy-based电解加工。
电解加工一个基于字符串输出实体之间的编辑距离,考虑他们的id、标签、评论,等等。在这个工作中,两个著名EMMs被用来提高匹配结果的质量,也就是说,Levenshtein相似(45)和Jaro相似性度量(46]。鉴于两个字符串,和 ,Levenshtein-similarity定义如下: 在哪里和分别是se1and的长度吗 ; 所需的操作转换的数量吗来 ;考虑到字符串和 ,定义作为一个性格普遍在 ;也就是说,他们出现在相同的顺序和 。类似的定义在 。现在,假设和是调换位置当他们的th位不一样的价值50%的互换吗和在数量上。根据上述假设,Jaro相似性度量的和定义如下:
基于语言学EMMs经常使用外部文集或字典(例如,WordNet [47通过实体标记])来计算相似度值。因为WordNet的有效性,我们使用WordNet-based距离。此外,基于距离WordNet-based WordNet电子词汇,方程定义如下: 在哪里和这一词源于两个实体和吗表示词的数量的含义。
相似性值taxonomy-based EMMs是基于获得的实体结构信息的考虑以及superentity和subentity信息。具体而言,在我们的提议,电解加工taxonomy-based利用基于结构的距离计算指出算法,采用一个通用的图像匹配方法称为相似洪水(SF) [48),一个迭代fixpoint计算下面是应用于生产的关系这两个本体的元素:
在这个公式,是规范化的过程,的值是最后的迭代,每个迭代的变化,然后呢是一个函数的增加对元素的相似性基于相邻元素的相似性。
模糊相似度度量应用程序过程的流程图如图2。在预处理一般包括工作转换本体和本体论分析格式。和相似矩阵产生的四个主要本文采取类似的措施。通常,匹配器决定通过比较两个实体是正确的匹配相似度值的阈值。但是很难找到一个精确的阈值,使匹配结果完全正确。因此,我们引入隶属函数的模糊理论并考虑相似值从“低”,“媒介,”和“高”维度。模糊过程变化相似矩阵中的元素,改变成向量通过隶属函数之前参与辩论机制。在这部作品中,成员函数模糊的过程被定义为三个子功能如下: 在哪里相似矩阵的一个元素,代表相似吗 。根据之前的实践经验,我们相信匹配对相似度小于0.7大多不匹配,和0.5是相似的中等相似区间[0,1][28]。因此,用于测量低程度的相似性。描述的程度中等大小,然后使用正比例函数来描述高相似度的 。之后,我们以三个函数值为坐标的三维向量和输入到辩论机制。
4所示。辩论机制
在这个工作中,本体定位提取工艺进行辩论机制,利用辩论规则的提取目标信息。通讯的辩论机制包含一个分类模块,来构建一个模糊测度来表达对应的相似之处,和一个论证框架,用于不同的匹配器之间匹配的建议达成协议进行谈判。此外,构建模糊测度来表达相似的对应关系如图3描述了框架机制的讨论。
分类模块和论证框架描述在接下来的段落。
在分类模块中,假设一个匹配的任务是在两个本体,和 ,通过 基本本体匹配器。扩展一个实体对应一个本体匹配器作为参数 ,这是定义如下: 在哪里 , ( ),和( ),分别表示对应,人为预设匹配器的数字,和相似性的衡量因素值。
假定参考向量 ;改变相似度值到相似模糊向量 在向量空间。然后,我们描述如下: 在哪里是一个模糊向量和的相似之处吗 设置相似的阈值。特别是,而 ,匹配器拒绝 ;否则,它接受它。假设是分配给一个五组 ,,分别定义如下: 是匹配器的数量,匹配器的数量接受吗 , 拒绝是匹配器的数量吗 , 。接下来,分类入组来根据上述情况在类别列。详细的分类,见表1。
自 被认为是一个正确的通信由所有的匹配器,接受吗 被拒绝在相反的位置,组的对应关系和直接判断为正确的通讯或虚假的提取过程中不参与下面的过程。此外,通讯 , ,和组列表的论证过程。
在论证的过程中,两个参数给出 和 。四个定义之间的关系和 ,这是 , , ,和 。具体而言,被标记为 ,和 ,支持和证明表示为 , ,和 。细节列出如下描述:(我)当 , 是美国 ,表示为 。(2)当 , 攻击 ,表示为 。(3)当 或 , , , ,或者当 , , , 支持 ,这是由 。(iv)当 , , , ,或者当 , , , , 否定了 ,这被描绘成 。
这四个参数是描绘在图之间的关系4。有三匹配器,即 , ,和包括他们的论点 , ,和 。 和从不同的匹配器之间发生争论,但是和相同的一个。
7-tuple参数集的定义是: ,在哪里 , , , 上面提到的关系, 被定义为的匹配器集包含吗基本本体匹配器,论点与通信 ,和一个nd作为力量的价值根据一个匹配器 ,这是定义如下:
在这篇文章中,是每一个基本的元素对应的参数现有的本体匹配器,我们需要计算它的判断因素呢 论证过程中,其价值决定是否可以提取到最终的对齐。因此,一个基本的挑战是提高可靠性的一个实体映射元素的判断。应对这一挑战,定义公式(9),每匹配器的正确性的因素是用来评估匹配器的可信度取决于是多么相似匹配推荐其他的匹配器。和支持力量和反驳的力量在辩论过程中利用提供的证据是正确的映射。此外,全面评估后可以获得上面提到的因素。
具体而言,论证过程安排如下:步骤1。很显然,是(或 )当属于(或 ),和相应的行和列的相似度值可以删除的相似性矩阵。步骤2。匹配器计算的正确性的因素在以下: 步骤3。在每一个匹配器,辩论过程提出了按照关系””和“”:(1)在组,大多数匹配器支持这些通讯。因此,成功击败了证伪的支承部分计算部分。上述情况说明如下。支持的力量的匹配器定义如下: 在论证 ,论点 , , 和 。当三匹配器 , ,和支持但否定了它,它是确定可以之间建立映射和当 , 和 ,和设置为1。否则,转换成 ,执行步骤4。(2)以类似的方式,组参数,需要计算的攻击是否反对与支持是成功的。假设匹配器力量的证明定义如下: 在论证 ,论点 , , 和 。在这种情况下,如果三匹配器 , ,和反驳 ,但支持,很明显,不能之间建立映射和当 , 和 ,和 。否则,转化为组。步骤4。的参数组,匹配器的相反的观点几乎是偶数,因为他们可以分为两方和 。因此,的核心挑战是找出哪些两党成功地击败其他。结束这力量每一方计算,定义如下: 在哪里 是党的成员。假设 ,如果 , 。否则, 。第5步。选择对应的 ,这是进一步用于决定最终的对齐。
5。实验和结果
5.1。一致性评价指标
对齐通常可以评估有两个措施,通常被称为和(49),各自统治在以下: 给出的对齐在哪里吗 ,和参考对齐 。特别是, 当发现所有正确的匹配对, 。和 代表所有匹配对发现是正确的。为了把这两个指标,进一步使用,被认为是全面衡量的和(38]:
5.2。实验测试用例
在这个实验中,我们利用书目记录的测试用例(https://oaei.ontologymatching.org/2016/results/benchmarks/index.html)从OAEI以及六对真正的传感器本体匹配任务来验证我们的敏感性和可用性的建议。表2显示了一个简单描述OAEI书目记录的两个本体映射和引用一致性评估的有效性包括本体匹配器,每个测试用例。表3描述了传感器本体的主要特点。
在这个实验中,相似度阈值,根据经验设置为0.85,平均一致性保证最高质量的实现在所有测试用例。
5.3。实验结果
从书目记录在执行测试用例,我们比较的结果我们的建议与OAEI的参与者,即。AML,埃德娜,LogMapLt从的角度 。图5显示了所有类型的测试实验结果OAEI书目记录的病例。
可以看到从图的表示信息5,对于大多数测试的情况下,我们的提议表现优于其他方法由于辩论机制的应用,集成了各种基本的相似性措施的优点;匹配的问题可以从不同的角度综合考虑本体匹配。在某些情况下,为所有匹配技术几乎是零,这是由于复杂的测试用例。相比之下,我们的建议是一个更好的工作在这些情况下表中列出4面具向前一小步,我们的建议的基础上尖端的工作。
当执行传感器本体匹配任务,我们比较我们的建议的结果与上面提到的四个基本电解加工,即。、Levenshtein-similarity Jaro相似性度量,WordNet-based距离和相似性洪水的 , ,和 。
图6描述了我们方案的结果匹配六对真正的用四个基本EMMs传感器本体和比较他们,结果显示我们的建议通常与黄金对齐达到非常高的能力。此外,应用模糊测量扩展了一维评价相似之处从基本相似措施三维评估,这充分表达了相似度以获得高质量的一致性。
总之,FDM可以显著提高搜索结果的准确性,同时确保高召回率,在各种各样的匹配任务优于其他竞争对手。
6。结论
不同传感器本体之间的语义连接对Nx-IIoT具有重要意义的通信质量和信息安全50]。因此,传感器本体聚合方法基于模糊辩论机制,提出了中提取不同实体之间的终极对齐进行参数匹配措施。模糊相似性度量提出了提高对准的质量,这两个实体模型的相似度向量空间和语义距离计算通过使用余弦函数。OAEI和五个真正的传感器提供的书目追踪本体是用来计算这个实验方法的性能。与最先进的本体匹配技术和四个基本本体匹配器,验证我们的建议的鲁棒性和有效性。
展望未来,传感器本体定位提取技术有两个挑战:一个是衡量实体相似,另一个是如何开发提取规则调整对齐的质量。在一方面,我们需要进一步创新适应其特定领域的本体的相似性测量细粒度和复杂的结构。在另一方面,有需要可以处理这个问题的方法匹配过程中产生的不确定性。(50]。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突的工作。
确认
这项工作得到了福建省自然科学基金(2020号j01875)和中国国家自然科学基金(号。61773415,61801527,61103143)。