研究文章|开放获取
泽克莎米拉·Ghayekhloo Bayram, ”语义Web服务发现的前置过滤策略来提高性能”,科学的规划, 卷。2015年, 文章的ID576463年, 15 页面, 2015年。 https://doi.org/10.1155/2015/576463
语义Web服务发现的前置过滤策略来提高性能
文摘
发现语义Web服务是一个重量级的任务当Web服务的数量或本体的复杂性增加。发现在这篇文章中,我们提出一个新的逻辑框架基于语义描述Web服务的功能和使用F-logic用户目标。我们的框架解决可伸缩性问题,提高发现性能通过添加两个前置过滤阶段发现引擎。第一阶段是基于本体的比较用户请求和Web服务类别。在第二阶段,更多的Web服务是消除基于分解和分析的概念和实例属性用于Web服务功能和客户端所请求的功能,导致更少的Web服务需要匹配的客户端请求。我们的前置过滤方法是评估使用新的Web服务存储库,叫做WSMO-FL测试集合。过滤过程的召回率是100%设计,由于没有相关的Web服务是消除两个前置过滤阶段,和实验结果表明,精确率超过53%。
1。介绍
语义网的研究一直是一个热门话题引入以来,伯纳斯·李等人(2001年1]。基于这个想法,在互联网上许多任务自动化是通过添加Web资源的机器可以理解的语义信息。例如,自动发现Web服务的基于Web服务的功能及组成,不能满足用户请求单独成为可能(2]。
近年来,复杂的概念模型(例如,WSMO [3后)和owl - s (4])Web服务的语义描述,以及越来越多的广告服务存储库使语义Web服务发现过程的一个重量级任务(5]。为了解决可伸缩性的问题,研究者提出了各种方法,比如索引和缓存机制(6),预处理策略在实际匹配(7,8],媒人混合体,逻辑和non-logic-based推理(9,10]。
本文提出了一种新的逻辑框架和两个前置过滤策略来提高自动化Web服务发现的速度和准确度。我们发现框架是基于WSMO概念模型的语义描述用户请求(目标)、Web服务和领域本体。在发现过程中,目标功能描述如输入、输出、先决条件和后置条件(影响)与广告相比,Web服务能力描述,以确定他们是否匹配。逻辑推理是用于匹配,保证能力要求的目标确实是满足功能的Web服务和Web服务也都需要在开始执行。能力目标和广告服务的推理依赖于本体是用于描述服务和目标,也描述了常见的词汇和目标所需的服务。
我们两个前置过滤阶段是用来消除Web服务可能不能成功匹配和减少Web服务的数量,通过基于逻辑匹配阶段。我们的第一个前置过滤阶段使用一个Web服务的分类方案。第二个前置过滤阶段使用一项新技术提取对象的属性和概念用于目标和Web服务前置和后置条件。我们的技术可以处理发生的对象和谓词逻辑公式和逻辑操作符一起使用。我们还利用基于本体的概念和属性之间的中介,这样两个语法不同的符号可能会宣布表示相同的语义。
本文的其余部分组织如下。部分2礼物WSMO背景信息模型、F-Logic FLORA-2,我们发现逻辑框架。节3,F-Logic规范化的目标和Web服务描述。部分4描述我们的预处理算法和显示它们如何工作以减少运行时处理需求在匹配阶段。部分5实验结果显示利用我们提出的算法,以及这些结果的评价。节6在这个领域我们简要描述相关的作品,最后在部分7我们的结论和未来的工作。
2。背景
我们的语义Web服务发现框架侧重于Web服务,目标,本体,和语义描述基于WSMO中介(11)模型和使用F-Logic [12)语言作为实现FLORA-2 (13逻辑系统。下面的内容将简要介绍WSMO及其核心元素,F-Logic及其reasoner FLORA-2和逻辑语义Web服务发现框架。
2.1。WSMO定义
Web服务语义描述通过提供一个高水平的声明性规范的Web服务的功能和非功能属性以便于自动发现、组合和调用Web服务。两个著名的模型在语义Web服务描述Web服务模型本体(WSMO) [3后服务)和Web本体语言(owl - s) (4]。还存在其他特殊目的语言的语义描述Web服务,如黛安娜服务描述(DSD)语言(14WSDL和XML模式)和语义注释(——SAWSDL) (15]。
WSMO包括四个核心要素,即本体,目标,Web服务和中介。本体被定义为一个正式的、共享的概念化的明确的规范(16]。本体在语义Web服务的背景下,提供了一个公共的词汇表来表示类型的类或概念、属性和关系的概念域。目标描述了请求者可以提供,预计从Web服务。Web服务代表不同的功能和非功能特性描述部署Web服务。最后,中介处理目标之间可能出现的异构问题,Web服务和本体。
2.2。F-Logic和FLORA-2
F-Logic(框架逻辑)是一个强大的逻辑语言与对象建模能力。它是作为面向对象的逻辑编程和知识表示的基础。两个流行的推理者F-Logic FLORA-2和OntoBroker17]。我们提出了语义Web服务发现使用智能代理FLORA-2推理引擎。FLORA-2被认为是一个全面的基于对象的知识表示和推理平台。FLORA-2的实现是基于一组运行时库和一个编译器,将一个统一的语言F-Logic [12],HiLog [18),和事务逻辑19,20.)提出了Prolog代码(13]。基本上,FLORA-2支持的编程语言的方言F-Logic包括许多扩展,涉及到自然方法元编程风格的HiLog,逻辑更新事务逻辑的风格,和可废止的推理中所描述的一种形式21]。
2.3。我们的逻辑语义Web服务发现框架
一般来说,Web服务发现是找到适当的Web服务的过程对用户请求和发现服务的排名基于用户偏好。我们发现框架接收WSMO目标Web服务描述,描述和WSMO F-Logic编码,连同相关介质和本体作为输入为每个目标实体和返回一个有序列表的Web服务可以满足需求的目标。
图1描述了我们的发现的体系结构框架。框架包括四个阶段:(i)的创建和维护目标和Web服务以及相关领域本体和介质,(ii)前置过滤阶段,(3)媒人,排名(iv)阶段。在创建和维护阶段,指定Web服务和目标描述基于我们修改WSMO模型,以及领域本体和介质存储在不同的存储库。在前置过滤阶段,对于一个给定的目标,广告过滤Web服务是在两个步骤以缩小的Web服务的列表,可以可能的匹配目标,其余的Web服务被考虑淘汰。在媒人阶段,逻辑媒人检查是否每个过滤Web服务能真正执行的方式,这样用户才能达到目的。最后,排名阶段返回列表匹配的Web服务基于用户偏好的最小化一些数值结果(例如,两个城市之间的飞行成本)。
本文的焦点是小说过滤策略,我们详细解释部分4。在这里我们简要描述逻辑媒人机制。
我们的逻辑媒人算法利用目标的先决条件和后置条件和Web服务,以及相关领域本体和介质进口的服务描述。(即证明承诺。,what must be proven before a match can succeed) required for our logical inference based matching are given as follows:(1)安大略省的∧中介∧Goal.Pre Ws.pre:Web服务的先决条件(Ws.Pre)应由进口本体,逻辑上引起介质,提供担保的/目标是什么(前提Goal.Pre)。(2)安大略省的∧中介∧Goal.Pre∧(Ws.pre⇒Ws.post) Goal.post如果Web服务的后置条件是满意,然后目标应该是满足的需求。注意我们假设Web服务的执行担保的有效性的含义Ws.pre⇒Ws.post。
3所示。Web服务和F-Logic目标规范
在清单1,2,3我们的元级别的概念定义WSMO (11),与几个增强。清单1包含目标概念的实例,用于指定用户的请求。它有非功能属性的属性(如服务质量、响应时间、和安全性),类别信息(如交通、教育、和食品),本体需要咨询包含特定信息领域(例如,航班信息本体和地理信息本体),中介信息(本体处理差异的定义等价类的术语和它们之间的关系),能力需要从Web服务,Web服务的接口要求(即。编制和编排)。的hasCategory属性已经在我们的框架,以新引入的基于类别允许过滤。
|
||||||||||||||||
|
||||||||||||||||||
|
||||||||||||||||||||
的服务概念给出了清单2几乎是一致的吗目标的概念。它的两个差异如下:(i)指定提供能力,而不是要求能力,(2)它有一个额外的属性otherSource(不是在原始WSMO规范),列出了概念,应该排除在考虑在过滤阶段,自上市的对象实例的概念应该来自其他来源,如进口本体,没有目标。
清单3的定义是什么能力的概念。非功能属性的属性,进口本体,介质使用,前提,假设,后置条件,效果,优化。的优化属性允许用户指定Web服务返回的发现引擎优化对一些测量(例如,机票价格)和是一个增强的原始WSMO规范。
当功能对象是一个目标的一部分,前提是嵌入对象的结合F-logic分子的形式指定提供的信息请求到Web服务,和后置条件是一个逻辑表达式包含嵌入对象的可能,谓词,结合,分离,否定运营商。所有逻辑变量在一个后置条件是隐式的存在量化目标。
然而,在一个Web服务规范,前提是一个逻辑表达式可能包含嵌入对象的形式F-Logic分子,谓词,结合,分离,和否定算子,所有逻辑变量存在量化和后置条件是一个结合嵌入对象的指定Web服务的请求者所提供的信息是Web服务执行的结果。注意目标后置条件之间的相似之处和Web服务的先决条件,以及目标Web服务前提条件和后置条件。
上市4和5显示一个目标的主要部分和一个Web服务规范,分别可用在各种类型的目标在我们的库和Web服务。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
清单4描述了能力目标实例的描述,它属于AirTransportation类别和描述要求机票从柏林到伊斯坦布尔和指定用户想要的Sabiha_Gokcen目的地机场。请求者还要求航班的总成本低于500美元2人,和每个返回的航班必须有最低成本在所有其他相关航班。注意逻辑变量开始”?”的象征。
清单5描述能力和分类描述的一部分在我们的Web服务存储库Web服务实例。属于Web服务实例PlaneTransportation类别和为用户提供预订的机票航班从一个地方到另一个请求。这个Web服务要求源和目的地城市,期望的出发和到达的日期,和数量的人想预定这个航班,咨询两个本体包含航班信息(FlightInfo_ont)和地理信息(Geographical_ont),并返回匹配的航班列表命令根据最低成本。前提需要两个对象,一个来自目标(的实例RequestFlightTicket)和一个来自导入本体的实例飞行)。谓词乘增加其第一和第二参数并结合其第三个参数结果。它是用户定义的。
4所示。提出了两阶段前置过滤机制
我们提出解决可伸缩性问题的解决方案通过添加两个前置过滤阶段之前的逻辑媒人阶段我们发现框架。我们称这两个预处理算法,提供不同的过滤级别,Category_based过滤(Cat_Filt)和Capability_based过滤(Cap_Filt)。
我们的算法执行预处理降低服务匹配的输入数据,以便匹配过程更加简化;只有逻辑推理对Web服务对我们的目标是真正重要的。
这些预处理步骤是通过主谓词执行% filterMain在清单6。输出这个谓词列表的目标和相关的Web服务被插入到知识库RelatedGoalWsModule为后续逻辑媒人阶段。清单6显示了两个谓词的过滤阶段。
|
||||||||||||||||||||||||||
促进理解的代码,让我们给予简要介绍面向对象表示法用于FLORA-2。假设O和C是两个对象。O: C意味着O C的一个实例(在FLORA-2,一个对象可以同时是一个类)。C:: D意味着C D的一个子类也为用户定义的平等,假设O1、O2是不同的名字(称为id-terms FLORA-2术语),应该表示同一个对象。这一事实是与符号FLORA-2 O1群:=: O2。这个工具允许用户状态两种语法不同(通常nonunifiable)术语表示相同的对象,可用于定义这些术语之间的同义。
对于每一对goal-Web服务来说,第一阶段,Cat_Filt,使用Global_Cat_Ont检查的语义相似度目标分类()对Web服务类别()。根据清单6线(4),如果和是相等的,同义词,或在一个继承关系,为下一阶段保存Web服务;否则它就会被丢弃。在第二阶段,Cap_Filt首先利用对象的属性和概念的目标和Web服务前置和后置条件是由我们的新算法(提取中所描述的部分4所示。2)。然后,提取的概念和属性,以及我们的基于本体的中介是用于选择Web服务,满足下列条件。
(我)他们的前提概念和属性的一个子集,等于或目标前提的同义词的概念和属性,和(2)后置条件的概念和属性的超集,等于或目标后置条件的同义词的概念和属性。每个目标然后逻辑检测精确匹配,只有生存两阶段过滤过程的Web服务。
我们目前的计划Cap_Filt处理逻辑表达式只涉及联合运营商积极分子,谓词。我们应当考虑扩展的方案来处理任何逻辑表达式涉及否定和析取运算符以及结合运营商的未来工作。
在下面几节中,我们详细描述了两个过滤阶段。
4.1。根据类别过滤(Cat_Filt)
的Cat_Filt阶段过滤器原始Web服务存储库中定义根据指定的类别和同义词Global_Cat_Ont本体。图2说明了我们指定域层次结构的一部分Global_Cat_Ont目前包含的三大类运输,食物,和教育。
Global_Cat_Ont既包含结构(即知识。,it defines subclass and superclass relationships between concepts of three specified domains) and a dictionary of synonymous concepts.
公式1如何抽象的定义Cat_Filt一个函数的形式,一个目标作为参数。在这里,和代表目标实例和Web服务实例,分别Web服务存储库中。函数的结果是三组的结合:(i)如果目标指定一个类别(广告),Web服务在注册表中类别匹配目标的类别,(ii) Web服务没有类别指定,和(3)所有Web服务中没有指定类别的目标。这个定义保证如果有任何Web服务匹配目标的可能性,这是从来没有考虑下一阶段淘汰。
|
||||||||||||||
为了更好地说明先前的定义,考虑一个场景:一个用户正在寻找一个飞行中查找服务存储库中描述现有的Web服务。假设目标类别PlaneTransportationWeb服务和类别的广告AeroplaneTransportation,铁路运输,和AirTransportation连续。的结果Cat_Filt基于Global_Cat_Ont本体中所描绘的场景描述表1。
|
|||||||||||||||||||||||
根据概念定义的关系Global_Cat_Ont本体,猫佤邦,AeroplaneTransportation的同义词PlaneTransportation和猫WC,AirTransportation的一个子类PlaneTransportation。因此,Web服务和C仍然作为输入Cap_Filt和Web服务(B)被丢弃无关紧要。
的结果Cat_Filt阶段是进入第二阶段Cap_Filt为了消除更多的Web服务不可能是匹配给定的目标。
4.2。根据功能分解过滤(Cap_Filt)
不像其他建议中提到的相关工作,我们的Cap_Filt算法消除了不相关的Web服务基于检查对象的属性和概念用于目标和Web服务前置和后置条件。该算法首先提取对象的属性和概念目标和Web服务规范(它可以处理谓词和对象一起出现在一个逻辑公式可能包括逻辑连接),然后分析提取属性和概念之间语义等价为了过滤掉不相关的Web服务。
水平的相似性等参数得到基于层次关系在这个本体。这项工作水平之间的语义相似度参数被定义为确切的,插件,包含,和失败。确切的意味着两个概念或两个属性完全相同的相同的领域本体。两个概念或两个属性的相似度插件只有在概念的目标要求是超类或属性或属性概念的Web服务。度两个概念两个属性包含只有目标的请求是子类的概念或属性或属性概念的Web服务。最后失败度表示,没有基于语义两个概念或两个属性之间的关系。
同样,我们的工作,为了获得更精确的结果和解决这个问题,两个概念或两个属性将会调查可能不是相同的语法,使用WordNet [28),一个字典的同义字。因此,同义词之间的相似目标和Web服务的参数Cap-Filt算法计算通过使用WordNet [29日)在线同义词词典。
作为上述定义的例子,考虑一个匹配目标的实例和Web服务中定义的部分3。我们的目标的概念和属性列表和Web服务前提条件如表所示2。
|
||||||||||||||
因为它是表所示2,originateCity和startCity是第一个属性的前提和目标Web服务的先决条件,分别。虽然这两个属性的拼写都是不同的,他们在领域本体可能没有任何关系,他们有相同的意义。我们的方法解决这个问题,考虑了属性相似的字典同义字。我们采用语义和同义相等的前置和后置条件。
清单7描绘了的关键部分% Filter_Cap谓词。过滤,基于对象的概念和属性功能规范的Web服务和目标,以以下方式进行:(1)线(2)(7)阅读目标和Web服务前置和后置条件从各自的模块。(2)检查的过程中语义和同义词相似的目标和完成Web服务规范知识库模块(GoalWsAttModule),在清单7线(8)、属性和概念的前提是插入到目标GoalWsAttModule通过% FindGoalOrWsAtt / 2谓词。(3)Web服务的属性和概念前提条件是通过提取% DC / 2谓词。这个事务谓词分解一个Web服务的先决条件,然后提取的概念和属性存储在不同的列表。清单7(9)描述了这个谓词参数的调用WsPre ?(绑定到一个前提)和Ws_Pre_Att_Cnp ?(一个自由变量)。的结果,Ws_Pre_Att_Cnp ?被绑定到的概念和相应的属性列表Web服务的先决条件。(4)最后,线(10)描述% Check_Att_Cnp谓词实现算法1。比较概念和属性与目标相关的先决条件与Web服务相关的概念和属性基于它们之间的语义等价的前提条件。输出相关Web服务的名称,其概念和属性存在于请求的目标,如下解释。Web服务名称,通过这种级别的过滤存储在知识库中FilteredWsModule。
|
||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
比较目标和Web服务后置条件相似的先决条件,除了一些谓词参数的变化。(5)因为它是线(清单11)所示7知识库的内容GoalWsAttModule已经由目标前提的属性和概念是抹去以被替换为新的数据。(6)Web服务的属性和概念后置条件是进入GoalWsAttModule通过% FindGoalOrWsAtt谓词(清单12)7。(7)属性和目标后置条件是通过提取的概念% DC / 2谓词,结果存储在Goal_Post_Att_Cnp ?变量是线(13)所示。(8)(14),类似于行(10),% Check_Att_Cnp谓词实现算法1。但这次检查的概念和属性与Web服务相关的后置条件与目标相关的概念和属性后置条件基于语义等价。
如果所有这些检查成功,然后对目标Web服务及其相关的插入到知识库,以便全面检查证明承诺可以进行下一阶段了。
5。实验结果和讨论
合适的测试集合是必要的,以评估服务发现框架的适用性和性能。目前,两个实际测试集合OWLS-TC [30.]和SAWSDL-TC [31日]。OWLS-TC,主要考虑输入和输出参数,适用于后方法处理owl - s Web服务描述和方法Web服务描述使用雇佣——SAWSDL SAWSDL-TC测试集合。
OWLS-TC的最新版本是version 4 (32];它由1083个Web服务和42查询后写在owl - s语言。不幸的是,大多数OWLS-TC只是部分被描述的Web服务是基于输入和输出类型。仅在过去的版本(版本4),160年Web服务包含前置条件和后置条件(影响)等不同的语言描述SWRL (SWRL:语义Web的规则语言,33])和PDDL(国际规划大赛,34])。
SAWSDL-TC测试集合建立支持绩效评估——SAWSDL媒人。SAWSDL-TC的最新版本,在这个时候,版本3;它由1080个语义Web服务和42查询——SAWSDL所描述的语言。然而,Web服务的描述和查询只是基于输入和输出参数(35]。
大多数的方法(如[7,9,23- - - - - -26]),在我们的工作领域和中提到的相关评估工作的效率和准确性的工作基于OWLS-TC版本3测试集合。在所有相关的作品,作者的36)评估他们的建议基于OWLS-TC测试集合的最后版本,但只对输入和输出参数的评估他们的工作。
因此,由于没有一个适当的测试集合覆盖等主要功能描述Web服务的前提条件和后置条件,以及Web服务的分类方案,我们生成自己的测试Web服务的集合/目标规范和使用这个测试收集测量获得的收益效率采用我们提出前置过滤策略。我们叫我们的测试集合WSMO-FL(37]。
WSMO-FL包含三个不同的领域,即交通、食物、和教育,与250年不同F-Logic Web服务描述,6种F-Logic目标描述,22日的概念,和1225年的实例。
在本节中,为了验证我们的建议,我们进行实验评估描述和实验研究的结果。进行分析,每个测试运行20倍的机器上执行与Windows 7, 2.93 GHz的英特尔处理器,4.00 GB的内存。
为了确定实际的改进提出了前置过滤阶段,我们测量几个指标:(i)的平均响应时间与过滤我们的语义Web服务媒人(Filt_Disc),没有过滤(Naive_Disc),(2)Web服务的数量,有效地消除了从最初的可用Web服务在每一个前置过滤阶段,(3)精度和召回(iv)。因为我们不会排除任何Web服务从过滤阶段考虑,除非他们是肯定不能在逻辑匹配阶段,也就不足为奇了,召回率总是100%。
执行测试的结果给出了目标表3,显示时间的均值和中位数对不同数量的匹配目标Web服务。统计指标(意思是,中位数)计算超过20运行产生的原始数据。时间数据记录两种情况的媒人使用前置过滤阶段Filt_Disc并使用任何过滤媒人Naive_Disc。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
图3生动地描绘了作为一个折线图相同的信息。可以看出,当使用Filt_Disc,平均响应时间是0.08到0.062秒,而对于同样的目标和Web服务Naive_Disc它显著地提高了,0.08到17.5秒。
图4描绘了戏剧性的减少Web服务的数量保持在每个前置过滤阶段。收集的数据匹配的六种不同的目标和不同数量的为每个目标Web服务。图表表明Cap_Filt通过语义等价的目标和Web服务概念和属性并很好地消除不相关的Web服务,鉴于大多数剩下的Web服务应用程序后通过Cat_Filt阶段。
分析的准确性我们前置过滤阶段,表4给的精度和召回值结合前置过滤阶段获得的相同的数据集运行6要求目标250 Web服务存储库中。
|
||||||||||||||||||||||||||||||||||||||||||||||||
精密比例的检索Web服务实际上是相关的。在我们的情况下,Web服务检索Web服务是指在两阶段消除过程,和一个Web服务是“相关”的目标如果逻辑媒人说。这些定义,精确地形式化如下(38]: 召回的部分相关Web服务成功地检索。它形式化如下38]: 如表所示4所有请求查询,平均精度为53.72%,在某种程度上可以被视为一个良好的精确率。这意味着大约55%的Web服务是完全匹配与检索请求的目标和其他人,45%左右,是无关紧要的。然而,查询可能最高的平均召回率,100%。这100%的召回率,所有相关的Web服务的Web服务存储库检索通过提出前置过滤阶段,一个重要的功能,使过滤策略有别于其他建议。
图5图形显示了每个请求的目标的精度和召回率与平均精度。图表说明了精密的所有请求,除了第一个(Q1)高于平均水平。低精度的Q1表明存在许多Web服务存储库的属性和概念语义相似概念的名称和属性名称请求的目标;然而,Web服务的价值本体中定义的属性不匹配请求的目标属性的价值。这些Web服务失败的实际逻辑匹配过程。
正如我们之前说的,最高平均召回率的原因是,所有相关的Web服务检索Cat_Filt和Cap_Filt算法,在前置过滤阶段的另一种说法,我们只消除匹配器肯定会拒绝的Web服务。的原因时精度平均在前置过滤阶段,虽然检索Web服务类似于请求目标由于语义和同义等效性概念和属性的领域本体,也许一些Web服务最终将被拒绝通过过滤器。然而,在现实世界情况存在成千上万的类别和Web服务,以及目标,由分类注释,精度预计将大幅上升,因为大多数的Web服务正在考虑将被过滤的第一阶段(Cat_Filt)。
因为我们的框架的评估是基于我们的新生成的测试集合,WSMO-FL,比较我们工作的精度和性能和其他可用的文学作品不会很丰富。然而,平均100%,召回为53.72%,精度表明这项工作找到一个令人满意的精度。应该指出,这个精度是在一个更复杂的Web服务的目标和条件由于前置和后置条件参数。相关作品中提到的其他的研究没有考虑这些复杂的目标和Web服务。
6。概述相关的工作
最近,尽管丰富的洞察力的努力提出了不同的解决方案来提高语义网络的发现过程及其相关的可伸缩性问题,我们找不到任何工作,地址的性能挑战发现过程类似于我们的工作。在本节中,我们将讨论有关这个领域的建议和分析他们的关系与我们的解决方案,和他们相比,我们的优势的方法。
表5比较我们的工作与相关作品基于几个方面对语义Web服务发现改善。这些维度是预处理,发现方法、参数和框架。前三个维度进一步细分为个子维度。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 方法名(APP)。混合法(衔接)。分类(TX)。同义性(SY)。语法(ST)。逻辑(日志)。功能性质(FPs)。输入输出(O)。(我)。Nonlogic (NLOG)。非功能属性(国家)。前提条件(前)。 Postcondition or effect (POS/EFF). |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
预处理被细分为非功能性属性(国家)和功能属性(FPs)。NFP在这里代表将临界多边形求解一些元素添加到Web服务的方法和目标的描述(例如,每个广告的分类/请求Web服务在设计时)。《外交政策》代表方法比较功能目标和Web服务的参数。一个级别的细分用于预处理因素是分类法(TX)(即。,relationship between two concepts/attributes is described by using a hierarchical diagram), synonymity (SY) (i.e., syntactically two concepts/attributes are different but they have the same or identical meaning), and syntax (ST) (i.e., no synonymous or hierarchical relationships exist between two concepts/attributes and they are compared based on similarity of their string) similarity method measurements for each mentioned NFP and FP.
发现方法代表中使用哪种服务媒人方法:逻辑(日志),nonlogic (NLOG),或混合方法(重),这是两者的结合逻辑和nonlogic方法。
参数表明研究的完整性程度(是否使用目标的主要功能参数和Web服务)。目标和Web服务的主要功能参数后在owl - s和WSMO模型输入(I)、产出(O),先决条件(前)和后置条件或效果(POS / EFF)。
我们总结的结果的比较研究Web服务发现方法在表5,每一行代表一个方法和列代表Web服务发现改进的主要维度。符号””是用来表示,指定的方法支持相应的维度,和“-”意味着它不。
为了突出我们的优势对先前的研究工作,我们分类相关的工作分成两组:方法优化语义Web服务发现通过媒人的改进(a)和(b)应用前置过滤机制在实际的媒人。前讨论相关工作,唯一的重点是提高他们的媒人引擎的性能通过使用各种方法。后者试图减少原来的存储库和过滤后的存储库的大小作为输入实际的媒人。
(一)方法改善媒人引擎。对于需要改进的发现过程和使它具有更强的可伸缩性,一些方法试图提高媒人引擎的性能没有引入任何额外的预处理阶段。
Klusch et al。9)混合组成的媒人都近似实现信息检索(IR)匹配,如句法相似的技术,和owl dl逻辑推理程序发现语义Web服务。作者使用四个变量来计算文本相似度的参数,调用余弦,信息丢失,扩展的提花,Jensen-Shannon。在OWLS-MX,逻辑推理程序只考虑输入和输出参数之间的语义相似度为了进行广告/请求服务和可用的指定领域本体中的概念。后来他们开发的系统,以支持WSMO服务,调用WSMO-MX(10]。全面评估表明,这两种方法提出了高精度的S3竞赛(39]。然而,他们的解决方案的缺陷如下。(我)他们是高计算成本的耗费时间,因为相关的基于逻辑的匹配和基于文本的相似度匹配;(2)他们不相关的检索Web服务请求。
Klusch等人的方法可以提高如果他们利用预处理策略在实际的媒人。为例,通过应用我们的前置过滤阶段前混合媒人,特别是基于逻辑的媒人,他们可能减少初始Web服务存储库的大小,从而提高媒人的整体性能。
Stollberg等人在6,22改善了匹配过程通过实现缓存机制,减少搜索空间的大小,降低了媒人操作。提出了缓存使用发现语义缓存署图存储客户机请求之间的连接称为WSMO目标模板和他们相关的Web服务。因此,当收到一个目标实例,首先,系统比较了目标与缓存实例模板对语义相似度,如果匹配,只是相关的Web服务存储在署图用于随后的发现。
作者的6,22)声称,他们提出了一个标准方法,广告和请求的功能都是正式表达的先决条件和效果(后置条件)。也用一阶逻辑作为正式的规范语言描述这些术语。因为我们的建议也已经建立的精神WSMO框架和Web服务开发工作的目标和功能,包括输入、输出、前置和后置条件,提出缓存方法可以当我们完成前置过滤机制实现在创建缓存之前图。因此,有关Web服务的数量可能存储在图像可以减少。
作者的23]介绍了SPARQL语言来描述的先决条件和后置条件,为了进行Web服务以及用户请求。他们实现了一个媒人,作品通过代理调用SPARQLent(SPARQL代理)。在这种方法中,一个完整的发现解决方案的算法讨论和展示了如何使用SPARQL查询修改和查询代理的知识库。最后,他们对OWLS-MX通过中小企业评估他们的建议2测试工具(40]。
虽然在[提供的方法23)是基于Web服务的前置和后置条件和目标,他们的评价是基于OWLS-TC V3执行,而提出了Web服务描述在这个测试集合没有前置和后置条件。此外,我们的前置过滤阶段也可能是有用的在避免SPARQL代理加载所有可用的Web服务存储库和因此导致进一步改善他们的代理性能。
阿莫林等人讨论混合媒人为了进行探索。它是语义的组合过滤器根据输入和输出参数的要求/广告服务和分析每个邻居关系领域本体(24]。作者采用五水平的输入和输出参数之间的语义相似度,即精确,插件,包含,失败,和兄弟姐妹。同时,为了分析中的每个邻居关系概念,他们使用一个字典分类概念。这本字典的基础上,概念是相同或同义词或同义和相同的,在我们的工作。最后他们比较他们与保鲁西的方法(41通过OWLS-TC v3)和混合算法OWLS-MX测试集合。我们的建议也可以应用的为了进行探索进一步提高发现过程。但是我们的工作使用更表达模型来描述用户请求和Web服务描述包含前置和后置条件。
(b)方法使用预处理机制。这些方法利用预处理机制,帮助优化自动化Web服务发现的缩小的存储库中现有的Web服务集将被视为由服务媒人。预处理机制是进一步细分为两类:(1)预处理机制基于分类方案的国家中心和(2)预处理机制基于语义相似度的FPs。
(1)前置过滤基于国家中心的分类方案。大部分的努力相关前置过滤技术按照分类方法:要么利用Web服务的分层分类方案领域本体的基础上(25)或使用同义词典单词(26]。从媒人过滤过程是独立的,所以这个前置过滤阶段的结果然后检查通过任何实际服务匹配的过程。提到的大多数建议改编OWLS-TC v3测试集合通过添加一个元素的Web服务请求和国家中心参考服务应用程序域。
作者的25,26)实现分类后建议owl - s Web服务和验证他们的OWLS-TC v3数据集。然而,为了进行服务描述在这个测试集合不包含任何信息服务的应用程序域。因此,为了克服当前为了进行服务配置文件元素的限制后两种方法临界多边形求解一个添加到owl - s服务概要文件。尽管使用相同的想法,他们的解决方案是不同的。在[25]服务请求的定义范畴概念与分类广告的概念定义Web服务通过在全球范畴本体论层次分类方案。Web服务是消除如果它没有类别与请求类别之间的关系。然而,在(26相等的要求和广告Web服务类别概念计算通过他们的关系在WordNet [28字典的同义词的单词。这种方法缺乏自己的媒人(即。评估是通过OWLS-MX媒人)。
虽然我们第一次过滤阶段的概念类似于提到的建议,下面的小礼品。(我)我们的提议Cat_filt舞台丰富WSMO框架通过添加一个属性称为hasCategory目标和Web服务的描述。(2)为了提高分类的精度和性能计划,这项工作考虑语义相似度关系类别和Web服务类别(即目标。,如果两个类别的意思相同或同一类继承)。
(2)前置过滤基于语义相似度的FPs。作者的7,8)也使用预处理策略在实际的匹配过程。他们的前置过滤是基于只有FPs的Web服务。他们提出两种不同的SPARQL查询方便搜索过程语义Web服务注册中心。他们自动创建(称为SPARQL查询问所有,问一些)通过分析用户的要求,通过使用这两个过滤查询他们能够执行两级过滤初始Web服务存储库。根据这两个查询,只包含所有(在Web服务问所有)或(的情况问一些一个用户请求返回引用的概念。
我们的第二个过滤阶段(Cap_Filt)在(类似于方法8]。我们的工作和他们的四个主要差异是(我)因为前置过滤阶段服务描述中包含所有的信息输入,输出,和前置和后置条件,我们可以获得更准确的结果比他们的策略;(2)算法不仅考虑概念和属性的层次关系,还考虑了相似的请求/广告Web服务概念和属性基于他们的同义词;(3)我们使用一个初始过滤阶段基于分类方案,这可以提高他们的表现,如果他们之前使用它问所有或问一些算法;(iv)他们的方法只包含过滤预处理阶段的初步Web服务存储库和他们没有实现任何服务相亲,所以他们不能自己评估。
在所有提到的方法,27是最接近我们的工作。INFRAWEBS项目实现了一个发现框架,它包含两个组件,前置过滤和发现。前置过滤阶段它使用传统的信息检索技术,和基于逻辑匹配使用Prolog实现利用作为服务媒人。
虽然INFRAWEBS项目与我们的工作有相似之处,一些差异脱颖而出。前置过滤阶段考虑临界多边形求解的两个语义等价和FP的要求/广告服务,分析对象,属性和概念。我们发现发动机使用更丰富的描述Web服务和请求,逻辑编码帧。我们实现使用FLORA-2语言和执行环境,一个更强大的纯Prolog的替代品。可想而知,我们的方法和他们的发现可以产生一个框架,它是更有效地比使用单一方法治疗消除无用的Web服务。
7所示。结论和未来的工作
我们已经表明,语义Web服务发现的整体性能和准确性框架可以通过前置过滤阶段的引入明显改善,消除最无关紧要的Web服务的考虑在计算昂贵的匹配阶段。具体而言,在本文中,我们提出了Category_based和Capability_based前置过滤机制缩小Web服务描述的数量,需要考虑在匹配阶段来确定他们的关联到当前目标。
我们评估我们的建议的有效性在小说的测试集合,WSMO-FL250年,它由Web服务规范不同的复杂性和6的目标。我们过滤阶段突出由于他们100%的召回率,是他们的设计的结果,他们的能力来处理复杂的目标和规范编写的Web服务的一个增强版本WSMO相当精确率高,实验证明,必然会大大增加在存在大量的类别和目标/ Web服务使用的类别。我们的研究结果还表明,当系统中的前置过滤阶段使用,正如所料,大大减少了搜索空间,从而大大提高系统的响应时间。
我们的工作有一些进一步的优势,总结为以下几点:(我)与大多数的语义Web服务发现方法仅对输入和输出进行概念、语义Web服务发现框架处理Web服务的概念和属性和目标前置和后置条件。(2)我们前置过滤阶段是通用的,这样他们可以应用(在必要的适应性)来提高其他可用的性能服务媒人。(3)100%的召回率的框架意味着我们的方法不会导致假阴性(FN)(即。,Web服务s which are relevant but are classified as irrelevant): all relevant Web services are retrieved through the prefiltering algorithms.(iv)由于不完整的服务描述在OWLS-TC测试(即集合。,Web服务s are partially described only based on input/output concepts), for the first time we created a new test collection called WSMO-FL, which contains fully defined Web services and goals capabilities (i.e., Web services and goals are described based on pre- and postconditions).(v)我们所知的WSMO-FL是第一个大型的测试集,建立了基于WSMO概念模型。它使用框架逻辑(F-Logic)作为一个完全足够的表达式语言用于指定前置和后置条件是失踪在目前可用的测试集合。
对于未来的工作,我们计划在以下方面提高我们的计划:(我)第二阶段扩展,这样就可以工作任何逻辑表达式包含逻辑连接词结合(和),分离(或),否定(不)任何嵌套深度;(2)扩展我们的新WSMO-FL测试集合(a)有更多的Web服务和目标,以及分类,(b)增加Web服务的复杂性和目标前置和后置条件,和(c)扩大同义词典的单词在现有领域本体。
利益冲突
作者宣称没有利益冲突有关的出版。
引用
- t·伯纳斯·李,j·亨德,o·斯莱虽然“语义web,”科学美国人,卷284,不。5,34-43,2001页。视图:出版商的网站|谷歌学术搜索
- s . a . McIlraith t . c .儿子,h .曾“语义web服务”,IEEE智能系统,16卷,不。2,46-53,2001页。视图:出版商的网站|谷歌学术搜索
- d .罗马,凯勒,h . Lausen et al .,“Web服务模型本体,”应用本体,1卷,不。1,第106 - 77页,2005。视图:谷歌学术搜索
- j·d·马丁,m . Burstein霍布斯et al .,“为了进行:Web服务的语义标记,W3C成员提交22日,2004年。视图:谷歌学术搜索
- l . d .颜和r . Kanagasabai“语义Web服务发现:最先进的和研究的挑战,”个人和无处不在的计算,17卷,不。8,1741 - 1752年,2013页。视图:出版商的网站|谷歌学术搜索
- m . Stollberg m . Hepp和j·霍夫曼,“语义web服务发现,缓存机制”语义Web: 6日国际语义Web会议,2日亚洲语义Web会议,ISWC 2007 + ASWC 2007年釜山韩国,2007年11月11日- 15日。诉讼卷,4825在计算机科学的课堂讲稿施普林格,页480 - 493年,柏林,德国,2007年。视图:出版商的网站|谷歌学术搜索
- j·m·加西亚·d·鲁伊斯,a . Ruiz-Cortes”提高语义web服务使用基于sparql的库筛选相比较发现,“Web语义:科学、服务和代理在万维网上,17卷,12 - 24,2012页。视图:出版商的网站|谷歌学术搜索
- j·马拉·加西亚·d·鲁伊斯,A . Ruiz-Corts”一个轻量级的原型实现SPARQL过滤器WSMO-based发现,“技术代表、应用软件工程研究Group-University塞维利亚。,2011年ISA-11-TR-01。视图:谷歌学术搜索
- m . Klusch b .薯条,k . Sycara”OWLS-MX:混合语义Web服务为了进行服务的媒婆,“Web语义,7卷,不。2、121 - 133年,2009页。视图:出版商的网站|谷歌学术搜索
- m . Klusch f·考芙,“WSMO-MX:混合语义Web服务媒人。”网络情报和代理系统,7卷,不。1,23-42,2009页。视图:出版商的网站|谷歌学术搜索
- d . Fensel h . Lausen a轮询器et al .,“WSMO的概念”使语义Web服务:Web服务建模本体,页63 - 81,施普林格科学+商业媒体,2007年。视图:谷歌学术搜索
- m .麻醉品、g . Lausen和j .吴“面向对象和框架的逻辑基础语言,”ACM的杂志,42卷,不。4、741 - 843年,1995页。视图:出版商的网站|谷歌学术搜索
- m .麻醉品g·杨,h .广域网和c .赵FLORA-2:用户手册、版本1.0纽约石溪大学石溪,美国,2014年。
- 美国工业,b . Konig-Ries m·克莱因和m·斯特恩,”黛安:matchmaking-centered框架自动服务发现、组合、绑定和调用在网络上,“国际电子商务杂志》上,12卷,不。2,41 - 68,2007页。视图:出版商的网站|谷歌学术搜索
- h . Lausen和j·法雷尔WSDL和XML模式语义标注,”W3C推荐标准,2007年。视图:谷歌学术搜索
- t·r·格鲁伯“便携式本体的翻译方法规范,”知识获取,5卷,不。2、199 - 220年,1993页。视图:出版商的网站|谷歌学术搜索
- j .安吉拉”OntoBroker:语义中间件、成熟和批准”语义网,5卷,不。3、221 - 235年,2014页。视图:出版商的网站|谷歌学术搜索
- m . w . Chen麻醉品,d·s·沃伦”HiLog:高阶逻辑编程的基础,”《逻辑编程,15卷,不。3、187 - 230年,1993页。视图:出版商的网站|谷歌学术搜索
- 答:邦纳和m .麻醉品,“逻辑编程数据库事务,”逻辑数据库和信息系统,第166 - 117页,1998年。视图:谷歌学术搜索
- a·j·邦纳和m .麻醉品”概述事务逻辑。”理论计算机科学,卷133,不。2、205 - 265年,1994页。视图:出版商的网站|谷歌学术搜索
- h . Wan b . Grosof m .麻醉品,p . Fodor和s .梁”与违约和论证理论逻辑编程,”逻辑编程卷,5649在计算机科学的课堂讲稿施普林格,页432 - 448年,柏林,德国,2009年。视图:出版商的网站|谷歌学术搜索
- m . Stollberg j·霍夫曼,d . Fensel”缓存技术来优化自动服务发现,“国际期刊的语义计算(世界科学),5卷,不。1日至31日,2011页。视图:出版商的网站|谷歌学术搜索
- m . l . Sbodio d·马丁和c .冰川锅穴”发现语义Web服务使用SPARQL和智能代理,“网络杂志的语义,8卷,不。4、310 - 328年,2010页。视图:出版商的网站|谷歌学术搜索
- r·阿莫林·b·克拉洛雪茄烟d·洛佩斯·阿尔伯斯和a·安德拉德,“提高web服务发现功能和结构的方法,”IEEE 9日学报》国际会议上的Web服务(ICWS 11)IEEE,页411 - 418年,华盛顿特区,2011年7月。视图:出版商的网站|谷歌学术搜索
- t . Khdour”语义过滤web服务存储库,”数字信息和通信技术及其应用卷,167通信在计算机和信息科学施普林格,页322 - 336年,柏林,德国,2011年。视图:出版商的网站|谷歌学术搜索
- k . Mohebbi, s·易卜拉欣,m . Zamani“预匹配滤波器提高查询响应时间的语义web服务发现,“新一代信息技术杂志》上,4卷,不。6、2013。视图:谷歌学术搜索
- l·科瓦奇a Micsik, p . Pallinge”两阶段语义web服务发现方法寻找交叉使用逻辑编程比赛,”车间的程序语义Web服务2006年12月,瑞士苏黎世。视图:谷歌学术搜索
- c .编辑WordNet:电子词汇数据库英国牛津布莱克威尔出版,1998年。
- https://wordnet.princeton.edu/。
- http://projects.semwebcentral.org/projects/owls-tc/。
- http://projects.semwebcentral.org/projects/sawsdl-tc。
- m . Klusch m·a·哈立德·Kapahnke b .薯条,和m . v .萨尔布吕肯OWLS-TC -OWL-S服务检索测试集合、用户手册,2010年。
- http://www.w3.org/Submission/SWRL/。
- c .打破原有豪,c . Knoblock et al。规划领域定义语言(PDDL),1998年。
- m·a·哈立德b .薯条,m . Vasileski p . Kapahnke和m . KluschSAWSDL-TC服务检索测试集合、用户手册,3.0版本——SAWSDL萨尔布吕肯,德国,2010年。
- z, a·费尔南德斯,h . Billhardt和m . Lujak”与层次聚类服务发现加速度”,信息系统领域,17卷,不。4、799 - 808年,2014页。视图:出版商的网站|谷歌学术搜索
- http://cmpe.emu.edu.tr/samira/WSMO-FL.htm。
- r . Baeza-Yates和b . Ribeiro-Neto现代信息检索,卷463,ACM出版社,纽约,纽约,美国,1999年。
- S3的m . Klusch”概述比赛:绩效评估的语义服务媒人,”语义Web服务:通过评估进步施普林格,页华裔,柏林,德国,2012年。视图:出版商的网站|谷歌学术搜索
- http://projects.semwebcentral.org/projects/sme2/。
- m·保鲁西t .河村建夫,t·r·佩恩和k . Sycara“语义web服务的匹配能力,”语义Web语义Web-ISWC 2002:第一个国际会议撒丁岛,意大利,2002年6月9 - 12,诉讼卷,2342在计算机科学的课堂讲稿施普林格,页333 - 347年,柏林,德国,2002年。视图:出版商的网站|谷歌学术搜索
版权
版权©2015萨米拉·泽克Bayram Ghayekhloo和。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。