文摘
本体是一种模式语言,支持功能集成分布式领域知识概念和推断出概念之间的关系。基于目标领域知识本体开发。因此,方法自动生成本体的元数据描述领域知识越来越重要。然而,现有的方法来自动生成本体需要使用元数据来生成领域元数据在一个预先确定的模板,和很难管理数据增加本体本身当域猫头鹰(Web本体语言)的人不断增加。数据库模式领域知识的特点,提供了结构函数来有效地处理知识数据。在本文中,我们提出一个方法来自动生成本体的OWL个体通过交互和管理数据库和本体。我们描述本体的自动生成过程和示例模式和演示自动生成本体的有效性通过比较它与现有的本体使用本体质量分数。
1。介绍
本体是一种模式语言,可以构建模型,它支持概念集成分布式域数据和推理的概念之间的关系的活动,如概念分析和域建模使用标准的方法(1]。特别是,本体的重要性,认识到在知识工程等领域,环境意识、知识整合、知识管理和建模。
当不能重用现有的本体,它需要新开发的。开发本体的过程涉及创建属性和约束条件,建立一个模型,并将它应用到域数据(2]。这个过程就像设计一个软件体系结构的需求。与软件开发一样,本体发展需要讨论领域概念,同领域专家之间的关系和约束(3- - - - - -6]。
自这一过程要消耗大量的人力,方法自动定义一个本体模型通过定义一个域的形式可以描述的元数据域和规则适用于目前的元数据研究。·等。工作自动生成本体的基于XML的数据源(7]。以下研究,包括戴伊et al .,概念分类模糊数据和描述如何生成本体和规则生成本体(8- - - - - -10]。Clonto框架自动生成本体通过后缀树聚类算法在一个文档,该文档描述了域信息(11]。
方法自动生成本体通过元数据必须进行预处理的元数据生成本体通过域转换成模板,申请一个ontology-generating规则(12]。生成的本体模型并不关注许多人发生时如何管理。个体生成本体模型的输入可以存储在数据库的一个表在一个三重形式,由一个对象和一个主题。使用这种方法,可以为个人提供高效的管理和查询功能相应的模式(13,14]。个人是一个本体论的基本组件。个人在本体的作用是根据他们的类对象进行分类,这是一个域的概念(15]。个人在猫头鹰对应于一阶逻辑常量和资源描述框架的实例。
在本文中,我们提出一个方法来自动生成本体模型基于数据库元数据并将其转换为一个数据库元组时许多人出现在生成的本体。这种方法基于模式信息读取一个OWL-DL-level本体,这是关系数据库的元数据,将个人本体的转换为一个关系数据库。
关系数据库是一个常见的结构存储数据的方法在一个域(16]。结果,数据库的模式存储域数据特征相应的域。此外,一个数据库表是一个概念模型,可以包含类似的数据域。结果,方法生成一个本体从建立数据库的优点是生成的本体可以更好地表达每个域的特征地区更广泛的领域。
本体质量指标应用于确定是否自动生成本体通过数据库模式满足实际领域应用。一个好的本体评估是不可能的,因为根据应用领域本体有不同的特征,但它是可能的,以确定适当的本体符合域(17]。在本文中,我们定义一个度量的一个本体可以反映了领域知识,比较自动生成的本体论根据我们的过程到另一个本体,并展示了自动ontology-generating方法的有效性使用数据库模式。
本文的其余部分组织如下:部分2介绍了现有论文自动本体生成的数据建设和个人管理。部分3描述了本体的自动生成过程。部分4描述的过程管理本体个人使用一个数据库管理系统。部分5显示自动本体生成的过程和结果使用sample数据库的模式。节6,本体的质量分数是用于验证本体表达域如何通过比较它与其它本体。最后一部分总结讨论未来的研究。
2。相关的工作
2.1。使用元数据自动生成本体
框架如探戈(18和鞑靼人19)自动生成本体的元数据包含域数据的结构和特点。在框架中,常见组件的数据被组织在一个表格形式,并分析了表生成本体模型的组件。在探戈应用程序中,一个表进行分析,生成semiontology根据每个表,和semiontology连接生成一个内核本体最终生成一个本体。探戈支持多个源查询处理等功能,语义web创作和叠加信息生成使用应用程序。鞑靼自动转换表格数据如HTML、PDF、和EXCEL为正式的(结构和语义)模板,并提供用户通过一个内部引擎。在这个时候,一个表属性本体的OWL格式与每个表的数据是自动生成的。
长(20.)实现一个代理解释表数据通过识别表格数据和每个表属性和生成本体的RDF格式,实现一个基于代理的方法的方法表识别和解释。这项研究解释了如何从文本文件中提取这些表,分析任务的评估表,表分析框架基于RDF。其中,基于RDF的黑板框架生成RDF文件通过不同打印表格的注释和分析表通过生成的RDF。
以下研究本体自动生成基于数据库的关系数据库定义每个组件和本体作为一个符号和基于数据库的生成本体通过规则使用每个组件的关系(21,22]。这些研究人员使用Jena框架来阅读和分析数据库的元数据在一个程序中,用Java语言编写的,并应用规则创建本体模型。因此,他们使用Jena实现本体模型和生成的文档和RDF图。
Alalwan et al。23]解释整个过程和规则从一个数据库模式自动生成一个OWL的本体合并每个数据库的数据在分布式数据库环境中使用本体。规则应用于本体的自动创建本文是基于本研究的规则;综合和概括的条件规则。在一项研究中,阶级分化相关的规则的分层指的是数据库表生成的类中定义以下公式: 在哪里定义类和当表满足类条件,是一个子类 。一个表的主键必须设置为另一个表的外键,和两个表的属性数据类型必须相同。表示所有元组属于一个表,和Dom表示表的所有属性的数据类型。后创建的类是根据表中的信息,研究表明应用下面的公式中定义的规则创建DatatypeProperty时的属性表: 在哪里为所有属性定义了一个类是一个域不表中的外键和创建一个DatatypeProperty,集每个属性的数据类型作为一个范围。此外,猫头鹰是通过规则自动生成定义每个属性的属性和阶级关系集成分布式数据库。
2.2。基于数据库的大规模本体数据管理方法
的方法来管理基于本体的数据存储本体模型和个人建议通过一个基于本体的数据库表示。OntoDB将细化类成三元组,代表了现有本体的形式个人的三元组,并将它们存储在数据库中查找整个本体的模型和数据在数据库中。metaschema OntoDB地图的本体和元数据的数据库。这是一个逆向的过程生成本体的元数据,它可以保证高查询性能基于OBDB [24- - - - - -26]。
沙和Rabhi27)创建了一个本体工作流智能大数据分析。自动服务组合用于自动化过程和设计本体和规则来推断数据的工作流分析过程根据数据集的属性和用户需求。在这种情况下,大数据是有组织的,大量的数据集中到本体模型应用到工作流基于本体模型。
2.3。基于指标的本体质量分析和评分
本体在论文质量评估通过比较两类评价指标,与本体的分数相比,涵盖了特定领域发展。第一类是如何生成的本体模型可以表示的知识领域。第二类是关于本体模型的提取数据从目标知识库(KB),它适用于个人。
的符号和本体质量量度本体的本体模型质量评价是基于OntoQA [17],OntoMetric [28],OntoClean [29日]。求和过程和得分被修改以适合本文基于本体的方法评价和排名研究使用OQuaRE [30.]和Tartir Arpinar [31日]。我们重新定义了本体模型的五个组件O: {R C、P、SC,我}使用本体质量指标由自动本体生成使用模式。每个组件构建本体模型与C(类)、P(属性),SC(子类)、R(所有类之间的关系和),我(个人)。
两种指标的选择OntoQA得分本体模型类:感情丰富本体的表示的数量关系和属性丰富定义属性的平均数量在整个类和显示模式代表了知识的数量。以下公式将丰富的关系定义为本体配置符号:
由于公式,计算百分比显示每个类与其他类的关系,在整个本体包括子类关系。计算值趋于0时,本体成为垂直本体与小类之间的关系,以及近1对应于一个更相关的本体价值。下面的公式定义了属性丰富:
由于公式,计算平均每个类的属性数量。更高的价值更好的对应于本体模型表示领域知识的属性。选择两个指标的OntoQA得分知识库分类。类丰富程度有关个体分布在一个类。平均人口比较类的数量与个人和评估是否有足够数量的许多个人的阶级。下面的公式定义了类丰富:
公式的结果类的比例是个体在整个类。当计算值接近零,相应的本体可以被认为是一个本体,不能从知识库中提取数据。下面的公式定义了平均人口:
由于公式,计算个人每个类的平均数量。如果个人每个类的平均数量是不够的,本体模型可以被认为未能提取所有的知识领域知识。OntoQA分析本体的特点和质量通过各种指标。基于分析结果,显示了本体可以表示领域知识和如何可以使用相应的本体。
3所示。自动生成本体与关系数据库模式
本节描述了如何自动生成一个OWL的本体通过导入关系数据库模式。在细节中,我们描述的整个过程自动创建的OWL本体,所需的组件模式的自动生成,并应用规则本体生成过程使用元素。执行以下流程自动生成OWL本体:(i)阅读和分析数据库的模式信息,将它转换成的基础信息本体的一代。(2)创建一个类的基于数据库的表信息的本体。(3)基于表的属性信息,DatatypeProperty本体的类和ObjectProperty,创建了类,代表之间的关系。最后,数据库中的元组和个人数据的OWL本体映射使用生成的本体模型。图1显示了本体的自动创建使用一个数据库模式。
有两个原因映射数据库中的元组和OWL个体。首先,使本体映射到实际的使用元组信息集成和推理功能。元组数据作为owl: Namedindividual类的创建基于表可以用来构造规则通过描述逻辑本体的推理功能。第二,新创建的个人管理的映射本体的数据库管理系统。在这种情况下,本体被指表中的元组的引用表信息本体时自动生成。这个替代允许使用现有的关系数据库作为一个本体和一个基于本体的数据库,而不是创建和使用一个基于本体的数据库。将一个元组转化为个体的方法包括在自动本体生成过程,在这一节中描述。相反的部分中详细解释4。这个过程自动生成本体基于模式信息通过输入数据从数据库中。owl dl的XML文件生成过程的结果。这个XML文件包含的信息本体模型和单个的语法。
部分3.1描述了关系数据库的符号和基本配置方法,必须建立数据库转换为本体。数据库的配置信息模式取决于数据库的领域知识构建和设计师的目的构建数据库。因此,我们设置的最小数据库模式配置约束可以使用数据库模式自动生成本体根据论文的过程。数据库中的符号代表了组件的数据库和模式的信息从数据库中读取实际自动本体生成应用程序。部分3.2描述了规则类从数据库中创建表时应用。部分3.3解释规则的应用,当我们生成本体属性的属性表中。最后,部分3.4解释数据库元组转化为个体在生成的OWL本体模型。摘要符号和一些规则适应OWL本体的逐步生成基于我们之前的研究(32)和本体数据库生成的研究(23)数据库集成。
3.1。符号和基本数据库的约束
在本体中定义的规则自动生成过程,我们使用以下符号定义每个数据库组件。
由表表示的名字吗x在数据库中,它是一组属性:
换句话说,表x一组属性,可以通过以下公式表示:
PK ()是由主键属性在表 。
颗()是由外键表示在表和参考在表 。
这四个符号从一开始是用来定义的规则创建本体的基本组件。是一个更详细的表示表中的每个组件和使用评估规则,以确定信息的本体组件。
数据库模式,可应用于自动生成OWL本体的使用方法在论文中必须至少满足以下条件持续应用自动生成过程通过约束模式设计方法:自动本体生成过程中的模式约束要求的模式应至少满足自动生成本体。约束如下:(我)的子类型继承父与一对多关系的特点与父母共享主键。(2)一个支离破碎的表与一对一的关系子表的父表的主键作为外键。(3)数据库的模式必须满足第三范式。
第一个约束分类之间的一般关系的两个表,每个表是否可以合并成一个类在本体类的创建。第二个约束决定了本体类的基本层次结构。最终约束维护表中提取的一致性关系。自动本体创建的数据库必须是一个关系数据库,数据库模式是由sql ddl。生成的本体为对象是owl dl水平和表达与功能语法的XML文件。
3.2。规则生成本体类从数据库表
自动生成本体的第一步是创建一个本体类基于数据库中的表信息。表中的信息是一个注释,指示表的名称,表的依赖的外键和主键,和表的用途和特点。一个本体类生成的表这并不适用于规则基本上是描述。然而,如果目标表对应于以下两个规则,确定概念的领域知识分离发生在模式设计层面,执行类的合并或分层的过程中创建基于类的放在桌子上。第一条规则是参与类的合并。下面的公式定义了类归并规则:
如果表的主键是一个外键的的主键是一个功能的依赖 ,也就是说,如果主键决定了整个 ,然后可以被认为是一个表的 。因为的主键是一个函数所属的主键 ,这意味着通常决定了它的内容因为所有的属性属于 。在这种情况下,有一个一对一的关系 。
所涉及的类层次结构的规则是建立两个类之间的层次结构。如果两个表共享相同的键,一个表成为一个低级表在其他表。在这种情况下,下层表包括上层的属性表,但上面的表的属性不确定下层的属性表。层次结构在两个表的确定取决于哪个键和外键引用。引用一个外键的表,变成了一个底层表。通过应用这一规则创建的子类是上层阶级和猫头鹰:subClassof关系。下面的公式定义了类层次结构规则:
表评价规则决定了表转换元组所属的映射过程元组和个人。当两个表创建一个表,满足合并规则,注释类的两个表中的注释的总和。在这一步中,生成的类被插入到OWL本体模型的基于信息表。猫头鹰与基本模型在这个阶段包括类层次结构,和房地产信息生成这些类的下一步。
3.3。从数据库中规则生成本体属性的属性
在这一步中,本体属性创建基于每个表的属性信息。猫头鹰属性分为两类:DatatypeProperty,这是一个属性的实际数据输入个人,ObjectProperty,其中包含的信息约束在猫头鹰和类之间的关系。猫头鹰:DatatypeProperty创建基于属性数据值存储在表中。这里,猫头鹰:DatatypeProperty xsd:数据类型范围,属于的类属性转换为域。
当一个类创建基于不对应的两个表合并或分层规则在前面的步骤中,两个生成的类将猫头鹰:ObjectProperty关系。猫头鹰名称:ObjectProperty创建的“有”前缀的名称附加到外键属性。结果猫头鹰:inverseProperty自动由“是”前缀。下面的公式定义了一个规则基于外键:ObjectProperty代
当上面的规则应用于两个类之间创建一个ObjectProperty,本体上的限制决定根据基数的两个表的关系。基数的限制是由多少个类一个类可以适用于一个ObjectProperty类型。规则(12)定义了本体限制根据表关系:
所涉及的属性计算规则是确定猫头鹰:functionalProperty限制的条件表不为空和独特的属性,或autoincrease。表1列出的条件属性和相应的属性约束。
在这一步中,创建一个OWL的本体模型,其中包含的类和类的属性。每个属性的类包含一个DatatypeProperty代表的属性表和一个ObjectProperty代表表之间的外键的关系。
3.4。OWL个体和元组映射过程
在这一步中,存储在数据库中的每个表的元组映射到本体个人基于生成的OWL本体模型。匹配每个元组的映射个人和断言的相应Namedindividual表元组所属。个人的名称映射到每个元组索引对应表的属性值。这是对应的元组的属性的属性值生成的个体。图2显示数据库元组和个人的映射过程自动生成的本体模型。
ObjectProperty其他的属性值比DatatypeProperty成为ObjectProperty价值与个体相关的另一个类的一个独立的个体。在这个过程中,我们把两个表的元组。映射过程不是对所有元组执行,但是用户可以选择一个元组所需的类别和映射到一个独立的个体。因此,它是可能的选择数据分类,并确定每个数据的相关性和数据集的概念意义推理功能本体模型的数据。
4所示。个人管理数据库的基于大规模本体
本节描述了如何将一个人变成一个元组映射,并将它存储在一个数据库管理系统有效地管理一个大型本体的猫头鹰。最后一步的自动创建的本体部分3就是绘制出个人在生成本体模型和元组存储在数据库,维护每个类基于表。个人的元组变换所得的逆变换过程描述。
当大规模本体个人继续增长,个人断言在OWL类模型转化为元组和存储在数据库中。在这个过程中,一个自动本体生成程序解析每个解析,分析了个人使用映射信息的程序。个人数据处理后,程序将它们转换成一个元组,将相应的元组插入到表中,并保存。图3显示存储过程的一个单独的数据库中。
通过个人存储在数据库中,一个可以管理大量数据本体的同时最小化大小的增加。存储本体个人可以恢复到个人在任何时候使用映射信息。使用的方法,我们可以减少系统的成本实现和本体开发通过实现中间件之间的交互关系数据库和一个已知类型的本体没有根据特定的本体构建一个数据库。
这个过程的逆过程元组和个人映射,这是最后一步的过程中自动生成的OWL本体数据库模式。手动创建的本体允许开发人员选择创建一个独立的个体。然而,由于这个过程是自动完成,所有元组都转化为个人。因此,个人可以存储在数据库中的元组的形式,以防止过多的个人积累的本体。结果,这一过程扩展本体管理系统结合数据库。
一个可以使用SQL和SPARQL查询数据库交互的本体模型。如果没有必需的数据查询,程序搜索他们的剩余模型并生成查询的必要数据。将个体转化为一个元组,标准确定元组之间的转换为一个表的表合并规则应用的注释信息table-evaluating规则在合并后的类。
5。实现
本节展示的过程中自动生成一个OWL的本体使用实际的数据库模式和方法的进展期间通过中间输出生成的实现。目标域的目标数据库是智能家居。因此,目标数据库的模式包含存储数据的表和属性生成的智能家居。整个模式包括85个表,每一个都包含一个或多个属性。每个表都有一个层次关系根据智能家居单元通过外键。在本文中,我们描述的自动转换过程为例,通过选择一个表输出的结果的中间过程相应的表和属性转换成类。
一个示例表说明本体自动生成过程包含的数据smartwatch智能家居设备的数据库。smartwatch表是表,由设备管理表和管理多个smartwatch模型和表包含smartwatch详细信息。smartwatch表属性来管理整个smartwatch的数据。图中的例子4显示了一个smart_watch表和表由smartwatch管理表的SQL语句。
程序读取sql ddl,标识表和表的属性,并将表格转换成一个类。自从smart_watch_detail表满足smart_watch的合并规则表,创建一个类。生成的类的名称将smart_watch类管理合并。的subattributes smart_watch_detail表创建smart_watch类的属性的属性smart_watch表,smart_watch_sportmodel, smart_watch_classicmodel。自从smart_watch_sportmodel表满足分层规则,类创建smart_watch类的子类。创建的类的名称是相同的,每个表创建的属性为属性。在生成的类的注释,注释的表由表输入评估规则。图5显示生成的猫头鹰功能语法类基于表信息。
生成的类的属性生成基于表中的属性信息。一个属性和一个外键关系是参与的创建ObjectProperty通过应用一个关键属性关联规则。除了外键生成的属性与实际数据运用DatatypeProperty属性评估规则和属性约束规则。在sql ddl, watch_own smart_watch表的属性与人民people_name表。键属性关系如下:当一个对象中的属性创建基于watch_own属性规则,has_watch属性是由前缀的属性名称。这个属性的对象属性,have_watch,自动生成。图6显示生成的猫头鹰功能语法属性基于属性信息。
属性创建完成后,smart_watch类和属性是根据smart_watch表创建的。然后,我们将smart_home表的元组映射到个人。映射是基于每个元组中的数据,指的是人们通过外键表中的数据。图7显示了前三元组映射的结果。
生成的个体被用作数据的人工智能系统等智能家居环境分析和对应方法处理。当创建太多的人,一些未使用的人倒进元组存储在数据库中。
6。验证
在本节中,我们评估现有的本体和自动生成本体根据本体质量分数。使用分数,我们证明自动生成本体是否能代表了领域知识。结果还演示了通过tuple-individual转换实例管理的有效性进行比较的速度增加数据库的大小与OWL文件当本体个体持续发生。根据定义的本体质量得分是自动本体生成基于符号和元素的OntoQA公式构成的本体模型的相关研究。生成的类别代表的知识领域本体模型是评价和丰富的关系和属性OntoQA的丰富性。本体模型的分数可以用下面的公式计算:
计算值显示生成的本体的程度有关系,指数平均为每一个类属性。这个值使我们能够评估是否自动生成本体的关系和特征反映了实际的领域知识。数据库模式,即基础知识本体的生成本体通过评估,可以确定合适的元数据本体的一代。此外,自动生成的本体论是关于提取效率的基础知识,和知识库的分数是总结与类OntoQA丰富性和平均分布在所有类。知识库中提取的分数可以使用以下公式计算:
计算值表明如何生成本体可以提取感兴趣的价值到知识库中。因此,它可以确认是否自动生成本体可以提取和使用领域知识的数据。我们可以验证本体模型是否可以反映所有数据库中的元组当我们地图数据库的元组和个人,这是自动本体生成的基础。评估质量,我们使用类似的智能家居环境的本体对领域知识的论文。盆景(33)是上下文感知和智能建筑本体概念集成环境智能。ThinkHome [15本体是一个全面的本体的智能家居未来智能家居的能源效率。表2显示3本体的本体组件智能家居,包括自动生成的本体。
通过计算每个本体的质量分数使用公式(13)和(14),我们得到的结果和在顺序表中2。从数据库中自动生成本体模式信息缺乏本体建设相比,现有的本体,但它是足够可用较基本的本体知识库,因为基于数据库的萃取率高。图8显示每个本体的质量分数。
证明的有效性的方法将个人转变为元组并将它们存储在一个数据库在个体不断生成一个自动生成的本体,不断生成新的个体在上面的自动生成本体。我们比较的能力增长速度不断当个人被存储在本体模型和个体转化为元组时,存储在数据库中。图9显示了存储容量增长率时,个体数量的增加。
一千单位的个体不断生成时,个体是存储OWL文件和元组存储在数据库中。结果,关系数据库相比,容量增长率缓慢增加到本体模型当个体的数量不断增加。数据库可以有效地管理个人通过数据压缩在一个元组和管理。
本体应用的基础上,自动生成本体创建确认自动生成的本体是可用的和上下文感知使用本体的证实。通过每一个智能设备所产生的数据,智能家居应用程序控制家里的物联网设备的功耗测量位置的基础上的人类可穿戴设备。图10显示能耗的变化根据用户活动时间。
当用户在家里时,人工智能等能耗设备的扬声器和灯高,功耗设备激活的用户,如智能花盆和闭路电视,增加。这是一个结果识别GPS的应用程序上下文感知smartwatch和调整每个设备的功耗。
7所示。结论和未来的工作
在本文中,我们描述一个方法来自动生成owl dl使用数据库模式和个人存储在一个数据库管理系统,许多人出现在数据库中生成的本体模型,生成本体。本体质量分数还定义了本体的表示的指标域和比较它与其它本体,这证明了从数据库中自动生成本体模式可以在主应用程序中使用。提出了本体模型,本体可以有效地管理通过使用数据库模式和每个人可以集成,以减少存储空间的开销。
阅读的过程和分析数据库模式信息,自动生成本体模型使用信息,分析和管理的实例通过数据库创建本体将通过一个例子来解释。本体和数据库交互。本体模型,有困难扩大超出了基本的包含关系通过之间的关系表,当我们应用本体的自动生成方法。在未来的研究中,应用复杂的推理关系的猫头鹰,本体模型的约束被认为是基于数据库表之间的外键关系和属性信息表和存储结构的优化存储个人数据库。
的利益冲突
作者宣称没有利益冲突。
确认
这项研究受到了区域新行业的主要人力资源培训计划通过韩国国家研究基金会(NRF)由科技部,ICT和未来规划(没有。nrf - 2016 h1d5a1909989)。本研究也支持了MISP(科技部、ICT和未来规划),韩国,根据雇佣合同的SW硕士课程计划(h0116 - 16 - 1015)监督的IITP(信息与通信技术促进研究所)。