文摘

目前,仍有许多问题需要解决在不同企业的内部平台和第三方之间的信息交互平台,特别是它们之间的数据集成问题,特别提及的两方面数据nonstandardization和困难的数据集成。解决上述问题,本文提出一种多党动态数据集成方案产业链协作平台。一方面,这个计划构建一个标准数据分类系统从数据的类型的角度来解决这个问题的数据不规则;另一方面,它构建一个多党动态数据集成模型基于规则和要求来解决数据集成问题的困难。本文验证了可行性、灵活性,通过案例分析和实验方案的合理性分析。

1。介绍

在提供新的服务模式和商业机会,云平台有很大的潜力。大型集团公司是否进行大数据分析基于云平台多维业务价值,或中小企业开展业务合作基于云平台实现信息化和数字推广以更低的成本,推动企业加快转变社会化、集约化和专业化。产业链协作平台采用现收现付制服务提供业务协作和数据分析服务成千上万的汽车制造产业链企业(包括供应商、制造商、分销商、服务提供者、和物流供应商);因此,拯救这些企业的运营成本降低了企业信息化的门槛(1,2]。

在多个企业的业务协作环境,仍有许多问题需要解决在信息之间的相互作用不同企业的内部平台(IP)和第三方平台(TPP),尤其是之间的数据集成多个不同企业的内部平台和第三方平台,可以具体体现在以下几个方面:(1)有巨大差异数据标准的内部平台(系统)的各种企业;(2)传统的数据集成规则和流程平台(系统)是静态的,很难满足企业的需求进行动态集成和实时操作。一方面,这些问题影响了企业的信息互联产业链,另一方面,他们也阻止了企业价值最大化数据。

为了解决上述问题,本文提出一种多党动态数据集成方案产业链协作平台基于属性的访问控制的概念(3- - - - - -5]。开始,计划建立一个标准的数据分类系统的基本数据的观点,主题数据,域数据,和企业数据,以消除非标准数据的影响。第二,计划创建一个多方动态数据集成模型基于数据集成规则和请求动态集成多个不同企业的内部平台之间的数据和第三方平台,允许企业以满足实时操作需求。

目前,国内外学者主要研究信息集成平台(系统)方面的数据交换和数据集成,取得了丰富的成果。然而,多方研究动态数据集成技术为产业链协作平台相对较小。

在数据交换方面,传统的数据交换技术指的是数据符合源模式转化为数据符合目标模式,需要尽可能准确,反映了源数据的方式符合各种依赖关系(6]。在早期的数据交换的研究,主要的研究方向是寻找和解决一阶查询的语义和复杂性从上下文的数据交换基于关系模型。教唆犯et al。7)提出了一个概率数据库数据交换框架并证明其一致性和鲁棒性,适用于任意模式映射。谭et al。8)提出了一个XML数据交换方案与目标约束,首次定义源和目标之间的映射模式通过丰富的语言,然后限制基于XML约束模型的目标计划和建造规范目标实例,最后实现数据交换通过XML目标实例。麦地那et al。9]扩展经典的数据交换方法和使用模糊数据交换框架的模糊数据转换。经典的最重要属性数据交换仍在新框架之间的关系通过分析模糊概率之间的数据交换和古典设置和数据交换和模糊逻辑10,11]。云平台的快速发展和云服务,吴et al。12)基于功能的数据交换应用于协作产品开发基于云的设计和制造,提出了一种面向服务的云计算设计和制造数据交换体系结构。

在数据集成方面,传统的数据集成技术被用来协调不同数据源之间的不匹配,不同类地集成,分布式和自主数据为用户提供一个统一的视图可以让用户透明地访问不同的数据来源6。道等。13)提出了一个基于本体的语义集成方案XML数据,优化查询执行计划的生成算法的基础上,假设nonintegrity角色的数量是有限的。Benedikt et al。14)提出了一个基于本体的数据集成的逻辑基础信息披露方法(OBDIM),其中描绘了一个基于本体的数据集成系统,该系统允许用户高效地访问位于多个数据源的数据通过全球本体描述的模式。山谷和Kenett15)提出了一个社会媒体数据集成方法(SMDIM)面访客户调查数据校准online-generated大数据和校准水平不平衡响应在不同数据源通过重采样和数据集成进行了使用贝叶斯网络传播新调整的信息。林等。16)提出了一个概率覆盖模型数据源选择的信息集成问题,确保信息集成的效率和有效性,这是用来评估数据源的质量,并通过算法和两种修剪提高效率和有效性的信息集成在不牺牲准确性。

一方面,本研究的结果不能完全消除影响的非标准数据从多个平台(系统),另一方面,他们不能完全满足企业的需求进行动态集成和实时操作。结果,本文提出了一种多党动态数据集成方案产业链协作平台以弥补上述研究成果的不足和解决多方动态数据集成问题。

3所示。多方动态数据集成方案

3.1。标准的数据分类系统

消除非标准数据的影响,有必要建立一个科学的标准数据分类系统如图1可以统一标准数据与差异,使其被集成基于规则相同的指标。这不仅保证了及时性、完整性和准确性的数据也提高了通用性、共享、数据的可移植性和可靠性。标准数据分类系统包括数据分类标准和数据适应性标准,其目的是将无序、分散和混乱的数据命令,聚合和标准数据。的具体含义可以概括如下。(1)数据分类标准:根据特征,功能,和关联数据的第三方平台,企业内部的数据平台和第三方平台分为基本数据、主题数据域数据和企业数据。四种类型的数据都是相关的,不同的。具体内容如下:

基本数据:这种类型的企业的内部平台之间的数据共享和第三方平台,包括公共基础数据、业务基本数据处理基本数据,基本数据协作关系,基本数据批准。

主题数据:这种类型的数据是由一个企业的基本业务单元的内部平台或第三方的云平台,包括采购主题数据,销售数据,声称主题数据,维护数据,和物流主体数据。

域数据:这种类型的数据是由一系列的基本业务单元在一个企业内部平台或第三方的云平台,包括采购领域数据,销售域数据,声称域数据,维护域数据和物流领域数据。主题和领域数据之间的关系是下属。

企业数据:这种类型的数据建立主题或领域数据之间的财产关系和企业,包括生产数据、供应商数据,卖家数据,服务提供者数据和物流供应商的数据。主题或领域数据之间的关系和企业数据是下属。(2)数据适应标准:它可以转换私人交涉各种数据格式,标识符,和编码标准表示使用键值的字典库,并提供标准的数据来源为企业在汽车制造业产业链为了实现信息互联和数据值最大化。适应标准,另一方面,允许(即反向转换。,将标准表示转换为私人表示)。不同的内部平台,例如,使用不同的值来表示一个人的性别是男性。“有必要建立一个统一的字典库,如表所示1,将各种私人表示第三方平台”的标准表示男性。“关键的值范围是所有可能的集合表示,最后的标准表示的值是“男性”。

施工后的标准数据分类系统完成后,下一步是整合企业的内部平台之间的数据和第三方平台,方便企业在汽车制造产业链开展业务合作和数据分析。

3.2。多方动态数据集成模型

多方动态数据集成模型(MDDIM)是由四个基本要素:主体、对象、实体,和行动。其中,主体、对象和实体都由属性。这个话题表示源平台和目标平台参与包括所有内部数据集成平台和第三方平台。对象表示一组数据资源。实体是一个键值字典库。数据集成的行动表示同意或拒绝。本节给出下面的定义,以更好地描述MDDIM。

定义1。 表明企业的集合,使用第三方平台,如供应商、制造商、销售商和服务提供商(4 s店)。

定义2。 代表所有企业的内部平台设置( ),如采购平台、销售平台和服务平台。

定义3。 代表所有数据资源集的内部平台( ),如基本数据资源、数据资源,领域数据资源,企业数据资源。它也可以表示所有数据资源的TPP集。

定义4。 代表属性的集合中包含一组数据资源( )。例如,一组部分数据资源属性包括名称,供应商属性,属性,价格来源属性和产权属性。

定义5。 代表一个属性,它是一个变量组成的指定的数据类型和值范围。其中, 表示属性名称; 表示数据类型; 表示范围,它分为连续区间和离散范围; 代表了不同价值关系的属性,它分为三种,即比较关系(CR)、偏序关系(PR), (BR)和归属关系的类型范围,如表所示2

定义6。 代表一个属性名称-值对( ),指一个特定值的属性,及其数学表达式是什么 在这篇文章中, , 是用来代表主体的属性名称-值对,对象,分别和实体。

定义7。 代表一个属性谓词( ),用于定义的范围值的属性,及其数学表达式是什么 在这篇文章中, , , 用来表示属性的谓词的主题、对象,分别和实体。

定义8。 代表的可满足性结果 ,和它的具体含义如下。

代表的可满足性结果 ,也就是说,鉴于 ,如果他们的属性名称相同的值 定义的范围内吗 ,然后可满足性的结果( ) 是真的;否则,可满足性的结果是错误的,其数学表达式如方程所示(1)。 在哪里 代表的可满足性结果 ,也就是说,鉴于 ,如果 使 真的,可满足性的结果( ) 是真的;否则,可满足性的结果是错误的,其数学表达式如方程所示(2)。 在哪里 代表的可满足性结果 ,鉴于 ,如果 使 真的,可满足性的结果( ) 是真的;否则,可满足性的结果是错误的,其数学表达式如方程所示(3)。

定义9。 表示数据集成的要求,它分为两种类型:积极的请求和消极的请求。积极的请求是指由第三方平台数据集成请求发起企业的内部平台,和消极的请求意味着数据集成请求发起企业内部平台的第三方平台。具体含义如下:
代表的主体属性名称-值对。
表示对象属性名称-值对的集合。

定义10。 代表了数据集成规则。这是一个规则定制的企业( )汽车制造产业链和具体含义如下。 代表了一个自定义的规则集。

代表一组主题属性的谓词。

表示对象属性的谓词。

代表一组实体属性的谓词。

代表是否执行数据集成。其中, 表示允许, 表示否认。

定义11。 表示请求的可满足性的结果和数据集成的规则,及其具体含义如下:
代表的可满足性结果 ,也就是说,鉴于 ,如果 是真的,可满足性的结果( ) 是真实的(例如, 满足 ),否则它是假的(例如, 不满足 ),及其数学表达式见方程(4)。

在哪里 代表的可满足性结果 ,也就是说,鉴于 ,敌我识别 使 真的,满意的结果( ) 是真实的(例如, 满足 ),否则,它是假的(例如, 不满足 ),及其数学表达式见方程(5)。

在方程(5),如果 是真的,那么 是正确的,也就是说,至少有一个吗 这使得 真实的。如果只有一个规则满足要求,直接进行数据集成,和相应的存储数据及其关系。如果两个或两个以上的规则满足请求,数据集成的执行是基于最新的时候创建的规则和相应的存储数据及其关系。

总之,多方动态数据集成模型的数学表达式的产业链协作平台所示方程(6)。

它可以看到从方程(6),该模型定义了多元属性之间的关系 当且仅当所有的多元属性关系方程(4)是真的,可满足性的结果 是真的。条件下, 是不变的,我们可以动态地增加或减少的属性条件 控制的粒度动态整合多方数据(见部分5.1),所以MDDIM具有良好的灵活性,能够适应复杂的数据集成环境。

4所示。集成决策算法

综合决策算法(参见算法1)是核心算法实现多党动态数据集成模型。它是用来解决的可满足性结果请求( )和规则( )。如果可满足性的结果( )是假的,数据集成是拒绝执行。如果可满足性的结果是正确的,只有一个规则,满足要求,要执行的数据集成允许根据规则( )。如果可满足性的结果是正确的,至少有两个规则,满足要求,基于最新创建的规则执行时间允许数据集成。算法1的具体内容如下。

输入: ,
输出:允许或拒绝数据集成
1。艾达
2。Foreach
3 .如果 然后
4所示。
5。
其他6。
7所示。
8。
9。如果
10。结束了
11。
12.如果 然后
13。
14。如果 > = 2然后
15。Sort_Desc
16。得到最高1
17所示。允许数据集成的基础上
其他18。
19所示。允许数据集成的基础上
20.如果
21.其他
22。否认数据集成
23。如果
24。最后艾达

5。案例分析和实验分析

5.1。案例分析

在本节中,“ASP /基于saas的制造业价值链协作平台”(17)作为一个例子来说明多方动态数据集成的实现过程。根据实际需求部分采购业务的合作,我们给主体属性的值之间的关系,对象属性和实体属性如图2(一个),2 (b),2 (c),分别。具体含义如下。

主题属性采用源平台连续属性( )和目标平台连续属性( ),在哪里 包含三个序列号的源平台和目标平台,分别。

对象属性采用部分制造商属性( ),质量属性部分( ),和部分来源属性( )。其中, 包括原始工厂( ),副厂( ),和替代工厂( ); 包括高质量( ),中等质量( ),和低质量( ),有一个关系 在这种关系。” 意味着左边的符号是优于或等于右边,和“ 意味着比左边的象征或等于右边。

实体属性采用部分制造商属性( )和质量属性部分( )。的词典库 如图2 (c)

数据集成的形式描述请求( )表所示3数据集成的规则的正式描述( )表所示4和的值的定义 , , , 如图2

鉴于 (表3), (表4),可满足性规则和请求通过IDA的结果。如果有多个可满足性的结果(也就是说,多个规则满足要求),根据最新规定,执行数据集成和集成结果如表所示5。本文假设” 意味着数据集成是允许的,也就是说,至少有一个规则( )满足请求( ),和“ 意味着数据集成被拒绝,没有规则( )满足请求( )。

从表可以看出5这两个 有两个规则,可以满足。假设降序排列(即。降序排列的时间: , , , , , )根据下标的规则,它可以得出的最新规则 ,然后,基于执行数据集成 没有规则,可以满足,所以他们的数据集成的请求将被拒绝。

基于上述情况,我们动态地定制数据集成规则( )基于MDDIM并期望能够控制的粒度多方动态增加或减少的数据集成 年代属性条件。例如,在数据集成规则集(表4),我们添加一个属性条件 如表所示6。鉴于 (表3), (表6)在这种情况下,规则的可满足性结果和请求解决IDA如表所示7。从表7,可以看出 不能满足所有 在表3。同样,我们减少一个属性条件( ) (表4), 仍然不满足 在表7。可满足性的结果,可以看出,增加或减少 年代属性条件可以有效地控制的粒度数据集成和增加MDDIM的灵活性。

5.2。实验分析

本节需要的部分采购业务合作“ASP /基于saas的制造业价值链协作平台”15作为一个例子进行实验分析多方动态数据集成。实验环境是一个局域网,我们不考虑传输延迟。企业的内部平台的电脑配置是Intel Xeon e5 - 2699 V4 2.2 G, 32 G内存,操作系统是Windows Server 2016,第三方平台的电脑配置是Intel Xeon e5 - 2680 V4 2.4 G, 32 G内存,操作系统是Windows Server 2016。相同的数据集成引擎部署在企业内部平台和第三方平台,用于启动集成要求,同步规则和执行算法。

可扩展访问控制标记语言(XACML) [18)是一种开放标准语言基于可扩展标记语言(XML),也是一个通用的访问控制语言决定请求/响应。不仅仅是一个框架,用于表达和传播规则也是一个框架实现集成的规则。XACML具有良好的交互性、通用性和可扩展性。在本节中,XACML是用来提供统一的写作规范数据集成规则和要求。

在实验分析规则的复杂性,我们写1 (与400属性)和40 (每一个都有不同数量的属性和在1 - 400)基于XACML的。在相同的实验配置条件下,可满足性的结果 被艾达和解决过程重复10次,时间分别记录相应的解决方案,然后,平均值平均解决时间(AST)。的数量之间的关系属性和ast如图3

从图可以看出3随着规则属性数量的逐渐增加,相应的AST也逐渐增加。我们可以得出结论,两者之间的关系成正比,而且规则的复杂性取决于属性的数量,也就是说,大数量的规则属性,复杂性越高,相应的数据集成的粒度越细。根据企业数据集成需求的内部平台和第三方平台,规则的复杂性通常在10 - 200属性,和相应的AST之间的差距很小,所以规则有一个小的复杂性对数据集成的性能的影响。

实验分析的集成和查询(19)的数据,我们比较OBDIM MDDIM在本文提出12和SMDIM13。在相同的实验配置条件下,数据集成和查询执行基于上述三个方案和过程重复10次,记录相应的积分时间和查询时间,然后,分别形成平均积分时间的平均值被(AIT)和平均查询时间(AQT)。在数据集成比较实验中,集成的数量之间的关系和河中的小岛如图4(一)。在数据查询比较实验中,查询的数量之间的关系和AQTs图所示4 (b)

从图可以看出4(一)当数据集成的数量小于710年,AIT MDDIM比OBDIM SMDIM。当数据集成的数量比710年高,AIT OBDIM比MDDIM SMDIM,其中的原因是MDDIM SMDIM采取更多的时间处理更多的数据基于规则,虽然OBDIM只需要建立一个映射关系,且不需要处理数据,因此其自燃温度相对较低。从图可以看出4 (b)数据查询的数量逐渐增加,相应的AQT也逐渐增加。的AQT MDDIM优于SMDIM OBDIM。原因是OBDIM查询数据需要处理的映射关系,而MDDIM和SMDIM可以直接查询数据,所以他们AQT比OBDIM低。据的数据集成和查询需求企业的内部平台和第三方平台,集成或查询的数量通常是不到600。显然,从实验结果,MDDIM提出优于SMDIM OBDIM。

6。结论

本文旨在解决数据集成问题的多个企业之间内部平台和第三方平台,提出了一种多党动态数据集成方案产业链协作平台。一方面,这个方案解决问题的不规则的数据建立一个标准的数据分类系统。另一方面,它解决的问题困难的数据集成,通过建立多党动态数据集成模型。本文验证了可行性、灵活性和多党动态数据集成方案的合理性通过案例分析和实验分析。

本文的研究主要是集中在汽车制造产业链,产业链,目的是帮助企业实现信息互联和数据值最大化。改善企业的经验,未来的主要工作将是进一步优化的方式定制数据集成规则和第三方平台的可视化界面。

数据可用性

使用的数据来支持本研究的结果包括在本文中。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作得到了中国国家重点研发计划yfb1701500 2018号和2018号yfb1701502。