文摘
开发和提取重要信息的事件的数据与过程相关的事件日志,挖掘过程。主要有三个基本类型的过程挖掘的解释与输入和输出的关系。这些都是过程发现,一致性检查和提高。过程发现的一个最具挑战性的过程基于事件日志的采矿活动。业务流程或系统性能起着至关重要的作用在造型,分析和预测。最近,一个无记忆模型,如指数分布的随机Petri网获得了研究和行业的关注。本文使用时间角度进行建模和分析,使用随机Petri网检查性能,进化,模型的稳定性和可靠性。评估在射击的过渡时间延迟的影响,随机回报网使用模型。模型也可以用于检查模型的可靠性,而广义随机Petri网用于评估和检查的性能模型。用于稳定性分析状态转移的概率和从一个状态到另一个地方。然而,在采矿过程,所使用的日志链接日志序列的状态,,造型可以做,它与稳定的模型可以建立。
1。介绍
过程挖掘的分析方法发现,监视和提高实际过程从事件日志中提取信息,在现代信息系统都是免费。它提供了有针对性的事实根据事件日志,帮助做研究,分析,改进现有的业务流程。
目前,流程挖掘已经观察到作为一个重要的技术和业务流程的应用程序中使用,因此在很多组织中成功应用。这是一个以过程为中心(not-data-centric),真正聪明(读取历史数据),并基于事实(事件数据而不是理论)。除了过程发现,挖掘过程允许自动发现过程模型的事件日志提供洞察,使各种类型的基于模型的分析。收购过程模型可以扩展的信息来预测消除功能的条件。特别是,捕获业务流程的活动和等待时间所需的理解过程的效率。此外,这些丰富类型用作源预测算法,用于预测时间,直到过程完成。提供一个解释的时间预测,一组命令,允许“过度拟合”和“underfitting”之间的良好平衡。值得注意的是,这句话“过度拟合”和“underfitting”nonfitting正交。模型是无效如果视觉线索不按照这种模式出现。建立剩余的业务流程的运行时,它的功能是一个重要的管理功能,允许改善资源配置。 This also improves the quality of results when clients inquire about the status and expected completion of a given business process.
过程挖掘过程的三个主要类型的发现,一致性检查和提高。在本研究工作中,注意是放置在发现过程。众所周知,过程中发现,不使用任何先验信息,事件日志产生过程模型。在事件日志的情况下有任何关于资源的信息,model-related资源,例如,社交网络,可以发现,能够显示不同的人在一个组织共同工作。另一方面,流程模型可以用于分析成本,资源利用率,或过程性能和自动化。模型是用于重新设计流程规划和控制,使决策过程中。有两种类型的流程模型:(i)正式的模型用于讨论和文档和(2)非正式模型用于分析或制定。在这个研究中,非正式的造型。有一些错误发生在造型:(i)当模型定义了一个准备版本或事实,(ii)未能正确做的人类行为,和(3)模型是在错误的抽象层次。
对于信息系统,分析评价已经成为整个过程的一个组成部分的设计。规范技术提出了许多不同的模型,例如,佩特里网,BPMN, UML函数图,BPEL和EPC。佩特里网广泛用于业务流程作为第一个模型语言或作为验证的基础。佩特里网于1962年首次引入卡尔·亚当·皮特。它可以被描述为一个图形化的方法正式定义的逻辑组件之间的交互或流动的活动在一个复杂的系统。特别适用于模拟并发性和冲突,测序,条件分支和循环,同步,有限的资源分配,和相互排斥。它使模拟系统的研究逻辑属性为每个单独的有限状态机,它可以被看作是可能的,但显示了交互时发生在使用背后的佩特里网中教授。佩特里网分类是应用和理论中净(ATPN)和皮特里网和性能建模(规划),包括随机Petri网。原来佩特里网没有时间的符号,因此用于研究逻辑属性。为了在佩特里网推出时间,我们把事件数据与过渡,对可用性很重要,可靠性和性能量化。因此,佩特里网的主要原因是扩展到有时间与事件发生,引起随机Petri网。
介绍了随机Petri网在1980年早些时候。它的图形表示用于离散事件和造型两偶图转换和的地方用于了解事件机制。同样值得注意的是,发射的时间标记被认为是一个随机变量和指数分布。可达性图的随机Petri网是一个持续的燃烧率与每个转换和可能marking-dependent。如果给定的历史过程,例如,随着时间的推移,事件日志信息,可以提取随机性能数据并将其插入到模型。因此这个研究论文是基于广义随机Petri网不限制分布在一个特定的方式。非常有用的情况下一些事件发生在非常小的时间。而SPN模型处理这种情况下模型中通过引入直接过渡燃烧时间为零,其他转换时间转换的指数分布。在这个研究中,随机回报网的使用是为了检查生存能力和可靠性。基本上是一个扩展的它是在1989年被引进的。SRN广泛marking-dependent用于发射率和概率优先转换。因此有优势在这个意义上,分析状态转移的概率和稳定性的一种状态到另一个地方。过程的日志,日志序列是基于结果的执行和不完整的状态转换的结果。因此,本文链接日志序列状态稳定的模型和分析。
本文的其余部分组织如下:第二节,讨论了相关工作第三节,初步定义了第四节讨论了广义分布式过渡随机Petri网模型的例子。第五节阐述了关于随机回报网、生存能力和可靠性模型。结论提出了第六节。
2。相关工作
一些相关文献与Petri网模型和随机特性信息的总体性能提出了文献综述。胡锦涛et al。(1提出了一种技术,主要是基于模型指数分布式工作流日志和发射率取决于过渡。Anastasiou et al。2)提出了完全独特的策略,他们集中在广义随机Petri网模型的位置数据为客户造型流动。在研究工作过渡区间,他们使用常数hyper-Erlang分布也显示了等待和运行时间和使用升级相对应的其他子网的转换描绘hyper-Erlang分布具有相同的特性。他们观察到所有的转换序列中的独立没有造成问题,但方法内的相似之处,尤其是许多类似的转换,并没有考虑他们的技术。
根据勒克莱尔et al。3),non-Markovian随机Petri网和尝试引发存在。他们看着一种去除模型的正态分布数据。在他们的工作,他们完全专注于预测算法收敛准备最大化。在这项研究中使用的方法相比,他们无法管理数据丢失和不同性能的指导方针。重建模型参数的随机结构也进行的一项研究瓦斯et al。4),他们处理问题的调整模型参数的基本随机系统。与本研究相反,过渡的分布系统有针对性的提前,但主要目的是使GDT_SPN版本转换与,例如,不完整的Wombacher和Iacob [5)统计估计的分布没有初始进程。Rozinat et al。6)检出如何获得记录仿真模型,试图发现数据依赖关系主要是考虑发现最优标准一致性模型和日志,做手工的回答做出决策,意味着持续时间和时髦的偏差,因为在那之前这些都不考虑。本文提出的技术已经成功地处理噪声在更更好的通过建立联盟的概念,这是能够挑选最好的方向穿过嘈杂的跟踪模型。据van der阿尔斯特(7),可用的流程挖掘技术用于考虑噪声和用于创建控制流的概率,以及业务流程建模的重要性是公认的。最好的方式来表示这些方法是随机Petri网,即主要研究任务的过程挖掘业务建模。Rogge-Solti et al。8)提出了一个算法的研究工作过程中发现的每个执行和使用不同的原始发现各种类的事件数据 。在他们的研究中,他们使用符号对齐基于插件的过程挖掘的框架。
3所示。预赛
提出了以下概念和技术应用在纸上。首先,我们的重点是对事件日志和 和日志序列。
3.1。事件日志
它是一组收集的病例 所以每个事件在整个执行一次日志;即。,为any 这样 如果事件日志包含时间戳,跟踪订单必须尊重这些时间戳。也就是说,对于任何 这样 。
3.2。状态
这意味着一个特定的条件,为一些特定的目的系统使用在特定时间。让 是 。 表示状态空间c。 是一个状态,展示了一个多重集的悬而未决的义务。
3.3。序列
最自然的方式呈现序列的事件日志的痕迹。点,我们需要解释的功能语义和产品化的系统是怎样制成的,性能也模仿的序列,提出了一些有用的操作序列。如果 表示一组所有有限序列 。一个有限序列长度为是一个映射 。在这种情况下,序列以字符串形式表示;也就是说, ,在哪里 为 。 显示了序列的长度;也就是说, 代表序列的元素 。同样的, 添加序列和造成一个序列的长度 。
3.4。佩特里网
佩特里网最初提出的1962年c·a·佩特里。佩特里网正式是一个5-tuple 在哪里(我) 是一个有限集合的地方(圆)(2) 是一个有限集的转换(酒吧)(3) 是一组弧形连接(iv) 是一个加权函数(v) 标记代表数量的令牌(黑点)和初始标记是表示为 。
是一个图形表示的节点根据地方和转换。弧连接的地方通过过渡称为输入过渡弧和弧连接从过渡到地方叫做输出过渡电弧,正数是连接到每个弧。地方连接到输入弧称为输入的过渡的地方,反之亦然。每个地方可能有零个或多个令牌。转换启用如果每个输入的地方至少有尽可能多的令牌对应输入弧。使转换可以被解雇。当我们有了令牌,令牌的数量等于输入弧多样性从每个输入的地方,而令牌的数量等于输出弧多样性存入输出的地方。佩特里网一个标记转换为另一种是通过使用转换,在可达性 ,显示了初始标记和定义是解雇转换的序列标记和总是紧随其后开始通过初始标记。众所周知,一个是一个5-tuple 。
图1描述了Petri网模型作为标记向量计算的令牌数量每个网:
过渡以防输入地方启用所需数量的令牌。
图2显示了启用转换可以通过发射一定数量的令牌从输入的地方,然后将它们放到输出的地方,例如。
在现实世界中,佩特里网在很多情况下可以使用基于序列,并发、同步和冲突。我们现在在图3并发/并行随机Petri网模型,在图4我们现在的独立性和图5显示了同步的随机Petri网模型。可达性分析的随机Petri网呈现在图6。然而,在计算机网络中,佩特里网描述了通信协议。在原始的定义 ,时间观念不包括动态的绩效评估系统;因此,重要的是现在的时间延迟与每个转换的Petri网模型。这个概念过渡放电出现的时间延迟 。
3.5。随机Petri网
在 ,使用data透视图之间因为流信息描述的任务可以和每个转换与点火时间呈指数分布。可以被描述为一个工作流净如果(i)只有一个起点和(2)一个地方结束,(3)每个节点有望从开始到结束的任务。广义随机Petri网 ,转换是定时(点火时间由矩形框表示)或直接(零点火时间,由黑条)。总是优先考虑直接交接时间转换为发射。通常,我们使用概率质量函数为了完成发射和打破立即转换之间的领带。在标记完成,至少立即转换允许标记是可见的。抑制剂弧也介绍了用于连接过渡的地方。终止点的箭头有一个小空心圆这表明它是一种抑制剂。如果输入的地方抑制剂比多样性弧弧含有更多的令牌,然后在这一点上过渡与抑制剂电弧不能被解雇。
已经证明的条件有限数量的转换与连续时间马尔可夫链与可以在有限的时间内发射非零概率。当随机Petri网是用于计算机网络性能评价、地方标有包或细胞在缓冲区或活跃的用户或系统中流动,而他们的到来和离开表示与转换。
4所示。广义分布式随机Petri网过渡
它是基于seven-tuple ,而基本的Petri网 ,在哪里(我) 是一组转换等于 基于直接和rim转换(2) : 优先级过渡, 和 (3) : 代表了概率权重直接过渡(iv) 是一个任意概率分布定时的转变,反映了相应的活动时间
在图7我们提出广义分布式过渡随机Petri网模型两个并行的分支,和上面的模型显示了转换之间的冲突 。
4.1。基于案例对齐
案例对齐方法更强大的比天真的回放日志的模型,因为它确保全球可用性最好的惩罚异步回放的一部分。因为有两个执行跟踪和上面的模型中,假定直接转换是看不见的,而时间转换是可见的。在这项研究中,重点是针对模型中的看不见的转换用对齐 ,而不是安装在模型中。所以,为了克服这一点,最佳一致性模型和日志发现Adriansyah提出的使用方法等。7),使序列重复运动跟踪和模型。
因此,这些运动可以是日志,同步移动,移动或模型。表1显示了扩展的模型匹配的痕迹下标净每个事件的转变。表2给我们完美对齐基于同步或无形的模型动作。同时,多个比对痕迹展示在表3。因此,表4显示的事件日志都是基于最优模型的校准和日志。符号丝毫没有进展。基于成本的一致性提供了不必要的处罚措施,和高成本不包括最优比对。
5。随机回报网
:基本上,是一个扩展的 。在随机奖励,奖励,与每一个可见的标志。因此,绩效评估的方法有很多。也给了我们许多其他的方式,让我们的规格方便,如下:(我)每个转换可以使函数(也称为保安),这只会让过渡启用如果他们标记依赖函数是正确的。本规范提供了优越的方法提高图形表示形式,使容易理解。(2)重复弧标记是允许的。可以使用这个特性的情况下转换的令牌总数取决于当前的标记。(3)标记的依赖燃烧率是被允许的。这个规范使发射值过渡到指定的令牌数量在任何佩特里网。(iv)转换可以提供不同的优先级,和转换只启用如果没有启用其他高价值的转变。(v)传统撤离措施中发现的期望作为一个过渡的包容和平均数量的令牌的地方,最困难的奖励工作现在可以被定义。
主要的可用性评估方法取决于建模和测量方法。系统可用性基于模型的方法更有效和便宜的比计量方法进行分析和比较。离散事件仿真可用于系统建模,然而,对于分析模型,可以使用两种方法。分析模型可以分为四个主要部分:(1)可靠性Nonstate-space模型(图)(2)可靠性框图(RBD)(3)故障树(4)状态空间模型(马尔可夫链,随机Petri网等)
分层模型、固定迭代点模型和非政府的范例提供一个快速概述(可靠性、可用性和系统的基本指标 )与适当的扫描和系统的体系结构。然而,状态空间模型捕获复杂的功能和系统的性能。这种方法也可以能够管理失败或修复系统组件之间的依赖关系和复杂的连接。为了避免各种问题在州一级,nonstate-space造型方法和状态空间模型对其他点也可以使用。
可用性在任何即时显示正确的状态的概率在操作系统没有考虑区间内 。瞬时可用性相关计算系统的可靠性
显示瞬时可靠性,可以定义如下:
是随机变量的概率密度函数代表系统生命周期或时间失败;代表的更新过程率区间 。
代表的概率更新过程周期时间间隔将完成的 显示系统正常工作的概率在剩下的时间间隔 。 显示了断层的情况已经占据的概率,和维修或更新会再采取功能没有进一步的缺点。的概念类似于可靠性如果系统无法修理。
很长一段时间,我们有稳态可用性 ,在初始状态我们有限制的价值在哪里减少1。因此, 在哪里代表时间失败率和系统 ,修理时间,确定的平均数量的维修维护领带。
(平均失效到达时间)代表的期望时间系统功能正确之前首次失败。平均修复时间显示了系统预期的时间用于修复。的平均失效到达时间和平均修复时间指数分布时,算法反演系统的故障和修复率如下:
在硬件和软件的工业过程中,随机回报网是一个适当的建模工具。在图8,我们现在可用性模型,可以指定系统操作通过使用转换,弧和地方的主要部分。随机回报网可用性框架是基于三个阶段:(1)需求规格说明书(2)SRN-based系统建模(3)系统分析
5.1。生存能力和可靠性模型性能检查
生存能力和可靠性模型可以用来检查的性能失败的瞬态行为发生后,攻击,和灾难。可以看出一个泛化的恢复时间意味着多少效果可以在恢复时间。生存能力可以查看模型的性能通过使用“系统平均解释时间指数”在短形式称为SAIDI模型。
说的预测模型 在哪里显示了模型和可用性 显示了生存能力。简而言之,可以说,SAIDI可用性和生存性模型的组合。
因此,的失败部分” ;“经过失败的部分” ,“我们有(我) :时间完全康复(2) :能源要求全面复苏(3) :能源不是提供全面复苏
它也可以用来预测经济复苏矩阵;与可用性模型耦合后,广义说形式如下:
6。结论
总之,可以看出系统的性能或业务流程中扮演一个重要的角色在造型,分析和预测。如今,无记忆模型,如指数分布的随机Petri网(SPN)获得了研究和行业的关注。本文是基于时间的角度建模,分析,和使用的随机Petri网检查性能,进化,模型的稳定性和可靠性。知道在射击的过渡时间延迟的影响,我们使用随机回报网(SRN)模型。随机回报网(SRN)模型还可以用来检查模型的可靠性。广义随机Petri网(GSPN)是用于评估和检查的性能模型。众所周知,随机Petri网是用于分析的概率状态转换从一个状态到另一个稳定,然而,在采矿过程中,所使用的日志链接日志序列的状态使造型完成,相关模型的稳定性。广义分布式过渡随机Petri网模型用于检查的性能模型。案例对齐是用来检查的最优轨迹之间的对齐。说模型是用来检查的生存能力和可靠性的广义随机Petri网模型。 This paper deals with mathematical and theoretical work that shows how checking the importance of stochastic Petri is done in order to know the performance of the discovery process model and analysis. Further work can be done on its practical application.
数据可用性
使用的数据来支持这个研究的发现包括在本文中。
的利益冲突
作者宣称没有利益冲突。