文摘

系统拥有超过两个州被称为多态系统(MSS),和这样的系统已经成为普遍趋势领域的复杂的工业产品和/或系统。容错技术经常扮演着非常重要的作用在提高可靠性的海量存储系统(MSS)中。然而,不完美的存在覆盖失败(ICF)工作小组(WSG)降低了MSS的可靠性。提出了一种方法来评估的可靠性和灵敏度ICF的海量存储系统(MSS)中。WSG中的组件可以合作,提高整体效率的提高性能水平。使用这种技术的通用生成函数(随时备战),组件的随时备战表达式与ICF可以合并两个步骤。在系统的计算,一个算法基于矩阵(ABM)是发达国家减少计算复杂度。因此,可靠性指标可以很容易地计算基于随时备战的海量存储系统(MSS)中表达。灵敏度分析可以帮助工程师判断哪些WSG应该取消第一次在各种资源限制。的例子说明了这种方法并验证。

1。介绍

容错系统是一个高可靠性的系统通过合并冗余组件设计的关键元素是为了防止整个系统失败,即使一些单个元素失败。容错系统中经常使用生死攸关的应用,如飞行控制、核电站监视和太空任务和任务关键型计算机监控系统和数据存储系统(1]。除了冗余、容错的实现还需要自动恢复和重构机制。也就是说,即使存在足够的冗余,如果系统不能充分探测、定位、和从内部故障恢复和/或错误发生,整个系统或它的一个子系统可以失败2]。容错的程度取决于系统的故障比例自动恢复,这些错误是说由恢复策略3]。因此,这种系统的可靠性分析必须考虑的过程缺陷和错误检测和恢复,以及复杂的系统结构。

确定系统的容错问题及其趋势已经深入探索,用特殊方法和分析技术来评估系统的可靠性提出(4]。一个新的、简单,有效的方法是提出了将不完美的故障覆盖率为组合模型(5]。一些系统进行的优化设计已经制定了不完美的故障覆盖率G:(k / n)结构6]。此外,系统的最优可靠性受到同样的原因,不完美的故障覆盖率,已经推广到更多的系统包括并串联、串并联,平行,等等,而非年代相同的组件中(7]。根据类型的容错技术,适当的建模方法multifault报道提出容错系统可靠性评价指标,它是容易使用的故障率水平覆盖组织的层次结构(8]。一种方法提出了基于二元决策图分析的可靠性和灵敏度基准网络(9]。基于总概率定理和各个击破的策略,一种新的组合方式处理函数相关性提出了在不完全覆盖系统的可靠性分析10]。一个长期被忽视的问题是,最初相关组件可能会成为无关紧要的其他组件的失败后,这个问题已经通过报道无关的组件的系统建模与不完美的故障覆盖率(11]。

海量存储系统(MSS)中可靠性理论和相关概念从许多方面进行了调查。在海量存储系统(MSS)中,系统及其元素可以在一系列不同的性能水平函数,例如,从完美的行动彻底失败。一个通用矩生成函数扩展常见失败原因合并到海量存储系统(MSS)中可靠性估算(12]。一种新的二阶可靠性方法没有抛物线近似拟合二次曲面的改善提出了可靠性分析的准确性(13]。MSS的可靠性建模与预防性维护和客户的需求,提出了提高可靠性的海量存储系统(MSS)中(14]。采用卡尔曼滤波方法估计系统和退化的传感器状态是基本计算可靠性动态维护决策(15]。生命周期成本建立可靠性模型与介体系统与多个相关的降解过程和环境影响16]。模拟常被用来评估海量存储系统(MSS)中,因为它直接计算复杂度分析方法(17]。同样,基于生存的一种有效的模拟方法签名提出了系统可靠性分析(18]。一个复杂的框架基于集成直接部分逻辑导数(DPLD),其计算复杂度与系统组件的数量,不依赖于结构复杂的海量存储系统(MSS)中,定性和定量分析了临界[关注组件19]。计算与DPLD关键系统状态,多值逻辑的可靠性分析方法用于海量存储系统(MSS)中(20.]。应用结构函数提出了时变可靠性分析,和DPLDs也可以用来找到最常见的已知的公式计算时间重要性的措施(21]。除了上面提到的这些方法对可靠性,也是至关重要的决定在海量存储系统(MSS)中每个组件性能的影响。由于非MSS及其组件的状态以及不同状态相同的组件之间的依赖性,MSS的可执行性分析变得更加困难和多值决策图提出了作为一个有效的算法来分析海量存储系统(MSS)中(22]。在工业产品退化性能是一种常见的现象,质量和可靠性是一个重要的海量存储系统(MSS)中提供所需的性能水平。一个集成的路由风险模型和风险控制性能也证明了模拟算法(23]。其他风险评估模型和风险多准则决策步骤开发(24,25]。专注于性能分析和优化,构造一个无线传感器网络框架(26,27]。关于工业cyberphysical系统,安全控制和性能监控也集中在回答他们是多么迫切和需要什么程度的容错和故障恢复(28- - - - - -30.]。尽管许多研究人员投入工作的不同方面系统的可靠性和性能,计算复杂性问题的海量存储系统(MSS)中往往是臭名昭著的诅咒的一个因为“维爆炸。”

海量存储系统(MSS)中也会受到不完美覆盖失败导致整个整个系统或子系统的失败。基于有序二元决策图,一个高效的算法的可靠性评估海量存储系统(MSS)中,组合性能需求主体不完全故障覆盖提出了(31日]。考虑系统组件状态的重要性的海量存储系统(MSS)中,格里菲斯的重要性和可靠性评估的措施的组合条件概率的方法来找到解决跨州不完美的故障覆盖率模型(32]。一个最优结构的海量存储系统(MSS)中发现故障可以通过适当的平衡达到最大可靠性两种类型的任务并行化:并行任务执行工作共享和冗余任务执行(33]。三种不同类型的海量存储系统(MSS)中不完美的故障覆盖率,级覆盖,故障率水平覆盖,和performance-dependent报道,建模评估系统的可靠性34]。以后,类似的两种类型的并行化的海量存储系统(MSS)中multifault报道研究了获得最优平衡基于各种设置的故障覆盖率(35]。提出了随机多值模型来预测一个多态phase-mission系统的可靠性与三个不同的条件不完善的故障覆盖率,和该模型的效率比通用生成函数(随时备战)技术(36]。子系统内的海量存储系统(MSS)中,当恢复机制的有效性取决于整个子系统的性能水平,MSS性能分布可以通过递归过程基于随时备战的37]。广义可靠性框图法的修改提出了MSS的可靠性评估与不完美multifault报道(38]。然而,这些模型和方法的计算时间正比于组件的数量,因此,计算复杂度高。随时备战是有效的工具处理的性能分布复杂的海量存储系统(MSS)中(39],许多可靠性评估的研究海量存储系统(MSS)中采用它作为主要分析工具40- - - - - -43]。

本文的创新在于,修正后的方法提出了基于随时备战的技术评估的可靠性与不完美的海量存储系统(MSS)中报道失败(使用)。这里ICF建模,通过融合working-share集团(WSG)的计划,这是类似于并行结构。然而,他们是两种不同类型的数据传输方案。在评估期间,一个算法基于矩阵(ABM)是开发大大降低计算复杂度。这种方法与其他方法相比时间消费。此外,灵敏度分析可以由工程师决定与ICF工作组在有限的条件下应该首先被淘汰。

本文的其余部分组织如下。部分2描述了不完美覆盖故障模型。节3,随时备战的技术修订将ICF为了执行的可靠性和灵敏度分析与ICF海量存储系统(MSS)中。节4,这种方法如下几个应用程序。部分5包括作者的结论,并建议未来的研究处理MSS的可靠性。

2。建模的不完美的覆盖率和海量存储系统(MSS)中

2.1。不完美的覆盖模型

有许多模型为ICF开发,如级覆盖模型和故障率水平覆盖模型。在这里,集中的结构不完全覆盖模型与单点失败可以建模为图所示1为可靠性分析(10,44]。单点失败也执法单故障组件,其覆盖概率完全取决于失败的组件的属性。的入口点模型代表一个单点故障的发生与三种可能的结果。他们是三种类型的——退出R,C,年代——表示,分别不同的可能的结果与不同的退出概率 退出R表明冒犯失败是暂时的,可以没有丢弃处理组件。退出C意味着永久覆盖的一个发生故障的组件需要被丢弃系统的正常运行。退出年代是一个单点失败表示的发现而不丢弃组件导致系统故障。当一个单点故障,有三种可能的结果。因此,他们由一个分区的活动空间,和三个退出概率总和一个,即 多点的失败,来描述系统故障是因为并发故障的多个组件。它会在未来被建模和研究。

为了提高容错系统的可靠性与不完美覆盖失败,计划工作小组(WSG)介绍33]。WSG通常是由几种相同的组件并联,并形成一套。每个组件将实现一个不同的子任务,使其WSG能够完成整个任务。多通道数据传输系统一个B,如图2的组件C1,C2组成WSG分享下工作的重新配置数据交换管理系统(民主党)。在这里,民主党可以认为它不存在的失败,因为它的形式可以实现为内置的软件或其他形式。WSG平行的组件C3,这样他们可以一起进行数据传输任务。因为民主党的存在,同样的包传输的数据的任务C3 DP3分为两个部分,DP1 DP2,根据组件的性能C1,C2。在这种假设下,如果WSG中的一个组件,比如C1,失败,民主党可以发现它并再次不包分配数据。这种类型的失败可以被定义为失败。民主党将重新分配数据传输任务C2。WSG将不是完全失败,但其性能将因此减少。然而,如果C1失败但民主党不能发现它并且继续分配数据传输C1,C1将在退出状态年代,即单点失败。失败发生在这种情况下可以被定义为发现失败和WSG无法完成数据传输的任务。

平行结构的唯一目的是为了提高系统的可靠性。然而,如果没有民主党,数据不会被分割,打包,并系统的效率得不到提高传输包的数据。WSG引入到系统将提高效率,但由于系统结构的变化,可靠性可能会受到影响。

2.2。建模的海量存储系统(MSS)中

建模的目的一个海量存储系统(MSS)中,首先必须定义其元素的特点。一般来说,任何元素 在海量存储系统(MSS)中可以有 不同状态的性能水平,可以由一组表示 在哪里 元素的性能水平吗 在国家 , 当前的性能水平 的元素 在任何时刻在时间是离散随机变量值 : 每个不同的状态或性能的概率水平的元素 可以用一组吗 ,在哪里

此外,整个状态的一个元素构成一整套可以看作是互斥事件。也就是说,元素 总是会在一个且只有一个的吗 州,这样

的性能水平分布的元素 将完全取决于对的集合

系统元素有一定的性能水平对应各自的州在一个瞬间。MSS的建模性能水平完全取决于 因此,美国的海量存储系统(MSS)中确定完全状态的组件。现在,假设,海量存储系统(MSS)中 不同的状态和性能水平对应一个状态的海量存储系统(MSS)中在某一时刻可以表示为 在这种情况下,海量存储系统(MSS)中是一个随机变量用性能水平 这需要值的设置

概率质量函数(及)的海量存储系统(MSS)中可以获得性能水平如下:

使用笛卡儿积的操作,我们可以定义的所有可能组合的空间所有系统组件的性能水平

海量存储系统(MSS)中结构函数是自然引入

函数是组件的性能水平的空间映射到空间性能水平的海量存储系统(MSS)中。

从上面的分析,我们可以看到模型的海量存储系统(MSS)中包括两个部分:及所有系统组件的性能水平和系统的结构函数。这些可以改写如下:

在海量存储系统(MSS)中,其性能水平定义为任务完成时间,其可靠性的概率可以表示为系统满足的最大允许完成时间 从(5),可以获得一个 在哪里

另一个重要的措施是有条件的预期性能 这表达了系统的预期性能条件下,海量存储系统(MSS)中是一个可以接受的状态。在系统可靠性 ,这种方法可以计算

3所示。随时备战技术和可靠性评估

3.1。随时备战的技术

随时备战,也称为u函数或普遍z变换(45),已经被证明是一种有效的方法解决高维组合问题。随时备战的多态组件 与它的性能水平及可以被定义为一个多项式

随时备战的基本属性使整个随时备战的海量存储系统(MSS)中,组件的串联或并联连接,使用简单的代数操作获得相应个人随时备战的多态组件。代表及随机变量 ,运营商构成 定义在以下方程:

注意,多项式 代表所有可能的互斥组合的个人独立组件的随时备战。这个函数 根据确定的物理性质之间的交互组件的性能。

事实上,的推导 对于各种类型的系统通常是一个困难的计算任务。所示(45),从这两个角度的计算简单和推导过程清晰,代表 以递归形式是有益的。特别是,当一个海量存储系统(MSS)中有一个复杂的配置,整个系统可以表示成相应子系统的构成多态组件的子集。这个属性可以被定义

配置的海量存储系统(MSS)中总是可以表示为一个独立的子系统组成只包含组件连接并联或串联。对于任何组件连接并联或串联在海量存储系统(MSS)中,运营商构成可以递归地应用为了获得随时备战中间纯并行或纯系列的结构。

考虑MSS系统的一种类型,任务处理计算机系统的性能水平定义为任务完成时间。组件连接在系列中,系统的总完工时间是完成时间的总和所有组件。如果两个独立组件( )在系列工作,总完成时间的总和个人完成时间。这个函数 应计算相应参数的总和。对组件的性能在这种情况下被定义为

并行组件连接,总完工时间取决于组件的最短完成时间。这个函数 应获得所有参数的最小。因此,随时备战在这种情况下应该采取以下形式:

组件连接在平行WSG,任务处理可分为处理速度成比例。也就是说,组件可以共享任务根据他们的绩效水平。这个函数 应的逆其性能,随时备战的这副组件可以由函数 在哪里

3.2。可靠性分析与ICF海量存储系统(MSS)中

ICF的海量存储系统(MSS)中,其单点失败通常可以建模为国家与分配性能水平(031日]。分配的性能水平可以配合组件性能的永久性的报道。具体的性能水平与系统属性,这也可能是分配给 根据(8),它可以扩展 在第二项 代表了随时备战的组件 除了其单点故障状态。如果组件没有单点故障的

WSG与单点失败,随时备战 可以获得的三个步骤:(1) 每个组件都可以表示根据(18), WSG是组件的集合。(2) 可以获得基于组件的操作的 由(17)。(3)随时备战 计算如下:

一旦获得ICF WSG随时备战的,它可以被看作是一个通用组件与其他组件根据操作系统的结构。随时备战的整个系统现在可以轻易表达。通过应用(9)和(11),可以计算可靠性指标。

在计算过程中,计算的复杂性决定两个组件总是随时备战的高,如果只是手工计算。这就是为什么该算法基于矩阵(ABM)。反弹道导弹的七个步骤,以及子步骤如下:步骤1:随时备战的两个组件可以用矩阵表示一个B,分别。这两个一个B由两个行和吗n列。第一行是性能水平,第二行是其相应的概率。列的数量一个B可能是不同的。第二步:定义一个矩阵C两行。的数量C列等于的产物一个列乘以B的列。矩阵C用于存储的原始值矩阵的乘法一个B根据特定的计算规则。第三步:通过应用dual-iteration方法,矩阵的元素C可以从以下规则:(我)定义的第一列一个B外部和内部迭代变量,分别。让k表示矩阵的列顺序Ck= 1时开始。(2)矩阵的值Ck列第一行应该对应元素的矩阵计算一个B根据函数 , , ,基于(15)- (17)。(3)矩阵的概率值Ck列第二行可以通过乘以相应的矩阵元素值一个B。的价值C(2,k)=的产物一个(2,1)B(2,1)。(iv)分配kk+ 1,即k=k+ 1。(v)修改内部迭代变量的第二列B并重复上述三个步骤,直到年底B的列。(vi)修改外迭代变量的第二列一个,重复以上四个步骤,直到年底一个的列。步骤4:排序的值C的第一行以升序排序,即、性能水平。第二行矩阵的元素C可以相应地重新排序。第五步:抽象的独特元素从第一行矩阵C并形成行向量E第六步:定义一个结果矩阵D谁的第一行=E。的第二行D由下面的迭代步骤:(我)定义矩阵的第一列D迭代变量。(2)第一列的矩阵C的第一行,即C(1,1)、定位与第一列相同的值D的第一行,即D(1,1)。(3)添加相应的概率的位置由前一步的第一列D的第二行,即D(2,1)。(iv)修改迭代变量,第二列,然后重复以上两个步骤,直到最后的数量D的列。第七步:矩阵的操作的结果一个B存储在矩阵D只有和概率的性能水平。根据这个矩阵D,它可以随时备战的重写表达式。

在下面的例子中,反弹道导弹可以使用频繁。

4所示。说明性的例子

4.1。可靠性评估

考虑一个任务处理系统结构如图2在哪些组件C1,C2组成WSG。后C3与WSG并行连接,C4是串联连接。这些组件是统计独立的。可以通过传送数据包C3和C4在15秒,20秒的概率为0.7和0.75,分别。的性能水平C1,C2是相同的。他们的完成时间和概率都是15秒和0.7。他们的发现和未被发现的故障概率相等,即0.15。这些参数表中列出1

在这种情况下,WSG 由ICF的影响。根据上面的步骤,随时备战这些组件的性能分布可以表示如下。

基于上述分析,随时备战的每个组件可以表示为 在哪里 因为WSG由C1,C2,通过分享他们完成数据传输任务。应用(17),这样

组件的单点故障也会导致其性能水平最低,即无穷任务完成时间 根据(19),

基于可靠性框图,因为WSG连接C3同时,(16先采用)。组件C系列4连接,然后(15)需要被应用。系统可以随时备战的表示如下:

根据(9)和(11),系统可以包在传输数据的概率 和条件的预期性能

如果没有WSG在此系统中,也就是说,如果组件C1,C2,C3并行连接,然后随时备战的C1,C2表示为

系统可以随时备战的计算

类似地,可以计算的可靠性和条件期望性能

的比较(24)和(27),可以看出,系统的可靠性与ICF却降低了。然而,它的预期任务完成时间没有WSG小于系统的。换句话说,系统与WSG更高的效率来完成数据的传输包。然而,由于ICF的存在,它的可靠性下降。

为了比较上述分析方法的效率与多值决策图(MDD)来源于文献[22),系统图2和一些参数表1还用于可靠性计算。所需的其他假设和参数在MDD中提到在演唱会与参考。在这里,重点是比较时间消耗在计算的可靠性。在相同配置的计算环境中,这些结果计算了MDD正在接近的(24)。有一个距离这两个方法之间的耗时。从表中列出的验证2,它显示了反弹道导弹不如MDD耗费时间。

4.2。敏感性分析

3显示了一个更复杂的系统,由三个子系统组成。在每个子系统中,WSG配置为改善任务处理的效率。

因为有几个州的组件是在每个子系统中,任务处理时间等参数的性能水平的这些组件的形式列出五行元组,如表所示3

基于上述方法,这些参数,系统可靠性满足最大允许完成时间可以计算(9)。考虑四种不同情况下:答:WSG在每个子系统操作和工作得很好B: WSG1消除和组件C12岁,C13个并行工作C: WSG2消除和组件C21岁,C22并行工作D: WSG3是消除和组件C32和C33并行工作

这四种情况下的系统可靠性曲线如图所示4。图4(一个)显示整条曲线的四个病例。从图4(b),这是一个偏曲线缩放(25],[55],它可以看到这种情况下可靠性最低的四个病例。可靠性改进的序列对于其他三个案例,从低到高,是D、B和C。

为了定量分析的可靠性改进,这些结果表中列出4。可以看出案例C提高了可靠性。与此同时,其预期性能的四个案例中是最低的。虽然病例B和D有几乎相同的预期性能,减少B显示了改善可靠性高于案件D .它还可以看到从定量分析结果的可靠性改进的协议与上述数字。

通过上面的分析,可靠性工程师可以选择最优方案根据可靠性或预期性能的指标。此外,在这个例子中,灵敏度分析是只针对单一WSG。事实上,结合几个wsg也是一个合适的机制进一步基于这种方法的灵敏度分析。

5。结束语

在这篇文章中,可靠性和灵敏度分析的方法提出了一个ICF的海量存储系统(MSS)中。为了提高传输效率,WSG中的组件可以共享一个数据传输等任务根据其处理时间。在任务共享,系统可能无法检测到一个组件的失败,在这种情况下,系统的可靠性将会降低,甚至可能导致任务的失败的传播。技术的基础上,ICF的影响纳入其随时备战的表达及其对可靠性和灵敏度分析的计算方法也建议。在计算过程中,ABM算法开发以大大降低计算复杂度。本文两个例子说明提出方法的应用。可靠性工程师可以很容易地应用这种方法来决定最优方案下有限的资源。在上面的分析中,只有串并联海量存储系统(MSS)中被认为是。更复杂的海量存储系统(MSS)中拓扑,如桥梁和G: (k / n)结构,应该关注的焦点。对于其他ICF模型有不同的结构,在未来他们还将探索研究。

数据可用性

使用的数据来支持本研究的结果包括在本文中。

的利益冲突

作者宣称没有利益冲突有关这篇文章的出版。

确认

这项工作是支持经济的部分资金从基础研究基金为中央大学(2020 ms120和2018 ms076号)。