文摘

心脏电生理学的主要方面,如传导缓慢,传导阻滞,和跳跃的影响许多研究,因为他们的研究主题是心律失常密切相关,再入,颤动,或者去颤。然而,复制这些现象数值模型需要使用亚细胞解决pd和非均匀离散化,异构组织电导率。由于高计算成本的模拟再现心脏的细微观结构组织,先前的研究认为组织小型或中等规模的实验和使用简单的心脏细胞模型。在本文中,我们开发一个心脏电生理模型捕获心脏组织的微观结构通过一个非常精细的空间离散化(8μ米),并使用一个非常现代的基于马尔可夫链和复杂的细胞模型的特征离子通道的结构和动力学。应对计算挑战,模型是并行使用一个混合的方法:集群计算和gpgpu(通用计算图形处理单元)。我们的这个模型的并行实现使用multi-GPU平台能够减少执行时间超过6天的模拟(在一个处理器)21分钟(小8-node集群配备16 gpu,即。2 gpu /节点)。

1。介绍

心脏疾病是全世界三分之一的死亡负责(1]。心脏电生理学是引发心脏的机械变形。因此,心脏电生理学的知识是必不可少的理解心脏生理和physiopathological行为的许多方面2]。计算机模型的心脏电生理学3,4)已成为有价值的工具,这种复杂现象的研究和理解,因为他们允许不同的信息从不同的物理尺度和实验获得的组合生成一个更好的了解整个系统的功能。毫不奇怪,高复杂性的生物物理过程转化为复杂的数学和计算模型。现代心脏模型描述非线性系统的偏微分方程(pde),可能会导致一个问题,数以百万计的未知数。

数学模型的细胞电生理心脏建模的一个关键组成部分。他们作为独立的研究工具,探讨单个心肌细胞的行为,作为一个重要组成部分组织和器官仿真基于所谓bidomain或单畴结构模型(4]。细胞模型可以写成一个常微分方程的一般非线性系统的复杂性(常微分方程),可能会有所不同,从简单的现象学模型(5)(基于两个变量)复杂的模型描述大量的详细的生理过程(6)(基于40到80微分变量)。简单模型集中在动作电位(AP)的起源,从细胞到细胞传播并生成一个电波传播的心。复杂模型账户不仅对美联社还描述这一现象的起源与心脏内稳态和不同亚细胞成分,如细胞膜的离子通道。遗传学的发展,分子生物学和电生理实验提供了新的数据和信息与离子通道的结构和功能。马尔可夫链(MC)模型形式已经越来越多地用于描述两个离子通道的功能和结构。MC-based模型使模拟结构异常由于遗传疾病和drug-biding影响离子通道(7- - - - - -9]。不幸的是,这些现代心脏肌细胞模型对这两种数值方法,构成不同的挑战由于刚度的常微分方程引入MCs,高性能计算,由于问题的大小,由于微分变量的数量从几到接近一百10]。

在组织层面上,bidomain模型(4)被认为是最完整的电活动的描述。pde的非线性系统可以简化为所谓的传感器模型,可能不太精确,但不如bidomain模型计算要求。不幸的是,大规模的模拟,如产生的离散化的整个心,仍然是一个计算的挑战。此外,心脏电生理学的主要方面,如缓慢传导、传导阻滞、跳跃或锯齿效果,亚细胞的需求解决pd和非均匀离散化,异构组织电导率。心脏电生理学的这些方面是心律失常密切相关,再入,颤或去心脏纤颤,许多研究的研究课题11- - - - - -20.]。

然而,亚细胞的需求解决pd和非均匀离散化,异构组织电导率可以防止上述现象的研究在大规模组织模拟。此外,由于高计算成本与这些微观模型的模拟心脏组织,以前作品采用了简单的肌细胞模型,而不是现代MC-based模型(6,10]。

在这项工作中,我们提出一个解决这个问题的基于multi-GPU平台配备图形处理单元(集群),允许快速模拟微观组织模型结合现代和复杂的肌细胞模型。解决方案是基于合并两个不同的高性能技术。先前我们已经调查过心脏建模:集群计算基于消息传递通信(MPI) [21- - - - - -24)和GPGPU(通用计算图形处理单元)25- - - - - -30.]。我们开发了一个二维模型,该模型是基于软轴和合作者的以前的工作11,17),占心脏组织的微观结构,缝隙连接异构分布,离散的8μm。这种微观组织模型结合的模型Bondarenko案等。6)这是一个现代和复杂的基于MCs肌细胞模型。我们的这个模型的并行实现使用multi-GPU平台能够减少执行时间超过6天的模拟(在一个处理器)21分钟(小8-node集群配备16 gpu,即2 gpu /节点)。结果,使用这种非常快并行实现我们能够模拟螺旋波的形成,一种自我维持的可重入活动与心律失常密切相关。我们所知,这是第一次使用心脏模型模拟螺旋波占心脏组织的微观结构和现代和复杂的肌细胞模型。

2。方法

2.1。建模心脏组织

我们开发了一个二维模型,该模型是基于软轴和合作者的以前的工作11,17),占心脏组织的微观结构,缝隙连接异构分布,离散的8μm×8μm。肌细胞连接的基本模板开发和呈现在图1。这个基本单位占总共32心脏细胞的连接不同形状和数量的邻近细胞。均值和SD(标准差)值细胞长度和宽度 μm和 μm,分别。这些值接近这些文献中报道:[31日(长度= 140μm和宽度= 19μ米),32(长度= 134μm和宽度= 18μ米),20.(长度= 100μ米,宽= 17.32μ米)。平均来说,每个单元连接到其他6邻近细胞。我们的二维模型认为一个齐次深度 μ米(11,17]。

这个基本单位成立于这样一种方式,它允许更大的组织准备的生成通过多个实例的连接。图2提出了如何实现这个。

3提供了一个例子,如何安排不同细胞之间的连接。代码是在一个灵活的开发方式,所以,它允许用户设置为每个离散体积 ( 北)导电性或电导值( )、南( )、西( ),和东部( )体积的面孔。这些可以是任何非负价值。在这项工作中,我们设置离散化 到8μm。此外,基于软轴和合作者的工作(11,17),我们只选择5可能类型的相邻的卷膜之间的联系( ),细胞质( )、缝隙连接有褶的( ),interplicate ( ),结合有褶的( ),我们使用 导电率和 电导。为模拟提出了工作,不同的分布在32细胞缝隙连接不是随机生成的。相反,缝隙连接分布的基本模板单元之前手动选择繁殖分布呈现在11,17]。我们发现这个设置和电导率值沿纤维传导速度是410左右μ米/ ms ( ),是130年μ米/女士横向纤维方向( )。这导致一个比率 ,这是接近报告的传导率(11]。

2.2。异构传感器模型

动作电位的心脏组织,因为细胞内空间传播通过心肌细胞电耦合缝隙连接。在这项工作中,我们并不认为细胞外基质的影响。因此,数学描述的现象可以通过一种反应扩散偏微分方程(PDE)称为传感器模型,给出的 在哪里 感兴趣的变量,代表了跨膜电位,即细胞内细胞外潜在的区别; 是一个向量的状态变量也会影响生成和传播的电波,通常包括细胞内的不同离子浓度( , , )和不同膜离子通道的渗透率; 是surface-volume心脏细胞的比例; 膜电容, 总离子电流的函数 和一个向量的状态变量 ; 当前由于外部刺激, 单畴结构电导率张量。我们假设的边界组织是孤立的,也就是说,无需通量边界条件( )。

在这部作品中,现代和复杂Bondarenko案等人模式6)描述左心室细胞的电活动的老鼠被认为的动力学模拟 在(1)。Bondarenko案等人模型(BDK)是第一个模型提出了小鼠心室细胞(6]。离子电流的术语 在这个模型中包含15个跨膜电流的总和。简而言之,Bondarenko案的模型是基于常微分方程(ODE) 41微分变量控制离子电流和细胞内稳态。在这个模型中,大多数离子通道是由马尔可夫链(MCs)表示。

2.3。数值离散化在空间和时间

有限体积法(有限体积法)是一种数学方法用于获得一个偏微分方程的离散版本。此法适用于数值模拟的各种类型的守恒定律(椭圆、抛物线或双曲线)[33]。像有限元法(FEM),可以使用有限体积法在几种类型的几何形状,使用结构化或非结构化网格,生成健壮的数值方案。方法的发展本质上是与地区或相邻的卷之间流动的概念,也就是说,它是基于数值计算的净通量进或出一个控制体积。某些各向同性问题与常规空间网格离散,与有限体积法离散化得到非常类似于一个获得标准的有限差分法(FDM)。

本节提供了一个简短的描述有限体积法应用到异构传感器的时间和空间离散化方程。有限体积法应用到解决方案的详细信息的传感器可以在[34,35]。

2.3.1。时间离散化

单畴结构反应和扩散方程采用分裂戈杜诺夫算子分裂(36]。因此,每个时间步的解决方案涉及到两个不同的问题:常微分方程的非线性系统 和一个抛物线PDE

由于我们的空间离散化模型, 非常小,节能灯(37)条件保证数值稳定是非常严格的。因此,对于我们使用PDE无条件稳定的隐式欧拉计划。(提出的时间导数3),操作 由一阶近似隐式欧拉计划如下: 在哪里 代表了跨膜电位 是用来推进的时间步的偏微分方程。

的离散非线性系统的常微分方程,我们注意到它的刚度要求很小的时间步长。对于简单的模型基于Hodgkin-Huxley配方,这个问题通常是克服使用Rush-Larsen (RL)方法(38]。然而,对于最现代的基于MCs和高度复杂的模型,RL方法似乎是无效的数值积分时允许较大的时间步长。对于Bondarenko案等人的情况下模型,我们测试了这两种方法,欧拉和RL,和两个要求相同的时间步长, 女士的稳定性问题。自从RL比欧拉方法是更昂贵的每个时间步方法,在这项工作中,我们使用简单的显式欧拉方法的非线性常微分方程的离散化。

然而,正如上面已经显示,我们使用不同的时间步骤解决方案的两个不同的解耦合的问题,PDE和常微分方程。因为我们使用PDE的无条件稳定的方法,步骤的时间 可能会比这大得多的用于解决非线性系统的常微分方程, 女士在这项工作中,我们使用 女士,一百倍 。这并未引入任何重要的数值误差。我们计算的L2相对误差之间的跨膜电位的解决方案,使用相同的时间步的颂歌和PDE, 女士, 和一个解决方案,使用 女士和 女士, 如下: 在哪里 数量的时间步骤和吗 离散量的总数。的模拟组织的大小 厘米时 女士(刺激组织的中心),发现的错误

2.3.2。空间离散化

扩散项(3)必须在空间离散。我们将考虑以下: 在哪里 (μ一个/厘米2)表达细胞内电流密度和 在这个方程, (μ一个/厘米3)是一个体积电流和对应的左边(3),担任这有限体积的解决方案的基础。

空间离散化,我们将考虑一个二维均匀网格,由普通四边形(称为“卷”)。位于每个卷的中心是一个节点。感兴趣的数量 与网格的每个节点。

定义网格几何和分域后控制量,具体的方程的有限体积法可以给出。方程(7)可以集成在单个体积空间 的大小 ,导致 应用散度定理收益率 在哪里 统一的边界法向量 。然后,我们有

最后,假设 代表平均价值在每个特定的四边形,替换(3)(10),我们有

对于这个特殊的二维问题,组成一个统一的网格四边形的一边 的计算 可以细分为以下脸上流之和: 在哪里 在面临计算( , , ,或 )如下。的例子中,我们定义了一个电导率值的脸 ,比如细胞内或细胞质电导率, 节中描述2.1,我们有

的例子中,我们定义了一个电导值的脸 举例来说,一个缝隙连接传导 节中描述2.1,我们有:

使用集中有限差分,我们(13) (14),我们有

方程 , , 可以近似地获得。

重新排列和用离散的(4)和(12)(11由()和分解描述的运营商2)和(3)的收益率 在哪里 , 当前步骤, 是一个中间步骤, 是下一个时间步。除了 可以代表任何缝隙连接的电导( , , )除以深度 或任何电导率值( , 节中描述)定义为每个卷的脸2.1。它定义了每个有限体积方程 。首先,我们解决相关的线性系统(17提前时间 然后我们解决了非线性系统的常微分方程(18) 次,直到我们

2.4。并行数值实现

造成大规模模拟,比如那些精细的空间离散化的组织,计算昂贵。例如,当一个8μm离散化是用于1厘米×1厘米组织和Bondarenko案等人模型(BDK), 41个微分变量,用作心脏细胞模型中,总共有1250×1250×41 = 64062500必须在每个时间步长计算未知数。此外,模拟100 ms的心脏电活动,64年数百万未知非线性系统的常微分方程必须计算(一百万倍 150万ms)和PDE未知数必须计算一万次。

应对这种高计算成本,两个截然不同的并行计算工具一起使用:MPI和GPGPU。

2.4.1。集群的实现

集群实现是一个并行实现根据集群的cpu。的集群实现使用PETSc [39)和MPI (40)库。它使用一个预先处理并行共轭梯度与ILU(0)(并行块雅可比)来解决线性系统与传感器的PDE模型的离散化。可以找到更多的细节关于这个并行实现在我们之前的工作这个话题21- - - - - -24]。

为了解决常微分方程的非线性系统,使用显式欧拉方法。这是一个尴尬的并行问题。不同系统之间不存在依赖关系的解决方案的每个有限体积的常微分方程 。因此,它是非常简单的实现并行版本的代码:每个MPI流程负责计算分数 总数的模拟卷,在那里 在计算的过程。

2.4.2。Multi-GPU实现

在我们的multi-GPU实现,我们决定保持集群的方法解决线性系统与传感器的PDE模型的离散化。因此,multi-GPU也解决了离散PDE与ILU预先处理并行共轭梯度(0)(并行块雅可比)中可用PETSc图书馆。

然而,我们已经加快了常微分方程的解决方案的系统通过使用多个gpu。这是一个不同的策略时,我们使用过的满Bidomain方程(椭圆形PDE,抛物线PDE,和系统的常微分方程)是完全实现在一个GPU (30.),或完整的单畴结构方程(抛物线PDE和系统的常微分方程)是完全实现在一个GPU (25,26,29日]。

选择一个不同的策略的动机是基于以下几个原因。提出了在(29日单畴结构模型),可以使用一个单一的GPU加速的35-fold相比,一个平行的OpenMP [41实现四核计算机上运行。然而,这最后的GPU加速获得的来自近10倍加速解决方案的PDE和近450倍加速解决常微分方程的非线性系统。如今,随着冲击架构的发展,在市场上很容易找到一台计算机配备64个流处理器。因此,我们认为,解决与传统MPI PDE在这些新机器或OpenMP-based并行实现可能比一个GPU实现。另一方面,并行解决方案的非线性系统的常微分方程一个GPU仍然容易优于这些新manycore-based电脑。这,我们专注GPU的并行解决方案实现数以百万计的非线性系统的常微分方程。第二个动机是与预调节器,可以轻松高效地实现对gpu的共轭梯度法。bidomain方程,有效几何多重网格预调节器(30.)是在一个单一的GPU实现,和复杂的代数多重网格预调节器(42]在multi-GPU实现平台。但是,两个实现都是唯一可行的解决方案相关的线性系统的椭圆PDE bidomain方程。多栅的预调节器太贵了,原来是一个效率低下的选择解决方案的抛物线PDE, PDE单畴结构模型的类型。直到现在,廉价但效率低下 雅可比预调节器的最佳选择了GPU实现问题的解决时抛物PDE (29日,42]。然而,众所周知,不完全LU (ILU)预调节器结合块雅可比或添加剂施瓦茨域分解方法(23]大大超越Jacobi-like预调节器对集群计算传感器的PDE模型的解决方案。这个论点支持cluster-like实现并行解决方案的最佳选择的抛物线PDE单畴结构模型(见[43)和引用文献在其中)。最后,第三个和最后一个动机是与特定的问题我们提出调查工作:模型,揭示心脏组织的微观结构。另一个最近的研究提供了一个实现multi-GPU bidomain模型平台(44]。pde和系统的常微分方程在gpu上实现使用显式方法,雅可比放松,和显式欧拉,分别。我们注意到特定的微观组织模型空间离散化的8μm,使用显式的和廉价的方法解算器对PDE会非常低效的节能灯由于严重的稳定性限制的条件(37]。因此,再一次,这个论点还支持集群——就像实现基于隐式方法并行解决方案的抛物线PDE单畴结构模型。

我们的multi-GPU实现使用CUDA (45)来实现BDK心脏细胞模型的数值解。CUDA模型扩展了C编程语言的抽象表达并行性,也就是说,CUDA包括C软件开发工具和库从程序员隐藏GPGPU硬件细节,可以专注于重要问题的并行代码而不是处理陌生的和复杂的概念从计算机图形学中,以探索gpu通用计算的计算能力。

为了运行一个应用程序,程序员必须创建一个平行的内核函数。内核是一个特殊的C函数调用从CPU上执行的GPU同时被许多线程。每个线程是由GPU流处理器。他们分为阻塞的线程或。块可以是一个,两个,或三维。一组线程块形成一个网格,可以一人或二维。当CPU内核调用时,它必须指定有多少块和线程将被创建在GPU执行内核。的语法指定线程的数量,将执行创建一个内核被正式称为执行配置,灵活支持CUDA的层次结构的线程,线程块,网格的街区。自一个网格中的所有线程执行相同的代码,一组独特的识别号码是用来区分线程和定义适当的部分他们必须处理的数据。这些线程被组织成两级层次由块和网格和两个独特的坐标blockIdthreadIdCUDA运行时,分配给他们的系统。可以在内核中访问这两个内置变量函数并返回相应的值确定一块和线程,分别。所有线程在一个块中可以相互同步运营商,通过一个特殊的障碍syncthread获得高速,逐块共享内存允许线程间通信。线程从不同的块在同一网格可以协调他们的执行只通过使用原子全局内存操作。没有假设线程块的执行顺序,这意味着一个内核必须执行正确无论块的顺序将由硬件来运行。

必须执行一些额外的步骤来使用GPU: (a)设备必须初始化;(b)内存必须分配在GPU和数据转移到它;(c)然后叫内核。内核完成其执行后,结果将被传递回CPU。

两个内核开发解决BDK常微分方程系统的相关模型。第一个内核负责设置系统的常微分方程的初始条件,而第二个集成系统在每个时间步的常微分方程。

内核的实现都是在许多不同的方式进行了优化。的状态变量 心脏细胞被存储在一个数组 ,其大小等于 ,在那里 是离子模型的微分方程的数量(在这工作, = 41)。的 数组是这样组织的第一个 条目对应于第一个状态变量,紧随其后 条目的下一个状态变量,等等。此外,对于所有离子模型,第一个 条目的 数组对应于跨膜电位 。在pde的解决方案的系统,集成后的常微分方程系统,每个节点的跨膜电位应该传递给PETSC解算器。由于内存组织选择 数组,这是一个简单的任务,正如之前提到的, 数组的第一个条目对应于跨膜电位 每个节点。这个组织让我们避免额外的内存CPU和GPU之间的交易,提高性能。另一个影响性能的实现选择积极的方式 数组被分配。的 数组是分配在全球GPU内存使用cudaMallocPitch常规的CUDA API。这个例程可能垫,以确保分配相应的内存地址的任何行将继续满足一致性要求执行的合并操作硬件。简而言之,一个严格的合并要求线程 线程访问数据 如果 是由线程访问 ,也就是说,每个线程应该执行数据访问的跨步 。因此,在第一个内核,设置初始条件,每个线程设置所有状态变量的值。解决常微分方程系统的内核运行同样的,也就是说,每个线程计算和更新其状态变量写入正确的位置在内存中对应于他们的变量。此外,第二个内核是优化使用尽可能多的为本地内存操作。

纯粹的域分解用于并行性。组织域线性分解 不重叠的子域(或 的任务, ,见图4), 是MPI程序的数量或处理核心。PDE的并行解决方案是实现通过PETSc(见[21),每个处理核心 负责更新变量相关联的子域名 。在我们的计算环境中每台机器或节点拥有更多的CPU核心 gpu比 。因此,对于常微分方程的解决每个GPU设备将负责处理多个任务。任务分配一个节点分布的gpu循环的方式。例如,如果 我们有两台机器(每个2 8核和GPU设备),图4提出了如何组织域将分区。四个任务将分配给每个GPU设备。例如,在节点0,GPU 0将处理任务 , , , ,GPU 1的任务 , , ,

常微分方程的解决方案,使用顺序和并行(CUDA)代码单精度。PDE的解决方案我们使用双精度。单畴结构模拟的情况下,我们所示(25),使用单精度CUDA并不影响的数值精度解算器。

3所示。在计算机实验中,计算环境和指标

模拟使用微观模型进行空间离散化的8μ节中描述m和异构的电导率值2.1。使用的值 设置为0.14厘米吗−1和1.0μF /厘米2,分别。用于解决线性系统的时间步长与(17)被设置为 女士和关联的常微分方程来解决非线性系统(18)是集 ms。

三个不同的组织设置被用来测试我们的模型和并行实现:0.5厘米×0.5厘米大小的心脏组织中刺激10 ms的中心和被处死,1.0厘米×1.0厘米大小的心脏组织中刺激10 ms的中心和执行,和心脏组织的1.0厘米×1.0厘米刺激使用S1-S2协议生成一个螺旋波,一种自我维持的可重入活动与心律失常密切相关。

我们的实验进行8 SMP集群上电脑。每台计算机包含两个英特尔E5620至强四核处理器和12 GB的RAM。所有节点上运行Linux版本2.6.18——194.17.4.el5。代码被编译和gcc 4.1.2 CUDA 3.2。每个节点包含两个特斯拉C1060。特斯拉C1060卡有240 CUDA核心和全球4 GB的内存。

所有的测试进行了三次。平均执行时间,以秒为单位,然后用于计算加速,定义为顺序执行时间除以并行执行时间。

4所示。结果

5提出了一个中心的传播组织的刺激规模1厘米×1厘米为不同瞬间的时间。正如所料,宏观上,看起来很光滑,持续传播。然而,当强调一个较小的区域大小1毫米×1毫米,见图6,我们已经可以观察离散传播的本质,也就是说,心脏组织的传播的影响动作电位。

1介绍了并行实现实验结果的广场组织的0.5厘米×0.5厘米。作为一个可以观察到的时间解决常微分方程负责近90%的执行时间。它也可以观察到,虽然获得的加速效果集群受人尊敬的,几乎是线性与64核(61点附近),总执行时间仍然很高。关于multi-GPU实现,结果好多了。必须要强调的一点是,这个模拟实验中所使用的地方,虽然64核只有16 GPGPU设备,用于执行模拟,所以8进程共享2 GPGPU设备/机器。作为一个可以观察到的加速是巨大的,获得343倍的速度比单核处理器。执行时间从1.6天(使用一个处理核心)只有6.7分钟(使用8-node multi-GPU平台)。

2介绍了并行实现实验结果的广场组织的1.0厘米×1.0厘米。再一次,与获得的加速效果集群实现,几乎是线性的(61与64核)。关于multi-GPU实现更好的结果。加速是巨大的,420倍的速度比单核处理器。执行时间滴从超过6天(使用一个处理核心)只有21分钟(使用8-node multi-GPU平台)。我们也可以观察到multi-GPU实现接近7倍集群8计算机上运行时实现。

因此,使用这种非常快的并行实现,我们可以模拟螺旋波的形成,一种自我维持的可重入活动与心律失常密切相关,见图7。我们所知,这是第一次使用心脏模型模拟螺旋波占心脏组织的微观结构和现代和复杂的肌细胞模型。后两个使用S1-S2协议试图找到正确的脆弱的窗口,我们设法使用这个心脏模型生成一个持续的螺旋波占心脏组织的微观结构和现代和复杂的肌细胞模型。整个过程用了不到一天(大约13个小时每个模拟都在3至7小时)。没有我们multi-GPU并行实现,这个过程需要227天使用单一核心的计算机使用我们的集群实现或接近4天64核上运行但没有gpu。

5。讨论和未来的工作

我们的结果表明,我们的multi-GPU节中描述的并行实现2.4。2能够显著加快的心脏电生理模型的数值解捕获心脏组织的微观结构(使用一个非常精细的空间离散化),是基于一个非常现代和复杂的细胞模型与马尔可夫链(配方,已广泛用于离子通道的特性)。加速420倍了,减少执行时间超过6天(使用一个处理核心)只有21分钟(使用8-node multi-GPU平台)。混合Multi-GPU并行实现提出了工作是更有吸引力的如果一个人认为gpu的体系结构和多核处理器快节奏的继续发展。

尽管如此,我们相信我们可以进一步提高并行实现。例如,在当前实现中,CPU核心空闲等待结果的非线性常微分方程计算的GPU设备。对于未来的工作,我们打算评估不同的负载平衡技术更好地分配之间的并行任务GPU设备和CPU核心和更有效的利用所有的计算资源。另一个可能的改进与解决方案的多级并行性引入bidomain方程(24)相结合的任务并行性(通过管道)和数据并行性(通过数据分解)。我们相信类似的数据和任务并行性的组合也可以利用单畴结构方程的解决方案,进一步提高并行效率的算法。

最近的研究集中在离散或不连续的性质美联社传播从微观模型避免了出现的计算挑战通过离散模型的开发和使用,其中每个心脏肌细胞是由一个单点与相邻细胞通过不同的导率(46,47]。这种描述使研究随机分布的导率的影响的传导速度和再入模式对心脏组织的形成。介绍了离散模型,更在48)来描述电子传播的 电缆的 连接细胞gap-junctional低耦合的情况下。在这个模型中,细胞被假定为等势。因此,只有缝隙连接电导是连接相邻的细胞,也就是说,胞质电阻被认为是无关紧要的。最近,我们将离散和微观模型 电缆连接的细胞(49]。我们已经表明,离散模型的数值结果与异构情况下的微观模型获得的低gap-junctional耦合(1% - -10%的正常耦合)。然而,离散模型失败的情况下正常gap-junctional耦合或中度降低gap-junctional耦合(50% - -100%的正常耦合)。二维微观模型开发的这项工作将使我们进一步比较这两种方法(详细的微观模型和离散模型)和更好地理解每个人的优点和局限性。此外,我们希望我们的微观模型也表明更好的开发离散模型的方法,即计算比详细的微观的便宜。

6。结论

在本文中,我们开发了一个心脏电生理模型捕获心脏组织的微观结构通过使用一个很好的空间离散化和使用一个非常现代的基于马尔可夫链和复杂的细胞模型的特征离子通道的结构和动力学。应对计算挑战,模型是并行使用一个混合的方法:集群计算和gpgpu。不同的在网上组织准备性能测试被用于这项工作。我们已经表明,在所有情况下,并行multi-GPU实现能够显著减少执行时间的模拟,例如,从超过6天(在一个处理器)21分钟(小8-node集群配备16 gpu,即2 gpu /节点)。我们相信这种新的并行实现为许多开放的调查问题铺平了道路与动作电位的复杂和离散传播本质上心脏组织。

作者的贡献

b . g . de Barros和r·s·奥利维拉等价。“因此他们可以视为第一作者出现在字母顺序”。

确认

作者要感谢斗篷,CNPq FAPEMIG, FINEP, UFMG UFSJ, UFJF支持这项工作。