一种新的数学方法定义/基因单核苷酸多态性赋予风险或保护零星的肌萎缩性脊髓侧索硬化症汽车收缩映射神经网络和基于图论

文摘

背景。复杂疾病如肌萎缩性脊髓侧索硬化症(ALS)涉及表型和遗传异质性。因此,多个遗传性状可能显示微分与疾病的联系。自动收缩映射(AutoCM),属于人工神经网络(ANN)架构,“spatializes”变量之间的相关性通过构造一个合适的嵌入空间,视觉上透明和认知变量之间的“亲密”等自然概念准确反映他们的协会。结果。在这个试验病例对照研究在几个基因单核苷酸多态性(SNP)一直在评估一种新的数据挖掘方法基于AutoCM。我们有ALS数据集划分为两个数据集:病例和控制数据集;我们已经应用于每一个独立,AutoCM算法。确定了六个基因变异的不同导致的复杂性系统:三个以上的基因/ snp代表保护性因素,APOA4, NOS3和LPL,因为他们的贡献对整个复杂性导致高达0.17。另一方面ADRB3、LIPC MMP3,其中心发表的贡献了高达0.13,似乎代表易感性因素。结论。上可用的生物信息这六个多态性与可能的致病的途径与ALS是一致的。

1。背景

调查的模式在大型数据库中大量的变量之间的相关性是一个相当困难的任务,认真计算时间和能力要求。面向统计文献开发了各种方法与不同的权力和可用性,所有的这一切,然而,分享一些基本问题,其中最突出的是先验假设的本质上需要做的数据生成过程,附近不可能计算所有大量可能的夫妻之间的联合概率和n元数组原则上必须重建基础过程的概率法,以及组织输出的困难在一个很容易掌握,ready-to-access非技术分析格式。前两个缺点的后果是,当分析知之甚少问题特点是异构的潜在相关变量集,传统方法会变得非常不可靠时无法使用。最后一个的结果是,在情况下,传统方法管理提供一个合理的输出,他们的声明和影响可以如此清晰的成为几乎无用的或者,更糟糕的是,很容易误解。

在本文中,我们介绍一种新的基于人工神经网络(ANN)方法架构,自动收缩映射(AutoCM) [1基本改进),它允许在指定的使用严重的鲁棒性和/或计算要求的问题,可用性和可理解性输出。特别是AutoCMs“spatialize”变量之间的相关性通过构造一个合适的嵌入空间,视觉上透明和认知变量之间的“亲密”等自然概念准确反映他们的协会。通过适当的优化技术,将在下面详细介绍和讨论,“亲密”可以被转换成一个令人信服的用图表示,选择所有相关,只有相关性并将它们组织成一个连贯的画面。实际上不是这样表示构造通过某种形式的麻烦聚合2乘2夫妻之间的关联的变量,而是通过构建一个复杂的全球变化的整体模式的照片。此外,它充分利用了拓扑意义用图表示的实际路径连接节点(变量)表示有明确意义的逻辑相互依存的解释数据集的多样性。我们意识到,这些技术是小说,因此没有完全理解到目前为止所有的属性和意义。然而,我们相信,他们的实际表现的上下文中定义的,容易理解的问题提供了一个令人鼓舞的测试在这个方向上继续。我们应用这种新方法在肌萎缩性脊髓侧索硬化症(ALS),一种致命的神经退行性条件导致进步运动神经元丢失,导致发病几年内死亡。没有有效治疗这种毁灭性的疾病,尽管据报道,利鲁唑有轻微影响减缓其发展(2,3]。这种失败可能是有关穷人ALS发病的机制的知识,以及其异质性。已知遗传因素起着重要的作用;至少9基因传播形式的ALS是已知的和多个基因可能影响的发生和显性表达式ALS已确定(4,5]。然而,基因的知识可能扮演一个角色,他们可能导致表型的机制还很不完整的。识别的基因构成零星和遗传形式的ALS高度相关,因为它会识别新的代谢途径参与神经退化。

以前我们接近零星的肌萎缩性侧索硬化症(SALS)疾病的基因与人工神经网络识别可能的遗传背景诱发零星的形式。包含遗传数据的数据集从54 SALS病例和208例对照进行了分析三个不同的分析方法:线性判别分析,标准人工神经网络和先进智能系统;对于后一种方法预测精度区分情况和控制平均达到96%(范围94.4 - 97.6)。除了我们确定了七个基因变异基本情况与控制(6]。

结果指出需要运用系统真的能够处理疾病的复杂性,而不是把数据和简化论方法无法检测多个较小的效应诱发疾病的基因。

我们报告的应用一个新的开发SALS数据集分析方法,基于Auto-CM体系,最大限度地正则图论。

想法是测试这种新算法的力量在医疗环境中如SALS疾病,揭示疾病的困惑。

2。方法

2.1。数据库

我们使用先前描述的数据集(6]。短暂,来自60 biallelic多态性基因型在35个基因选择从脂质和同型半胱氨酸代谢通路,调节血压、凝血、炎症、细胞粘附和矩阵的完整性。所有科目测试是白种人的起源,54 SALS, 208控制。SALS由28岁男性病人(56.4年;46.9 - -65.8)和26岁女性(62.9年;57.8 - -67.9),在疾病发病平均年龄59.62岁;(范围53.7 - -65.5年),临床发作在61.1%(33/54)和脊髓延髓的38.9%(21/54)的情况下,意味着疾病的观察时间3.2年(范围1 - 10年)。

控制受试者144男性和67女性;年龄从21岁到75岁(平均38.94)。

2.2。自动收缩映射

我们开始我们的分析的相对简洁但技术详细介绍安架构,提供了所有的后续分析的基础:自动收缩映射(AutoCM) [7,8]。AutoCM的特点是一个三层体系结构:一个输入层,从环境中捕获的信号,一个隐藏层,AutoCM内的信号调制,和一个输出层,通过AutoCM反馈在环境刺激的基础上以前接收和处理。

每一层包含同等数量的单位,所以整个AutoCM是由时间组成的单位。之间的连接输入和monodedicated隐藏层,而那些隐藏层和输出层之间的完全饱和,也就是说,在最大梯度。因此,鉴于单位,连接的总数,N_c由图给出1。

的所有连接AutoCM可能通过分配一个初始化一样,每一个恒定值,或通过随机赋值。最佳实践是初始化所有的连接一样,积极的价值,接近于零。

AutoCM可能总结的学习算法在序列的四个步骤:特征(1)从隐层的输入信号传输;(2)适应值的输入和隐藏层之间的连接;(3)从隐藏的信号传输到输出层;(4)适应值的隐藏和输出层之间的连接。

注意到第2步和第3步并行可能发生。

我们写输入层的单位(传感器),比例在0和1之间;作为隐藏层的单位输出层的单位(系统目标)。我们另外定义monodedicated连接的向量;矩阵的隐藏层和输出层之间的连接;的离散时间跨度AutoCM权重的进化,或者,换句话说,加工周期的数量,计算从零和加大每完成一个单位圆的计算:。

为了指定定义AutoCM算法1 - 4的步骤,我们必须定义相应的信号正向传递方程和学习方程,如下。(一)从隐藏的输入信号传输层: 在哪里是一个正实数不低于1,我们将称之为收缩参数注释(见下文),和那里的()中省略了下标符号的输入层单元,因为这些在每个循环的处理保持不变。是很有用的,在那里变量的数量被认为是。(b)适应的连接通过变异,根据(捕获产生的能量差1): (c)从隐藏的信号传输到输出层: (d)适应的连接通过变异量,因此,捕获的能量差(4):

首先,我们需要指定是学习AutoCM系数。这个系数是考虑三种不同的选择条件:(1)AutoCM权重更新在每个周期;(2)选择任何记录的顺序在每个时代是随机的(一个时代是周期的数量我们需要更新数据集的每一个记录);(3)每次循环后AutoCM接近其收敛点,和之间的更新量和减少到零。

为此有必要设置学习系数的方式AutoCM可以更新它的权重合理数量的时代之后,如果没有受到的随机顺序记录在每个周期。

因此,我们建议选择学习系数考虑收缩因子,变量的数量,记录的数量,指定的数据集:

2.3。AutoCMs:理论讨论

有几个重要的特性Auto-CMs [9- - - - - -12]对更熟悉类网络需要特别关注和呼吁谨慎反思。(我)AutoCMs能够从初始化开始学习当所有连接设置为相同的值,也就是说,它们不受对称连接的问题。(2)在培训过程中,AutoCMs总是为连接分配积极的价值观。换句话说,Auto-CMs不允许抑制节点之间的关系,但只有不同优势的兴奋性连接。(3)AutoCMs可以学习在困难的条件下,即当网络连接的第二层连接矩阵的主对角线是移除。在这种学习的过程,似乎Auto-CMs重建发生每两个变量之间的关系。因此,从实验的角度来看,似乎连接矩阵转化为的排名的排名发生每两个变量的联合概率。(iv)一旦发生了学习过程,任何输入向量,属于训练集,将生成一个零输出向量。所以,能量最小化训练向量表示为一个函数的槽的连接完全吸收输入向量训练训练。因此,AutoCM似乎学习如何在“黑暗的身体”转型。(v)在培训的结束阶段(),所有组件的权重向量达到相同的值: 矩阵那么,代表了AutoCM了解整个数据集。

一个可以使用嵌入的信息矩阵计算在一个自然的方式出现在变量的联合概率: 新的矩阵可以理解为从任何状态转换的概率变量别人: (我)此外,矩阵可能转化为一个非欧几里得的距离度量(半度量的),当我们培养AutoCM的主对角线矩阵固定值。现在,如果我们考虑作为一个极限值的权重矩阵,我们可以写新的矩阵又是一个平方对称矩阵,零(即主对角线条目。,they represent the zero distance of each variable from itself), and where the off-diagonal entries represent “distances” between each couple of variables.

2.4。AutoCM和最小生成树

方程(11)转换AutoCM成平方加权矩阵的平方矩阵节点之间的距离。每一对节点之间的距离可能因此被视为这一对节点之间的加权边缘在一个合适的用图表示,这样的矩阵本身可能通过图论分析工具。

图是一个有用的数学抽象为解决各种各样的问题。从根本上讲,一个图形由一组顶点,和一组边缘,边缘是一个对象,连接两个顶点的图。更准确地说,一个图表是一对(V,E),V是一个有限集合,E是一个二元关系V,它可以把标量值(在本例中,距离)。

在这一点上,它是有用的概念引入最小生成树(M.S.T.) [9- - - - - -12]。

最小生成树问题是定义如下:找到一个无环的子集T的E连接图中所有顶点,其总重量(即总距离)最小化,总重量是: 被称为生成树,MST是吗的加权和边缘达到最小值:

从概念的角度,MST代表的能量最小化状态结构。事实上,如果我们考虑一个结构的元素原子作为图的顶点和它们之间的强度为每条边的重量,连接两个顶点,MST代表所需的最小能量,结构保存他们的所有元素相互连贯。在一个封闭的系统中,倾向于减少总能量的所有组件。所以MST,在特定的情况下,可以表示系统往往最可能的状态。

确定MST的无向图,图的每条边加权。方程(11)显示一种重量每条边的节点变量的数据集,以及权重的训练AutoCM提供(重量)指标。

显然,可以使用任何一种Auto-Associative安或任何一种线性Auto-Associator生成矩阵变量的一个数据集分配的权重的大小。但很难训练一个两层Auto-Associative反向传播安与主对角线权重固定(为了避免自相关问题)。在大多数情况下,均方根误差(RMSE)停止减少几个时代,特别是当记录的正交性相对较高,情况时经常需要重量的记录分配数据集之间的距离。在这种情况下,它是必要的训练数据集的转置矩阵。顺便说一下,如果一个线性Auto-Associator用于目的,所有的变量之间的非线性协会将丢失。

因此,AutoCM似乎是迄今为止最好的选择来计算权重的完整和非线性矩阵中变量或记录任何指定的数据集。

2.5。图的复杂性:函数

现在我们介绍一个新的指标:每个节点的程度的保护在任何一个有向图。

这个指标定义的秩中心内的每个节点图,当迭代剪枝算法。修剪算法首次被发现和应用作为全球指标为图的复杂性会Massini Semeion研究中心在2006年(13]:(参见算法1)。

排名= 0;
做
{
排名^{+ +};
Consider_All_Nodes_with_The_Minimum_Number_of_Links ();
Delete_These_Links ();
Assign_a_Rank_To_All_Nodes_Without_Link(等级);
Update_The_New_Graph ();
Check_Number_of_Links ();
}而at_least_a_link_is_present

节点的等级越高,较大的中心位置在图。最新的节点删除也内核的节点图。摘要,这个算法是广义测量全球任何一种图的复杂性。

修剪算法也可以用于定义图的数量任何图形的复杂性。如果我们把的意思是没有任何联系的节点数量,在每一次迭代,如修剪算法运行时,我们可以定义hubness指数,的图节点。为了正确地定义这个量,我们需要引入一些初步概念。我们定义了一个循环或修剪算法的迭代算法的作为一个给定的应用程序。在每一个周期,对应一个梯度,可不同的周期循环。只要两个后续周期产生同样的梯度,修剪他们属于同一类。随着degli梯度变化一个周期,前面的课结束,一个新的开始。我们现在的位置来定义hubness如下: 是图的链接(n - 1树);的节点数量;修剪算法的周期数;是隐含的状态数的变化梯度,在修剪过程中;是没有链接的节点数量jth迭代;求和的美国隐含的梯度的变化梯度,在修剪过程中。

方程(15平均梯度图的)措施。

方程(16)在修剪措施梯度变化的动态过程。

方程(14)是一个复杂的比率平均梯度和梯度的动态,从一边和全球图连通性的另一边。

使用作为一个全球指标,可以定义一个图形在多大程度上是面向中心。

的指标(14),(15)和(16)代表的全球hubness图。当,树是一维线,其复杂性是最小的。当,树的礼物只有一个中心,其复杂性比一棵树可以达到最大。一个图的复杂性,事实上,连接到它的熵。信息图的数量与图直径和连接的顶点:给定顶点数,直径越短,熵越大。从经典的熵的概念我们可以这样写如果我们的名字一般的树图的拓扑熵,我们可以写在哪里是图边的数量(当图是树);是图顶点的数量;修剪的循环次数必须断开完全图;是连接每个顶点的度。

的数量措施的概率一般节点,在那里,必须直接连接到节点。这意味着一个熵图,,会增加当顶点与大量的链接的数量增加。因此,概率安排的链接顶点,使用一个随机过程,线性链是最低的。因此,修剪的循环次数越高,所需图形,图像熵越小。方程(18树)清楚地表明,“中心”比“链树”更多的熵。因此,当索引树的增加,其增加的冗余。

2.6。δ函数

考虑给定图的结构是如何改变了一个修剪的过程,就自然想到发生了什么图形,特别是mst,作为一个或多个节点的删除。方法将图形必须组织继续尽可能反映底层结构的关系一旦一个或多个节点带走吗?其他节点将如何重新排列他们的链接底层指标和约束的基础上,再次连接彼此吗?

定义一个每一个索引不同的mst生成从原来的距离矩阵通过删除一个不同的顶点在每一步: 是图的链接(树);的节点数量;修剪算法的周期数;是隐含的状态数的变化梯度,在修剪过程中;是没有链接的节点数量j——迭代;求和的美国隐含的梯度的变化梯度,在修剪过程中。

每一个树代表了相同的复杂性,当原始距离矩阵顶点删除。因此,整个MST的复杂性之间的差异(例如,)和任何的mst的复杂性通过删除一个图的顶点(),是具体的衡量的贡献图的顶点到原始图的全球的复杂性: 这个新的指数措施在多大程度上每个顶点的图有助于增加()或减少()的冗余,整体图。我们叫这个函数三角洲函数;它可以应用于任何类型的图表。

2.7。AutoCM并最大限度地定期图(著)

MST表示我们可以称之为“神经系统”的数据集。事实上,总结所有连接的优势在所有的变量,我们得到了系统的总能量。MST只选择最小化这种能量的联系,也就是说,只有那些真正需要将系统连贯的。因此,所有的链接包含在MST是基本,但是,恰恰相反,并不是每一个“基本”链接的数据集需要在MST。这样的限制是内在MST本身的性质:每一个环节,产生一个循环图(即,破坏了图像的“treeness”)是消除,无论它的力量和意义。解决这个缺点,更好的捕捉数据集的内在复杂性,有必要增加更多的MST的链接,根据两个标准:(我)新链接必须从定量的角度相关;(2)新链接必须能够生成新的循环规律的微观结构,从定性的角度来看。

因此,MST树图转化为一个周期的无向图。因为周期,新的图形是一个动态的系统,包括其结构的时间维度。这就是为什么这个新的图不仅要提供信息与结构有关,还与数据集的函数的变量。

构建新的图,我们需要进行如下:(我)假设MST结构作为新的图的起点;(2)考虑的排序列表连接跳过在MST的推导;(3)估计函数的图像每一次你添加一个新的连接MST基本结构、监控新图形的复杂性的变化每一步。

我们将调用最大限度正则图(著)的图H函数达到最高的价值在所有生成的图表添加回到原来的MST,一个接一个地失踪的连接之前跳过在MST本身的计算。从(14著可能)描述如下:

的数量是一个关键变量的计算著。事实上可能也空,当MST的计算要求没有连接到被忽略。在这种情况下,不存在著的数据集。

此外,确保最后,因此最弱,连接添加到生成著总是更相关,MST的弱连接。著,最后,生成,从MST,图表展示最多的规律的微观结构,利用数据集的最重要的连接。的价值就越高函数在选择生成的连接著,更有意义的著的微观结构。

著计算也很有用定义MST密实度:少即是弧跳过在MST生成的数量,更多的MST代表;在其他条款: 著的另一个重要指标是相关性:这个指数取决于2其他指标:(我)该著Hubness,,(21): (2)和添加新链接的数量由著代: 这两个指标的模糊组合可以表达著相关性: 此时我们可以近似一个新的指数来衡量所提供的信息量著尊重MST:

3所示。结果

我们有ALS数据集分为:病例数据集(58记录)和控制数据集(207条记录)。然后是应用于每一个独立AutoCM算法。AutoCM算法生成两个加权MST和δH函数指出的关键变量两个数据集(见图2(一个)和图2 (b))。两个mst不同的拓扑和本地(不同的变量连接)和δH函数显示了一个非常有趣的情况(见表1)。(我)3变量(APOA4_glu360his NOS3_A_922_G LPL_ser447term)似乎低复杂度的情况下MST的原因:当每个其中之一是,增加其复杂性,MST相同价值的全球MST控制数据集(例= 0.171429和控制= 0.17193);(2)3变量(ADRB3_trp64arg LIPC_C_480_T MMP3_5A_6A)似乎控制MST的高复杂性的原因:当每个人都移除,MST减少其复杂性,一样的全球MST的价值的情况下的数据集(例= 0.137427和控制= 0.136905);


控制
变量	中心的相关性	变量	中心的相关性

全球	0.17193	NOS3_C_690_T	0.171429
ADRB3_trp64arg	0.136905	NOS3_glu298asp	0.171429
LIPC_C_480_T	0.136905	DCP1_ins_del	0.171429
MMP3_5A_6A	0.136905	AGTR1_A1166C	0.171429
APOC3_C_641_A	0.171429	AGT_met235thr	0.171429
APOC3_C_482_T	0.171429	NPPA_G664A	0.171429
APOC3_T_455_C	0.171429	NPPA_T2238C	0.171429
APOC3_C1100T	0.171429	ADD1_gly460trp	0.171429
APOC3_C3175G	0.171429	SCNN1_trp493arg	0.171429
APOC3_T3206G	0.171429	SCNN1A_ala663thr	0.171429
APOE_cys112arg	0.171429	GNB3_C825T	0.171429
APOE_arg158cys	0.171429	ADRB2_arg16gly	0.171429
APOA4_thr347ser	0.171429	ADRB2_gln27glu	0.171429
PPARG_pro12ala	0.171429	APOB_thr71ile	0.171429
APOA4_glu360his	0.171429	F2_G20210A	0.171429
LPL_T_93_G	0.171429	F5_arg506gln	0.171429
LPL_asp9asn	0.171429	F7_del_ins	0.171429
LPL_asn291ser	0.171429	F7_arg353glu	0.171429
LPL_ser447term	0.171429	PAI_G5_G4	0.171429
PON1_met55leu	0.171429	PAI_G11053T	0.171429
PON1_gln192arg	0.171429	FGB_G_455_A	0.171429
PON2_ser311cys	0.171429	ITGA2_G873A	0.171429
LDLR_Ncol_Ncol	0.171429	ITGB3_leu33pro	0.171429
CETP_630	0.171429	SELE_ser128arg	0.171429
CETP_628	0.171429	SELE_leu554phe	0.171429
CETP_ile405val	0.171429	ICAM_gly214arg	0.171429
LTA_thr26asn_A	0.171429	TNFa_G_376_A	0.171429
MTHFR_C677T	0.171429	TNFa_G_308_A	0.171429
NOS3_A_922_G	0.171429	TNFa_244	0.171429
		TNFa_238	0.171429
		LTA_thr26asn_B	0.171429

	情况下
变量	中心的相关性	变量	中心的相关性

全球	0.137127	AGTR1_A1166C	0.136905
APOA4_thr347ser	0.136905	AGT_met235thr	0.136905
APOB_thr71ile	0.136905	NPPA_G664A	0.136905
APOC3_C_641_A	0.136905	NPPA_T2238C	0.136905
APOC3_C_482_T	0.136905	ADD1_gly460trp	0.136905
APOC3_T_455_C	0.136905	SCNN1_trp493arg	0.136905
APOC3_C1100T	0.136905	SCNN1A_ala663thr	0.136905
APOC3_C3175G	0.136905	GNB3_C825T	0.136905
APOC3_T3206G	0.136905	ADRB2_arg16gly	0.136905
APOE_cys112arg	0.136905	ADRB2_gln27glu	0.136905
APOE_arg158cys	0.136905	MMP3_5A_6A	0.136905
ADRB3_trp64arg	0.136905	F2_G20210A	0.136905
PPARG_pro12ala	0.136905	F5_arg506gln	0.136905
LIPC_C_480_T	0.136905	F7_del_ins	0.136905
LPL_T_93_G	0.136905	F7_arg353glu	0.136905
LPL_asp9asn	0.136905	PAI_G5_G4	0.136905
LPL_asn291ser	0.136905	PAI_G11053T	0.136905
PON1_met55leu	0.136905	FGB_G_455_A	0.136905
PON1_gln192arg	0.136905	ITGA2_G873A	0.136905
PON2_ser311cys	0.136905	ITGB3_leu33pro	0.136905
LDLR_NcoI_NcoI	0.136905	SELE_ser128arg	0.136905
CETP_630	0.136905	SELE_leu554phe	0.136905
CETP_628	0.136905	ICAM_gly214arg	0.136905
CETP_ile405val	0.136905	TNFa_G_376_A	0.136905
LTA_thr26asn_A	0.136905	TNFa_G_308_A	0.136905
MTHFR_C677T	0.136905	TNFa_244	0.136905
NOS3_C_690_T	0.136905	TNFa_238	0.136905
NOS3_glu298asp	0.136905	LTA_thr26asn_B	0.136905
DCP1_ins_del	0.136905	APOA4_glu360his	0.171429
		NOS3_A_922_G	0.171429
		LPL_ser447term	0.171429

(一)

(b)

如果这些问题应该有一个生物原因,AutoCM算法和δ函数过程非常有能力捕捉隐藏信息进入医疗数据集。

作为分析的第二步,我们计算著的两个数据集(见图3(一个)和3 (b))。也在这种情况下,著hubbness和链接显示了低复杂度的情况下数据集和一个非常高的复杂性的控制数据集。这似乎证实,在一个理想的健康状况生物体清单比例高的复杂规律和冗余的结构和功能。

(一)

(b)

4所示。讨论

健康的生理功能的特点是多个控制机制的复杂的相互作用,使个体适应日常生活的紧急状态和不可预知的变化。疾病过程似乎被这些机制的进步的障碍,导致生理功能和动态范围的损失,因此,减少适应压力的能力。新兴的概念是损失的冗余,熵和复杂性是一个疾病特别是慢性疾病的标志。

定义和量化变量相互作用的复杂性,从数学的观点非常困难的任务。复杂网络理论通过建立标准来定义中心在一个特定的变量网络提供了一个框架,建立参数相应的增加或损失的复杂性与一个特定的变量的存在与否的一组变量。

在本文中,我们应用了一个新颖的革命性方法建立的多态性可能参与SALS发生中发挥基础作用保护或增加疾病发生的脆弱性增加或减少图像编码的hubness许多许多基因型之间的动态关系。

确定了六个基因变异的不同导致的复杂性系统:载脂蛋白iv (APOA-IV) glu360his (rs5110)、一氧化氮合酶3 (NOS3) -922 a / G (rs1800779)、脂蛋白脂肪酶(LPL) ser447term (rs328),肾上腺素,β3受体(ADRB3) trp64arg (rs4994)、肝脂酶(LIPC) -480 c / T (rs1800588)和矩阵metallopeptidase 3 (MMP3) -1171 5 / 6 (rs3025058)。三个以上的基因/ snp代表保护性因素,APOA4 glu360his, nos3 - 922 a / G和LPL ser447term,因为他们的贡献对整个复杂性导致高达0.17(见表1)。另一方面ADRB3 trp64arg, lipc - 480 c / T)和mmp3 - 1171 5 / 6 a,其中心发表了高达0.13,似乎代表了敏感性因素(见表1)。

之间的基因/单核苷酸多态性赋予风险或保护的疾病,我们指出,四个参与脂质通路,APOA4, LPL、LIPC, ADRB3虽然两人也参与氧化应激,血管生成,细胞的细胞骨架(NOS3和MMP3)。

包括标识的保护性基因/ snp基因apo iv,映射11号染色体上q2和编码的糖蛋白396 -残留preprotein初级翻译产品是一种分泌蛋白水解处理后。尽管它的精确函数是未知的,apo iv是一个强有力的催化剂lecithin-cholesterol酰基转移酶在体外和显示体外抗氧化和antiatherogenic属性,和apoA-IV antiatherogenic属性表明,这种蛋白质可以作为抗炎剂(14]。第二个保护性基因/ snp仍然参与脂质通路LPL ser447term;8号染色体上的基因地图第22位和编码脂蛋白脂肪酶,表达了心中,肌肉和脂肪组织。LPL甘油三酯水解酶的双重功能,配体/受体介导脂蛋白摄取的连接因素。几个LPL基因位点的DNA变异被发现与血浆脂质水平,尤其是Ser447ter有潜力提高血浆高密度脂蛋白(HDL)水平(15]。高密度脂蛋白的作用在ALS疾病仍然是有争议的,高脂血症被证实是一个重要的预后因素ALS患者的生存,与一个更好的结果16]。然而,最近发现在意大利ALS患者不支持这一观点,尽管一些呼吸系统损害的证据,但不是一个糟糕的临床地位或较低的身体质量指数,与降低血脂和LDL / HDL比(17]。

过去的保护因素,nos3 - 922 a / G变体,属于基因定位到染色体7 q36和编码内皮细胞的胞质酶,主要演员的过程中血管张力的调制产生一氧化氮(NO),血管舒张剂。本构似乎没有从微血管内皮释放负责防止白细胞着边在生理条件下通过调节内皮细胞氧化代谢。在该机制中不充当抗氧化剂代理防止iron-mediated氢过氧化物的形成。积累的证据表明,ALS与自由基引起的氧化损伤有关。增强氧化损伤的标记和补偿性反应氧化应激增加的迹象被发现患者SALS [18),因为不同的抗氧化系统似乎参与ALS与其他神经退行性疾病相比,氧化应激可能是一个原因,而不是一个神经元死亡的结果(19]。

现在考虑脆弱性因素,lipc - 480 c / T属于基因位于染色体15 q21-23和编码糖蛋白参与几个脂蛋白的代谢。C / T 480−替换的基因的启动子区域已被证明是降低脂肪酶活性显著相关(20.),也参与了抗炎和抗氧化活性21]。再次,脂质通路仍参与。

ADRB3基因已本地化的染色体8 p12-8p11.1编码肾上腺素能受体群成员G-protein-coupled受体;它位于主要在脂肪组织和参与脂类分解的规定和生热作用。一些β3受体激动剂在动物实验中已经证明了反应力的影响,表明它还有一个作用在中枢神经系统22]。此外,trp64arg多态性似乎增加BMI相关(23),最近这种多态性似乎与精英耐久性能相关的(24]。这很有趣,因为文献支持足球的概念,及其导致的头部外伤,ALS是相互关联的,高水平的运动/体力活动可能发挥添加剂参与疾病的发病机理(25]。即使暴露在体育锻炼的作用,加上创伤,ALS的争论,在最近的一次初步研究包括61名患者和112名对照作者表明,体育锻炼与创伤性事件(但不26是相关的。

关于过去的风险因素,mmp3 - 1171 5 / 6,这属于11号染色体上基因映射q22.3和编码的蛋白质基质金属蛋白酶(MMPs)家庭。基质金属蛋白酶家族的zinc-dependent endoproteinases,效应器分子2和血脑屏障的破坏,并促进神经组织入侵白细胞炎症疾病的中枢和周围神经系统。此外,基质金属蛋白酶发挥重要作用在突触重建,神经再生,remyelination [27]。基质金属蛋白酶在ALS建议发挥重要作用病理学和一些研究仍持续在动物模型和人类发现的证据之间的关系。

我们知道运动神经元死亡ALS的多个异常的生物过程也涉及nonneuronal小胶质细胞和星形胶质细胞等细胞脂质稳态走出我们的数据是什么,氧化应激和细胞改造ALS是严格相关。我们刚刚发表评论的作用具体确定变异在细胞/分子通路。最近发现报道在脂质分子如何诱导的细胞毒性聚合铜/锌超氧化物歧化酶,主要的基因与疾病的家族和零星的形式,在生理条件下暗示它可能的发病机制的研究提供了一种可能的机制ALS (28]。最近,低血清脂质水平显示出与ALS患者的呼吸障碍(29日]。此外,在肌萎缩性脊髓侧索sclerosis-parkinsonism痴呆复杂(ALS-PDC)共同在西太平洋地区,多次与使用不同种类的苏铁属植物的种子,它已被证明在体外胆固醇的影响-D-glucoside,胆固醇和苏铁植物甾醇糖甙在脑线粒体呼吸和活性氧生成(30.]。事实上胆固醇体内平衡障碍可能导致人类大脑疾病,如阿尔茨海默病(31日和亨廷顿氏舞蹈症32例如,]。

在肌萎缩性侧索硬化症(第一部作品6),我们展示了进化方法选择最预测变量能够区分ALS患者和控制。在那工作的问题是独立变量的先验概率分布将从控制在一个更好的方法情况下吗?一组七个变量显示在一个合适的方式做这个工作(96%)的平均精度盲目测试。

在这个工作我们对科学界一个不同的问题:基因多态性(变量)保护或更脆弱的ALS患者和对照组?

这两个问题之间没有必要的十字路口:小器官的差异在工作中可以产生巨大差异的症状,因为与其他器官的互动。因此,一些多态性可以作为疾病的症状更明显,没有疾病的主要原因。同样,前面工作的七个变量可以ALS的最佳预测指标,没有ALS症状的主要原因:他们是有用的识别肌萎缩性侧索硬化症,但他们不是一个必要的ALS的解释。

更多的预测功能的疾病不需要相同的特性能够更好的动力学解释疾病;一个例子:在酒精成瘾,成为一个酒鬼的主要原因可能是一个社会心理条件,但更多的预测功能理解如果有人是一个酒鬼可以分析他/她的肝脏的功能状态。

在实际工作中,使用一个全新的自适应算法,我们试图更好地理解这遗传多态性解释深情况下和控制之间的区别。换句话说多态性被安排在不同的网络,如何与不同的链接和连接强度,到两个次级样本。

5。结论

我们应用一个革命性的方法能够处理复杂的零星的肌萎缩性侧索硬化症等疾病。这种新方法可以识别基因/单核苷酸多态性赋予疾病易感性或保护,我们不能歧视等位基因的6个变种鉴定是参与,这是由于数据库是如何实现的。从数据分析我们推断生物信息连贯与ALS发病的可能途径。我们的数据清楚说明了这种新方法的力量并将是极大的兴趣与其他更复杂的测试ALS数据库来获得更多的信息。

作者的贡献

m . Buscema进行了统计分析和发达的智能系统。美国Penco参与这项研究的设计,协调和起草。大肠Grossi参与的设计研究中,统计分析,协调和起草。所有作者阅读和批准了期末论文。

引用

m . Buscema“小说改编为紧急属性映射方法在数据基地:发现医学领域的经验,”《IEEE国际会议系统,人与控制论(SMC ' 07)2007年10月,蒙特利尔,加拿大,。视图:谷歌学术搜索
r . Tandan w·g·布拉德利,“肌萎缩性脊髓侧索硬化症:第一部分临床特征、病理、在管理和伦理问题,”神经病学年鉴,18卷,不。3、271 - 280年,1985页。视图:谷歌学术搜索
r·g·米勒,j·d·米切尔·m·里昂·d·h·摩尔,”利鲁唑对肌萎缩性脊髓侧索硬化症(ALS) /运动神经元病(MND)”Cochrane系统评价的数据库,没有。1,文章ID CD001447, 2007。视图:谷歌学术搜索
a . Beleza-Meireles和a . Al-Chalabi”基因研究肌萎缩性脊髓侧索硬化症:争论和观点,“肌萎缩性脊髓侧索硬化症,10卷,不。1、1 - 14,2009页。视图:出版商的网站|谷歌学术搜索
j·j·p·佩里、d s Shin和j·a·泰纳“肌萎缩性脊髓侧索硬化症”,实验医学和生物学的发展卷。685年,9-20,2010页。视图:出版商的网站|谷歌学术搜索
s . Penco m . Buscema m . Patrosso a . Marocchi和e . Grossi”新应用程序的智能代理在零星的肌萎缩性脊髓侧索硬化症识别意料之外的特定的遗传背景,“BMC生物信息学,9卷,p。254年,2008年。视图:出版商的网站|谷歌学术搜索
m . Buscema Ed。“挤压理论和收缩映射网络,”Semeion技术论文32岁,2007年。视图:谷歌学术搜索
m . Buscema c Helgason,大肠Grossi”自动收缩地图,H函数和最大限度地正则图:理论和应用,”学报IEEE人工自适应系统在医学上特别会议:在现实世界中应用(NAFIPS ' 08)美国,纽约,纽约,2008年5月。视图:谷歌学术搜索
m . Buscema和大肠Grossi Eds。人工自适应系统在医学,eBooks-Bentham科学出版商,橡树公园,生病,美国,2009年。
b·克鲁斯卡尔”最短生成子树图和旅行推销员问题,“美国数学学会学报》上,7卷,不。1,48-50,1956页。视图:谷歌学术搜索
d·r·Karger p . n . Klein, r . e . Tarjan“随机线性时间算法找到最小生成树,”ACM的杂志,42卷,不。2、321 - 328年,1995页。视图:出版商的网站|谷歌学术搜索
A.-L。巴斯”网络医学肥胖“Diseasome”,“新英格兰医学杂志》上,卷357,不。4、404 - 407年,2007页。视图:出版商的网站|谷歌学术搜索
g . Massini树可视化工具,40 # Semeion软件,版本。8.0,2006 - 2011年,罗马。
t . Vowinkel m . Mori c . f . Krieglstein et al .,“载脂蛋白iv抑制实验性结肠炎,”临床研究杂志,卷114,不。2、260 - 269年,2004页。视图:出版商的网站|谷歌学术搜索
y, m·e·t·道美国Imholz et al .,“多个基因变异以及候选人通路影响血浆高密度脂蛋白胆固醇浓度,”脂质研究期刊》的研究卷,49号12日,第2589 - 2582页,2008年。视图:出版商的网站|谷歌学术搜索
l . Dupuis p . Corcia a Fergani et al .,“肌萎缩性脊髓侧索硬化症,血脂异常是一个保护因素”神经学,卷70,不。13日,1004 - 1009年,2008页。视图:出版商的网站|谷歌学术搜索
答:亚蔡,a·卡尔沃a Ilardi et al .,“低血清脂质水平与ALS患者的呼吸系统障碍有关,”神经学,卷73,不。20日,第1685 - 1681页,2009年。视图:出版商的网站|谷歌学术搜索
g .西西里岛舞蹈'Avino c, D, a . Del电晕et al .,“受损的氧化代谢和脂质过氧化作用在锻炼肌肉的肌萎缩性侧索硬化症患者,”肌萎缩性脊髓侧索硬化症和其他运动神经元疾病,3卷,不。2,页57 - 62,2002。视图:出版商的网站|谷歌学术搜索
a . Baillet诉Chanteperdrix, c . Trocme p . Casez c·盖伦和g·贝松,“氧化应激的作用在肌萎缩性脊髓侧索硬化症和帕金森病,”神经化学研究,35卷,不。10日,1530 - 1537年,2010页。视图:出版商的网站|谷歌学术搜索
y . m .风扇、ot Raitakari m . Kahonen et al .,“肝脂肪酶促进剂c - 480 t多态性与血清脂质水平有关,但不是亚临床动脉粥样硬化:年轻的芬兰人的心血管风险研究中,“临床遗传学,卷76,不。1,46-53,2009页。视图:出版商的网站|谷歌学术搜索
p . a . McCaskie g . Cadby j . et al .,挂着“c - 480 t肝脂酶多态性与高密度脂蛋白胆固醇与冠心病的风险,但并不是“临床遗传学,卷70,不。2、114 - 121年,2006页。视图:出版商的网站|谷歌学术搜索
j . Stemmelin c·科恩Yalcin, p .基恩和g . Griebel”的含义β₃使用Adrb3 -adrenoceptors amibegron抗抑郁作用的基因敲除小鼠慢性温和应激,”大脑研究行为,卷206,不。2、310 - 312年,2010页。视图:出版商的网站|谷歌学术搜索
k . h . Kadowaki Yasuda, k Iwamoto et al .,“突变β₃肾上腺素能受体基因与肥胖和byperinsulinemia日本主题,“生物化学和生物物理研究通信,卷215,不。2、555 - 560年,1995页。视图:出版商的网站|谷歌学术搜索
c·j·r·鲁伊兹圣地亚哥a Buxens et al .,“Trp64Arg ADRB3基因的多态性与精英耐久性能有关,”英国运动医学杂志》上,45卷,不。2、147 - 149年,2011页。视图:出版商的网站|谷歌学术搜索
o .广场、a . l .警笛和h . Ehrenreich”足球、创伤和肌萎缩性脊髓侧索硬化症:有联系吗?”目前的医学研究和意见,20卷,不。4、505 - 508年,2004页。视图:出版商的网站|谷歌学术搜索
e . Beghi g . Logroscino a亚蔡et al .,“肌萎缩性脊髓侧索硬化症,体育锻炼、创伤、体育:飞行员以人群为基础的病例对照研究的结果,“肌萎缩性脊髓侧索硬化症,11卷,不。3、289 - 292年,2010页。视图:出版商的网站|谷歌学术搜索
美国雷诺和d . Leppert“基质金属蛋白酶在神经肌肉疾病,”肌肉和神经,36卷,不。1,1-13,2007页。视图:出版商的网站|谷歌学术搜索
在杨崔,y,收听距离歌et al .,“脂质分子诱导的细胞毒性聚合铜/锌超氧化物歧化酶与结构无序区域,”Biochimica et Biophysica学报,卷1812,不。1,41-48,2011页。视图:出版商的网站|谷歌学术搜索
答:亚蔡,a·卡尔沃a Ilardi et al .,“低血清脂质水平与ALS患者的呼吸系统障碍有关,”神经学,卷73,不。20日,第1685 - 1681页,2009年。视图:出版商的网站|谷歌学术搜索
答:帕诺夫,n . Kubalik b·r·布鲁克斯和c·a·肖,”体外胆固醇的影响β-d-glucoside,胆固醇和苏铁植物甾醇糖甙在脑线粒体呼吸和活性氧生成,“膜生物学》杂志上,卷237,不。2 - 3、71 - 77年,2010页。视图:出版商的网站|谷歌学术搜索
r . m . Adibhatla和j·f·孵卵器”,改变在脑损伤和脂质代谢紊乱,”亚细胞生物化学49卷,第268 - 241页,2008年。视图:谷歌学术搜索
m . Valenza和大肠均胆固醇功能障碍在神经退行性疾病:亨廷顿氏舞蹈症列表中吗?”神经生物学的进展,卷80,不。4、165 - 176年,2006页。视图:出版商的网站|谷歌学术搜索

国际神经病学研究