统计遗传学可以看作是应用概率与统计的一个经典分支,而最近上涨势头,由于遗传学的重大突破。随着现代技术的可用性,新方法,和显著增加数据信息,必须研究基因特征如疾病和遗传易感性之间的关系以一种前所未有的方式。这个领域是应用统计学的热点话题之一,应用数学,生物/医学研究,及其他相关科学。

这个特殊问题的主要目的侧重于计算的新发展和应用,数学,统计方法在基因疾病研究。特刊将成为研究人员的国际论坛来交换他们的新思想,该领域的最新发展和思想。

在这个特殊的问题,我们选择了七篇文章在上述主题。下面是一个简短的总结所选的文章在这个特殊的问题。

最近生物技术的进步导致了一个巨大的数量的遗传标记的识别疾病关联研究;如何选择一个更小的组基因来探索基因和疾病之间的关系是一项非常具有挑战性的任务。贝叶斯方法的优势将先验信息纳入模型等分析。文章“应用贝叶斯基因的选择和分类与广义奇异g-priors混合物由W.-K”。简和c k萧与高斯之前使用贝叶斯方法解决这个问题和逆伽马hyperprior。该方法应用于一个冒号和白血病癌症研究。与其他现有的方法进行了比较。作者发现,提出模型的分类精度更高与更小的组选择基因和结果不仅复制一些更早的研究中发现,但也提供了与后验概率的力量。

文章“修改逻辑回归模型使用基因coexpression和临床特征来预测前列腺癌进展“通过h .赵等人提出了一种新的逻辑回归模型预测前列腺癌进展。他们把coexpressed基因档案到物流模型基于临床特征来提高推理精度。然后他们使用这对高分的方法选择基因与疾病有重大联系。该方法的性能比较与一些常用的方法等问题,使用相关的出版研究的数据集。他们的研究表明,该方法性能比常用的一对,高分的方法是一个有用的工具功能(基因)和/或选择用于预后模型。

Resampling-based多个测试程序广泛应用于基因组研究识别差异表达基因和全基因组关联研究。这些流行过程的能力和稳定性还没有被广泛的评估。文章“权力和稳定resampling-based多个测试程序与应用程序的属性基因肿瘤研究”李由d和t . d .染料调查7个常用的力量和稳定性resampling-based多个测试过程中经常用到的高通量数据分析小样本大小的数据。模拟和实际数据基因肿瘤的例子是用于他们的调查。他们的研究表明,引导单步minP过程和引导降压minP过程执行最好的,当样本量小如3在每组和familywise错误率或错误发现率控制需要。当样本容量增加到12和错误发现率控制,排列maxT程序和排列minP程序执行最好的。

文章“转录蛋白质协同POU /物流/ DNA复合物揭示了正常模式分析王”d d和h燕调查如何在POU蛋白/物流/ DNA三元复合物合作互动,这是至关重要的转录调控胚胎干细胞。他们用正常模式分析检测最合作或集体运动(基本模式)的大量蛋白质,常用的工具来分析生物分子的结构动力学,一些技术相结合在工程、数学和统计数据。他们的工作揭示了两种蛋白质如何oct - 1和Sox-2共同生理和结构在两个特定DNA等候网站,通过分析运动级功能。相关措施是用来描述协同对蛋白质的数量。拟议的方法提供有用的信息对理解复杂的交互机制POU /物流/ DNA复合物。同时还提供了相应的在线计算工具。

在现代医学诊断或遗传研究中,接受者操作特征(ROC)曲线是一个流行的工具来评估生物标志物的歧视表现在疾病状态或表型。与协变量的数量的数据,如何选择最相关的covariables,或选择模型具有良好的整体性能,是一个具有挑战性的问题。文章“变量选择在民国回归”王解决这个问题的一个有趣的想法。有很多可用的标准这一问题。作者首先改写中华民国回归到一个分组变量选择形式,这样可以应用,然后提出了当前标准一般两级框架和BIC选择器组竹荚鱼算法在本地模式下的假设。提出的设计方法的基本的渐近性质。仿真研究和实际数据分析表明,该分组变量选择是优于传统模式选择。此外,作者发现,集中信息判据提供了更精确的估计ROC曲线下的面积相对于其他标准。

两阶段设计和分析通常采用全基因组关联研究(gwas)。考虑到遗传模型不确定性,许多健壮的程序在gwas被提出和应用。现有的方法主要集中在二进制特征,和许多这样的方法基于两个独立的阶段,分析数据,做了一些工作在连续(定量)特征。文章“健壮的联合分析在两级数据融合定量特征全基因组关联研究由D.-D”。锅等人提出了一个强大的F-statistic-based健壮的联合分析方法定量特征两阶段,利用原始数据相结合的遗传效应建模为回归参数。变化最大的构造测试数据计算统计学意义和力量。众所周知,马克斯类型统计的关键价值和权力不容易计算。作者推导出解析表达式的基础上的渐近分布,这些数量可以很容易地获得。他们使用模拟显示,该方法大大更健壮 以及基于常用添加剂模型当潜在的遗传模型是未知的。

多个荟萃分析可以使用类似的搜索标准,专注于相同话题的兴趣,但他们有时可能会产生不同的或不和谐的结果。缺乏统计方法合成的这些研究结果使它具有挑战性的正确解释多个荟萃分析的结果,特别是当他们的结果是矛盾的。文章“合成荟萃分析的统计方法”l . l .唐等人介绍了一种方法合成两种情况下的整合结果:(1)当多个荟萃分析使用相同类型的总结效应估计,(2)当荟萃分析使用不同类型的尺度效应。在例2中,荟萃分析结果不能直接结合;因此他们提出了一个两步频率论的过程:首先效应值估计转换为相同的度量,然后用加权平均数估计总结。该方法具有以下优势一些现有方法:不同类型的总结影响大小可以考虑;提供的相同的整体效果可以对所有个体进行荟萃分析研究从多个荟萃分析。

的一个主要目标的全基因组关联研究(GWAS)是为一个二进制的临床开发预测模型结果使用单核苷酸多态性(snp),可用于诊断和预后的目的,更好的理解疾病和单核苷酸多态性之间的关系。惩罚支持向量机(SVM)方法已经为此而广泛使用。然而,因为调查人员往往忽略单核苷酸多态性的遗传模型,最终导致效率的损失预测模型的临床结果。文章“通过惩罚SNP选择全基因组关联研究支持向量机与马克斯测试”j·金等人提出了一种两阶段方法,这样每个SNP的遗传模型识别使用MAX测试,然后使用惩罚支持向量机的预测模型是安装方法。该方法适用于各种处罚svm使用各种惩罚函数和比较他们的表演。他们通过模拟和实际GWAS数据分析表明该方法执行比忽视遗传模型的预测方法,预测能力和选择性。

利用DNA序列数据研究祖先的历史人口是一个重要的部分在对人类进化的理解。这种合并的现有方法推理使用根树或拔起树的方法由观测数据,这两个用递归公式来计算概率的数据。这些方法在实际应用中非常有用,但计算复杂。文章“合并分析使用家谱的树木“a元等人探讨这个问题的新方法。他们第一次调查的渐近行为这样的推理;他们的研究结果表明,广泛的,估计合并的时间将一致的一个有限的限制。然后他们研究中一个相对简单的计算方法来分析和说明如何使用它。

承认

我们感谢所有作者谁促成了这个特殊的问题。

Ao元
Wenqing他
Gengsheng秦
Qizhai李