ty -jour a2 -fantacci,玛丽亚·E·澳大利亚 - 黄,po -jung au -chang,jui -huan au -lin,hou -hsien au -li,yu -xuan au -lee -lee -chi -ching au -su -su,chunging au -su,chung chung-tsai au -li,Yun -lung au -chang,ming -tai au -weng,sid au -cheng -cheng,wei -hung au -chiu -chiu,cheng -hsun au -tang,tang,petrus py -2020 da -2020/09/01/01Ti- deepVariant-on Spark:使用基于云的计算框架SP-7231205 VL-2020 AB的小规模基因组分析 - 尽管测序人类基因组已变得负担得起,但从全基因组序列数据中识别遗传变异仍然是hurdle对于没有足够计算设备或生物信息学支持的研究人员。GATK是鉴定遗传变异的黄金标准方法,多年来已在基因组项目和人群遗传研究中广泛使用。直到Google Brain团队开发了一种新方法DeepVariant,该方法利用深层神经网络来构建图像分类模型来识别遗传变异。但是,DeepVariant的卓越精度是以计算强度为代价的,在很大程度上限制了其应用。因此,我们介绍了Spark的深色,以优化资源分配,启用多GPU支持并加速DeepVariant管道的处理。为了使Spark在Spark上更容易访问所有人,我们将Spark部署到Google Cloud Platform(GCP)。用户可以在20分钟内按照我们的指示在GCP上部署DeepVariant-on Spark,并开始使用GCP提供的免费信用来分析至少十个全基因组测序数据集。Spark的DeepVaraint-on-Spark可自由使用基于云的计算框架进行小规模的基因组分析,该框架适用于试验测试或初步研究,同时保留用于大规模测序项目的灵活性和可扩展性。 SN - 1748-670X UR - https://doi.org/10.1155/2020/7231205 DO - 10.1155/2020/7231205 JF - Computational and Mathematical Methods in Medicine PB - Hindawi KW - ER -