ty -jour a2 -xue,yu au -yu -chrimes,dillon au -zamani,hamid py -2017 da -2017/12/11/11 ti-在临床服务的大数据分析平台SP -6120820 VL -6120820 VL -2017 ab -2017 ab -2017 AB- 大数据分析(BDA)对于降低医疗保健成本很重要。但是,数据聚合,维护,集成,翻译,分析和安全/隐私面临许多挑战。通过使用HADOOP分布式文件系统(HDFS)(使用key-value nosql数据库)构建平台框架来实现使用开源软件技术建立交互式BDA平台使用模拟患者数据建立交互式BDA平台的研究。分布式数据结构是由90亿名患者记录的基准医院特异性元数据产生的。在优化的迭代中,HDFS将HFILE摄入HBase Store文件显示了数百个迭代的持续可用性。但是,要完成MAPREDUCE到HBase需要一周(10 TB)和一个月,分别为30亿(30 TB)的索引患者记录。发现MapReduce的不一致限制了有效生成和复制数据的能力。Apache Spark和Drill表现出高性能,具有高可用性的技术支持,但可用于临床服务的可用性差。基于以患者为中心的数据的医院系统在使用HBASE方面具有挑战性,因此,并非所有数据概况都与复杂的患者到院关系完全集成在一起。 However, we recommend using HBase to achieve secured patient data while querying entire hospital volumes in a simplified clinical event model across clinical services. SN - 1748-670X UR - https://doi.org/10.1155/2017/6120820 DO - 10.1155/2017/6120820 JF - Computational and Mathematical Methods in Medicine PB - Hindawi KW - ER -