文摘
由于巨大的潜在基因表达的分析,有助于疾病诊断、新药开发、生命科学研究,提出了双向聚类算法,广泛应用于基因表达数据的研究。为了理解医疗卫生行业的经济数据,分析了医疗卫生行业的经济数据在中国的不同地区基于区块链技术和双向谱聚类分析,使统计医疗卫生行业的经济数据在东部,中部和西部地区。本文研究中国医疗卫生行业的发展现状和医疗卫生服务行业的集聚影响因素,分析他们在区块链技术和双向谱聚类分析方法。结果表明,中国的医学和卫生的总体发展趋势是由政府主导的政府,社会,个人分享。区块链技术和双向转换后的谱聚类分析,制药行业的产值增长了约10%。
1。介绍
传统的聚类分析算法主要处理静态数据信息。由于高速、实时、连续实时数据流的特点,传统的聚类分析算法无法使用。区块链技术本质上是一种分布式见证技术。所谓的分布式意味着数据并不是集中在一个特定的数据服务器中心,但存储在网络中的各个节点。网络成员本身数据的存储载体和直接分享、复制,存储和同步数据。所谓的“证人”是确认和公证信息上传的分布式网络。一旦信息上传和验证成功,它不能被篡改,实现“证人的目的。“数据存储在区块链而不是一个集中的服务器,可以保护数据不被篡改,使数据更可信和可靠的。此外,永久保存数据也防止否认的发生。因此,区块链技术从根本上解决了目前传统的集中式系统的许多问题,由于第三方的存在。
不同于一般的聚类方法,在双向聚类,不仅必须聚集的基因,还必须考虑实验条件的变化在同一时间。聚类对象和属性子集组成的子集与一致的表达模式识别基因组合在特定条件的子集,也就是说,双向聚类。集群变化的动态分析中发现数据流中扮演重要角色的经济数据融合分析医疗卫生行业。
经济数据的融合分析的医疗卫生行业基于区块链技术和双向谱聚类分析,国内外专家进行了许多研究。Yokoya显示2017年的数据融合竞争的科学成果由IEEE组织地球科学和社会遥感图像分析和数据融合技术委员会。它的目标是建立一个精确的模型(评估精度指标的秘密测试城市参考),并在计算上是可行的(评估限时测试阶段)1]。Paola认为使用多传感器数据融合技术是必不可少的有效的合并和分析异构数据收集由多个传感器,这通常部署在智能环境。一个上下文感知、自优化和自适应传感器数据融合系统提出了基于三层体系结构。结果表明,建议的解决方案优于静态方法的上下文感知多传感器融合和达到节能的同时保持高度的推理精度(2]。刘认为,迫切需要开发一个数据融合方法,可以将来自多个传感器的数据集成到更好的描述退化过程的随机性。本文开发了一种方法来构建一个健康指数通过融合多个degradation-based传感器数据(3]。本文,Ghamisi提出一个新的框架使用灭绝概要(EP)和深度学习融合高光谱和光学检测和光栅化数据来自不等。结果与其他方法相比,该方法可以实现准确的分类结果。应该指出的是,本文使用深度学习的概念首次将激光雷达和高光谱特性,为进一步的研究提供一个新的机会(4]。陈俱乐部提出了深度学习框架基于卷积神经网络(CNN)和朴素贝叶斯数据融合方案,称为NB-CNN,用于分析单个视频帧的裂纹检测。与此同时,一个新的数据融合方案用于聚合信息提取每个视频帧来提高系统的整体性能和鲁棒性。出于这个原因,提出了一种CNN在每个视频帧检测破解补丁,和提出的数据融合方案的时间和空间一致性维护视频,裂缝和朴素贝叶斯决策有效地丢弃假阳性(5]。为了创建一个定位系统,提供高可用性的态度估计,道Z还集成了传感器航迹推算。然后数据融合问题表示为连续过滤。提出了一种观察问题的降维状态空间建模提供一个易于实现实时系统。实验结果表明,准确性和一致性,这种紧密耦合方法执行比松散耦合的方法,利用GNSS定位分作为输入(6]。原位Beyca集成了多个传感器信号检测初始异常的超精密加工(芬欧蓝)的过程。通过一种新的监督学习方法的发展,DP模型状态估计结合证据理论的传感器数据融合方法做出一个有凝聚力决定其工艺条件。检测和分类准确性(90%7]。这些研究为本文的创作提供参考,但由于某些问题在相关研究算法和数据样本不足,相关研究的结果并不一致。
在本文中,我们有两个创新。一是提出了一个方法来寻找各种biclusters使用不同bicluster质量评价指标。第二,比较和分析了本文算法的实验结果和其他常用biclustering集成方法在表达数据。比较结果表明,blockchain-based技术和双向谱聚类分析方法提出了实现的指标,和时间性能优于其他方法。
2。数据融合分析方法
2.1。区块链技术
区块链来自底层支持比特币的技术网络。这是一个分散的公共世界面临的分类帐(8]。块头包含版本号、时间戳、随机数,艰难的价值,前一块的哈希值,和根Merkle树的散列值,如图1(9]。区块链是建立在整个网络,扩展区块链网络的方便。任何地方,上网可以连接到区块链,这样就可以实现跨境交易和监管,降低监管成本,提高便利。
区块链是一种存储形式的区块链技术。“块”的区块链是由连接按时间顺序,和相应的信息记录在每个”块中。“Blockchains可以分为三种类型,即公共链(由比特币和Ethereum),联盟链(由R3联盟,因为平台)和私人链。其中,世界面临的公共链是一个开放的平台。任何个人或组织可以自由访问和使用公共的服务链条,也可以自由退出(10]。作为底层链,公众链可以为特定企业开发分散的应用程序基于公众链。
公共链节点的贡献会得到回报与数字标记,和节点参与世界将共同维护公众链。公众链取得完整的分散,但它缺乏有效的监督和事务吞吐量相对较低。目前,它不能完全适应大业务量的商业应用。联盟链是由几个组织共同维护保持区块链,它主要用于区块链平台作为一个合作组织的新方法减少商业合作联盟成员的成本和提高经营效率11,12]。联盟链可以没有令牌机制,联盟成员提供的节点,每个块的一代共同确定预选的节点,其他节点可以参与验证和事务。联盟链将提供一个接口,甚至允许监督监督节点的设置来实现一种semidecentralization。私人链是一个区块链系统由一个个人或一个组织管理。它有所有区块链的读和写权限。的事务吞吐量比这更高的公共链。它通常用于交流和金融机构的内部业务。区块链的帮助下,平台提高了业务效率低成本的方式在组织内(13]。
智能合同的本质是一个集合的数据(状态)和代码(业务功能),它存储在一个特定的地址Ethereum区块链。它们可以由区块链上的事务,和这段代码可以从区块链来获得数据和读取写入数据(14]。Ethereum使用智能扩展合同区块链的功能来支持开发人员构建分散的应用程序。目前,有成千上万的分散的应用程序开发和部署基于Ethereum,和数以百计的分散的应用程序一直运行稳定Ethereum区块链网络(15]。
传统的集中式系统面临高成本等问题,经营效率低,不安全的数据存储。从区块链的性质,可以看出区块链可以提供良好的解决方案(16]。在区块链系统中,不需要一个可信第三方信用背书,和网络中的节点仍然可以进行正常的交易和业务操作的环境,不需要相互信任。数据不需要一个集中的服务器进行存储和管理,但获得的加密技术,分布式算法共识,等等,这样的数据不能被篡改,可以追溯17]。
2.2。双向谱聚类分析方法
随着科学技术的迅速发展,在当今世界,人类的发展已经产生了大量的数据。如何迅速和充分利用这些数据,找到有用的信息是一个主要的挑战[18,19]。数据挖掘是我的原始数据和分析大量的数据源获取有效的知识信息,使指导和决策。在正常情况下,数据挖掘的过程主要有以下步骤,如图2。
双向聚类算法是完全不同的从传统的聚类算法。传统的聚类算法只有单向聚类的行或列,而双向聚类算法同时考虑整个矩阵;同时,它对行和列执行聚类分析来检测矩阵的本地信息(20.]。然而,基于基因表达数据的双向聚类算法,一个基因或一个示例可以属于不同的“集群”在同一时间;当然,它也可以不存在任何“集群”;也就是说,它可以“集群”和“集群之间。“重叠部分如图3。行代表基因,列表示两个相邻的边缘的条件,也就是说,基因表达水平的基因的方向在两个相邻的条件下。
(一)
(b)
(c)
(d)
算法可以排除额外的行和列的双向聚类结果从而达到防护的目的包含的行和列在前面的双向聚类结果,这样通过不断迭代算法可以产生不同的结果。双向聚类分析在基因表达谱数据中起着重要的作用,主要表现在以下两个方面。在药物研究中,基于基因表达数据的双向聚类分析的结果可用于药物的研究机制,药物研发,药物疗效的判断,检测药物靶点发挥了伟大的作用。在疾病诊断、肿瘤异质性是当前面临的最大困难癌症诊断和治疗。然而,我们可以用基因芯片的双向数据聚类分析用于确定癌症亚型,从而发展个性化的治疗方法。它也可以用来检测新的肿瘤标志物早期诊断及相应的治疗。
大部分的双官能团分析算法目前基于犹太人或metaheuristic优化方法,因此这些算法需要一些质量评价指标计算的质量搜索和搜索的方向21]。事实上,biclustering的研究过程是一个过程,提出大量的biclustering指标。biclustering评价指标的质量直接决定了biclustering分析算法的效率和效益。
双向聚类,双向聚类集的最小平均均方确定残留,并保存为当代最优双向聚类集。否则,迭代终止,当代最佳双向聚类集输出结果。bicluster的均方残差B(我,J)被定义为
相关指数表示为
其中,指数的相关性吗jth bicluster和列所有元素的局部方差吗jth列bicluster B,但是是全球所有元素的差异jth列在整个基因表达数据。
对于一个bicluster的大小B(我,J),转换后获得一个矩阵吗米的大小和每个元素的定义如下:
其中, 和 。然后,相应的相似性N双集群中的任意两个基因的数目B(我,J)定义如下:
其中,当价值 的x是真的, 。基于biclustering公式B(我,J),最大数量相似的基因我定义如下:
任何bicluster的三个基因B(我,J)定义如下:
每个数据点都有邻居点。
这个变换应是可逆的,是映射结果也可以通过吗逆变换。
在那个时候, 和 。否则, 。
逆变换公式。在实际操作中,由于噪声的影响数据或不同的转换方法,有错误和 ,如下面所示:
在执行目标优化操作和 。具体公式如下: 在哪里错误的重量吗 。根据功能分解,B的最小加权均方值。S是相邻点的加权协方差矩阵。
自定义的数据是基于它分布符合的前提下,然后进行培训和分析根据假设的分布模型。因此,学习功能的分布数据根据能量模型可以解决上述问题。然后,
其中,是参数模型,可见层单元的偏见,隐层单元的偏见,是连接可见层和隐层之间的重量。联合概率分布,可以根据获得的能量函数如下: 在哪里代表了归一化因子联合概率的计算。似然函数是通过具体的计算,公式可以表示为
根据隐层单元的状态,获得可见层单元的公式反过来
算法的具体解决方案函数的散度算法,然后计算是使用对比翻译的最小均方值向量d:
当上面的公式转换,大小是相关的。样本点的重量反映关键是嘈杂的数据的可能性。如果误差很大,这意味着这一点可能是噪音;否则,关键是不太可能的噪音。以下功能之间的关系满足重量和错误:
计算成本函数。如果成本函数小于某个阈值或两个迭代期间成本函数的变化小于某个阈值时,算法停止,和成本函数是什么
更新会员矩阵U,然后返回到步骤:
会员矩阵输出的算法,算法实现过程不需要人工干预。为了避免可能的错误判断这个方法,基于余弦相似度的夹角的余弦值点和集群中心是用来权衡欧几里得距离。然后,
其中, , 代表样本的数量在集群的集群中心和代表所有采样点在集群的集群中心所在地。
2.3。数据融合
数据集成过程包括信息检索、数据处理、数据集成和结果分析(22]。由于数据的可变性,在多传感器数据融合的过程中,数据必须集成系统和数据集成是根据功能分为两个层次。全面数据与数据预览、位置识别和跟踪功能。高分辨率数据集成是重要趋势的分析和错误作为一个过程来获得整体集成结果(23]。数据融合中扮演一个重要的处理和协调作用multi-information来源、多平台和多用户系统,确保之间的连通性和及时通信单元的数据处理系统和收集中心。
我们使用图4说明数据级融合方法。数据级融合是基于每个传感器收集的原始数据直接进行分段融合;之前,执行数据编译和分析每个传感器收集的原始数据处理(24]。数据级融合可以保留有效信息尽可能多的原始数据,但它的缺点是,当传感器数据值太大,统计精度会有所改善,原始数据将不完全证实。
数据级融合的最大优势是原始信息丰富,因为加工对象是最原始的数据集,而无需任何预处理,信息的损失可以忽略不计,它可以提供大量的详细的原始信息,和融合结果的准确性高。缺点是需要处理的数据量非常大,和计算机容量和性能要求很高。与此同时,整个融合过程需要很长时间,这将直接影响系统的实时性能;原始数据由外部数据,很容易干扰和系统应该具有良好的容错。常用的方法包括加权平均算法,小波变换等算法(25]。
为了解决数据融合的缺点,本文旨在检测数据集的模糊性的特点,运用模糊逻辑的方法来识别和检测数据集进行分类。模糊集合理论本质上是一种多值逻辑。在融合的过程中,许多在0和1之间设置为每个数据表达的信誉在融合过程中,然后使用多值。逻辑推理方法合并数据,实现数据融合(26,27]。
3所示。数据融合实验和结果
3.1。医疗卫生行业的经济地位
网站上进行数据分析,中国医疗机构和医疗中心专注于咨询的数据。在中国的东部,北京的医疗中心,海南、天津和上海高于1;河北和山东近3。今年集聚的力量大于1。聚集索引的江苏、浙江、福建、广东低于1,如图5。
可以看出四个东部城市北京、天津、上海和海南人口密集和发达,刺激无限对医疗服务的需求,他们从需求的角度相对集聚优势。从供给的角度来看,在每个医疗机构卫生人员的平均数量在上面的三个城市在东部地区高于平均水平,而在这四个省份,包括江苏、低于东部地区的整体水平。的四个省,江苏、浙江、福建、广东东部沿海地区,人口基数大是关键因素的形成集聚水平低于其他东部地区的水平。
统计结果的平均人员医疗机构在东部地区如表所示1。
通过西部地区医疗行业的统计数据,研究结果发现,医疗服务行业的浓度在宁夏、内蒙古和新疆西部地区都高于1。青海、陕西上面基本上都是1。集聚水平低于1,仅一年超过1年;集聚水平广西、重庆、四川、贵州、云南和甘肃都小于1。结果如图6。
可以看出,在每个医疗机构卫生人员的平均水平在宁夏,内蒙古,新疆是高于西部平均水平。水平在每个医疗机构卫生人员在广西、重庆、四川、贵州、云南和甘肃几乎小于或接近西部平均水平,如表所示2。
研究发现,医疗服务行业的浓度水平的四个省,安徽、江西、河南、湖南低于1;浓度水平五个省的湖北、山西、辽宁、吉林、黑龙江都高于1。的平均数量在每个医疗机构卫生人员不能反映该地区的医疗服务行业的浓度从供给的角度来看。研究的结果在图所示7。
中部地区,有效分析的不平等性和地方卫生支出,该地区支出相对一致,满足当地居民的需求,充分整合纳入政府的卫生支出。在中国不同省份之间存在显著的差异。中部地区的平均排名是9。与东部和西部地区相比,整体评估当地的卫生支出在中部地区。每个机构在中央区域的平均人员如表所示3。
平均每个医疗机构的卫生工作人员在我国中部地区略低于东部地区但高于西部地区。的值安徽、湖北、吉林和黑龙江都高于平均水平。河南近年来往往低于平均水平;江西、湖南、山西、辽宁都低于平均水平。与医疗服务的水平,产业集聚。原因是医疗机构的数量在山西和辽宁高于在吉林和黑龙江。
我们统计营利性医疗机构和非营利医疗机构的数量在不同的地区,结果如表所示4。
从上面的表中,非营利组织的数量在东部地区自2015年以来逐年增加,和营利组织的数量已经基本稳定,除了几年;中部地区非营利组织的数量逐年增加,和盈利性组织已经基本稳定,而在西部地区,非营利组织有逐年增加,经营性组织一直保持稳定。
3.2。数据融合的变化
我们统计医疗卫生行业的支出占GDP的比例和结构,结果如图所示8。
的整体发展趋势可以看出,我国的医学和健康是一个政府主导的转变成为一种共享的政府,社会,和个人。政府支出是逐渐下降的,个人和社会支出逐年增加,最终达到一个平衡。
我们做了统计数据的变化下的医疗卫生行业区块链技术和双向谱聚类分析方法,结果如图所示9。
我们可以看到从图9,区块链技术和双向变化后的光谱分析系统,医疗和医疗行业已经大大提高。其中,制药行业的结果增加了约10%,成本下降,人口的增加和减少卧床休息时间导致的显著改善医疗和医疗行业。我们使用例子来统计不同的变量和分析融合的结果。结果如图所示10。
4所示。讨论
4.1。算法的讨论
作为一种新型的数据挖掘领域的技术手段,双向聚类算法成功地克服了传统聚类算法的缺点。它可以集群基因方向和条件方向在同一时间。同时保留全球信息,基因表达矩阵的本地信息仍然可以开采。
传统的聚类分析算法和数据流聚类分析算法进行了研究和分析,以及基于网格密度的数据流聚类分析算法主要是讨论,进行了分析和总结,提出了改进的想法。结合基于网格密度的数据流聚类分析算法处理速度快和强大的实时特征,DSG-stream算法在集群边界处理和不足的问题的统一部门单模网格。网格划分为不同的厚度和粒度。边界网格和内部网格的概念,介绍了网格和影响因素相结合进行聚类处理。该算法是基于一个两级处理框架:在线阶段维护网格特征向量和动态处理微簇内部网格的形式,和边界网格细粒度聚类在离线阶段获得的聚类结果。
集群算法,网格和密度阈值动态调整,这反映了实时变化的数据和检测和过程孤立电网,它提高了算法的效率,提出了一种局部算法基于分布式环境。node-global节点处理模型进一步提高了算法的处理速度。实验和对比验证算法的聚类精度和操作效率,以及算法的处理效率在一个分布式环境。
4.2。制药行业
持续的医疗体制改革和医疗服务市场的不断扩大,私人医疗公司的影响我国医疗服务市场上盈利首先改变了我国通用医疗公司的行为。在盈利的地区医院相对密集,非营利性医院会受到医院的营利性医疗行为的影响,并改变市场价值和我国医疗服务产品的服务质量。
我国的医学,尤其是在传统医学领域,有多个设施等主要问题,规模小,很难控制设备、信息不对称、低效率、高成本、和混乱。很长一段时间,制药公司没有自己的基金会,和现代医学统计也不例外的成本降低和效率提高制药行业。社会医学的整合的一体化物流和现代医学和医学运动系统的主要任务是降低医药产业的复杂性。
在实现的过程中,过去的情况是主要的医院不愿被信任,银行由于其财务实力薄弱,而大医院强大的财务实力,不需要信任银行。现在要求所有基层医院和社区医院实现“收入和支出两条线”,也就是说,所有医院支出包含在财务预算管理和所有的收入都交给特殊金融账户。
5。结论
本文认为之间的差异程度,双向集群和集群之间的融合程度,认为集群由双向聚类的最优数量比其他算法。我们比较二维聚类算法的准确性。高密度基因数据的双向聚类算法可以更好地提取当地信息,同时保留所有的信息。可以看出双向聚类算法比其他聚类算法。当然,也有一些问题在本文的研究。与集群整体算法相比,biclustering合奏重建bicluster算法具有一个额外的步骤,通常,启发式算法容易陷入局部最优性是用来解决这个问题。然而,目前没有相关文献如何重建biclustering获得全局最优,它仍然处于空白状态的研究,指出一个明确的下一步的研究方向。如何获取有用的信息从这些数据和解决一些新的问题是当前研究的重点在大数据的行业。因此,基因表达数据的相关研究观点biclustering分析扩展到其他数据,开辟了一个新的方向,下一步的研究发现或解决新问题。
数据可用性
没有数据被用来支持本研究。
的利益冲突
本文作者认为没有利益冲突。
确认
这项工作是支持的理论创新项目的贵州社会科学联合会(没有。gzlclh - 2021 - 179)和贵州医科大学科学研究基金(没有。YJ2020-BK068)。