文摘

基因表达数据集是庞大而复杂,有许多变量和未知的内部结构。我们应用独立分量分析(ICA)获得的更少的冗余表示表达数据。用最小的统计依赖和分解产生组件显示生物相关的信息。因此,转换后的数据,我们应用聚类分析(获得一个初始的一个重要和流行的分析工具对数据的理解,通常用于类发现)。提出了自组织映射(SOM)的聚类算法自动确定的“天然”子组数据,辅助完成这项任务的可用基因的功能类别的先验知识。一个熵判据可以分配给多个类,每个基因更接近生物表示。这些特性,然而,不为代价实现的简单的算法,由于生长在一个简单的映射网格结构和学习算法仍是等于Kohonen。