基于伪F统计量的模糊聚类方法在基因表达数据分析中的应用
http://www.100md.com
易东;张彦琦;王文昌;张蔚;杨梦苏;黄明辉;方志俊
基因表达|模糊聚类法|伪F-统计,关键词:
参见附件(131kb)。
易东;张彦琦;王文昌;张蔚;杨梦苏;黄明辉;方志俊 香港城市大学基因组科技应用研究中心;第三军医大学卫生统计学教研室 中国卫生统计 2002 3
关键词:基因表达;模糊聚类法;伪F-统计
目的 通过对基因芯片数据的分析 ,提出一种基因表达的分类方法。方法 首先 ,应用FCM模糊聚类法(FuzzyClusteringMethod)进行聚类 ,然后我们应用PFS(PseudoF statistics)统计量作为一个判别函数来确定最佳类数目。结果 将本方法应用于模拟数据、人类纤维原细胞血清基因表达数据上 ,其结果明显好于K 均值法。结论 本方法基于没有聚类数据的任何先验知识和组成成分信息的前提下 ,考虑如何确定数据的分类结构。根据实际结果发现 ,该方法是揭示基因表达变化内在模式的有力工具 .
关键词:基因表达;模糊聚类法;伪F-统计
目的 通过对基因芯片数据的分析 ,提出一种基因表达的分类方法。方法 首先 ,应用FCM模糊聚类法(FuzzyClusteringMethod)进行聚类 ,然后我们应用PFS(PseudoF statistics)统计量作为一个判别函数来确定最佳类数目。结果 将本方法应用于模拟数据、人类纤维原细胞血清基因表达数据上 ,其结果明显好于K 均值法。结论 本方法基于没有聚类数据的任何先验知识和组成成分信息的前提下 ,考虑如何确定数据的分类结构。根据实际结果发现 ,该方法是揭示基因表达变化内在模式的有力工具 .
您现在查看是摘要介绍页,详见CAJ附件(131kb)。