当前位置: 首页 > 期刊 > 《生命科学研究》 > 2007年第3期
编号:11608534
一种基于类均值的肿瘤基因芯片数据的标准化方法(1)
http://www.100md.com 2007年9月1日 《生命科学研究》 2007年第3期
一种基于类均值的肿瘤基因芯片数据的标准化方法
一种基于类均值的肿瘤基因芯片数据的标准化方法
一种基于类均值的肿瘤基因芯片数据的标准化方法
一种基于类均值的肿瘤基因芯片数据的标准化方法

     摘 要:分析了当前常用的标准化方法在肿瘤基因芯片中引起错误分类的原因,提出了一种基于类均值的标准化方法,该方法对基因表达谱进行双向标准化,并将标准化过程与聚类过程相互缠绕,利用聚类结果来修正参照表达水平,选取了5组肿瘤基因芯片数据,用层次聚类和K-均值聚类算法在不同的方差水平上分别对常用的标准化和基于类均值的标准化处理后的基因表达数据进行聚类分析比较,实验结果表明,基于类均值的标准化方法能有效提高肿瘤基因表达谱聚类结果的质量。

    关键词:肿瘤基因芯片;聚类分析;标准化;中心化;相关系数

    中图分类号:Q332 文献标识码:A 文章编号:1007-7847(2007)03-0206-06

    肿瘤基因芯片分析是当前研究的一个热点,主要研究技术之一就是聚类分析,其目标是用某种相似性度量准则(如Pearson相关系数等)将样本或基因组织成有意义的组,对基因聚类,有助于对基因功能、基因调控及细胞过程等进行综合研究:对样本聚类,可以确定和发现新的肿瘤类型,从而对相应的诊断、治疗和预防有很大帮助,有多种聚类算法已被成功地用于基因表达谱的聚类分析,如层次聚类(hierarchical clustering),K-均值聚类(K-means clustering)等。

    然而,基因芯片实验中的误差来源很多 ......
1 2下一页

您现在查看是摘要页,全文长 5019 字符