当前位置: 首页 > 期刊 > 《医学信息》 > 2019年第7期
编号:13391400
基于聚类分析对慢性肺部疾病表型的研究进展(2)
http://www.100md.com 2019年2月19日 《医学信息》 2019年第7期
     1.2聚类分析 聚类分析是根据“物以类聚”的原理对样品或指标进行分类的一种多元统计方法,是对大量的样品或数据进行探究,并按各自特性进行合理分类,是一种探索性研究。聚类分析包括多种算法,目前大致分为以下几类:层次聚类法、划分聚类法、基于密度法、基于网络法及基于模型法[12]。聚类算法对聚类结果影响较大,算法的选择需要根据数据的类型、聚类的目的和应用来决定[13]。慢性肺部疾病研究中最常用的聚类方法主要有层次聚类法[14]和划分聚类法,其中K-means法是最常用的划分聚类法之一[15]。同样,聚类指标的选择是聚类分析的重点和难点,主要是因为在最开始分析时无法确定所选变量与表型分类是否相关,而且变量并非越多越好,无关变量的存在可能会影响发现真实分类,有候甚至会引起严重的错分,所以研究者在聚类分析之前,应尽量从专业的角度删去对分类不起作用的变量。此外,还可以借助单因素方差分析和主成分分析,在聚类分析前对数据进行降维处理,进行变量筛选。

    慢性肺部疾病表型的聚类分析策略包括以下步骤:首先明确研究目的;其次根据目的收集所需要的临床数据;然后再选择合适的聚类分析方法进行统计分析,获得候选表型;最后结合实际结果,利用专业知识对聚类的结果进行解读,获得最终的疾病表型特征。由于每种聚类方法各有优缺点 ......
上一页1 2 3 4 5 6下一页

您现在查看是摘要页,全文长 4921 字符