医学论文中统计设计的聚类分析(2)
第1页 |
参见附件(1680KB,3页)。
聚类树状图结果(见Fig.1)。从直观上看,将这9个统计设计方案分为3类是比较合适的,这时类间平均距离不小于2.2164。总体变异的75.9%被类成分所解释。从树状图中还可以直接得到分类的结果,这就是:第Ⅰ类包含1、4、2三个样本,即重复测量设计、拉丁方设计、序贯设计;第Ⅱ类包含3、5、6、8四个样本,即交叉设计、析因设计、正交设计、配对设计;第Ⅲ类包含7、9两个样本,即成组设计、随机区组设计。
4.2三年的统计设计方案的使用情况及在3类中构成比的比较结果
657篇论文中,2000年、2001年和2002年的文章各占293篇、183篇、181篇。2000年、2001年和2002年在3类中的构成比比较差别显著(χ2=44.0895,p=0.0000),说明3年在3类中的总体分布是不同的(见Table 11),进一步两两比较的校正α′=0.0125,经χ2检验,2000年与2001年的构成比比较差异无显著性(χ2=3.0721,p=0.2154);2000年与2002年比较差异有显著性(χ2=41.8902,p=0.0000);2001年与2002年比较差异有显著性(χ2=18.2208,p=0.0000)。对每一类中年的两两比较,其检验水准用校正α′=0.0125。2000年与2002年相比,Ⅰ类和Ⅱ类的构成比差别显著(p<0.0125),Ⅲ类差别不显著(p>0.0125)。2001年与2002年相比,Ⅰ类和Ⅱ类的构成比差别显著(p<0.0125),Ⅲ类差别不显著(p>0.0125)。其中,2002年在第Ⅰ类的有46篇,占25.41%,2000年和2001年在第Ⅰ类中的各为7.51%、11.42%,所以2002年医学论文的使用情况要好于2000年和2001年,说明医学论文在这三年中的使用质量是有所提高的。
第Ⅰ类,即析因设计、正交设计和交叉设计存在的问题较少,但不明确的论文占的比例最高,为30.30%,所以这三种设计方案应在以后的论文发表中将设计类型的名称标明。配对统计设计、拉丁方统计设计、重复测量统计设计存在的问题应用正确的程度较高,但不明确的比例也相对较高,应注意这方面的问题,成组统计设计和随机区组设计的应用情况最差,出现的问题也最多,无的占11.55%,不正确的占17.94%,不明确的占20.35%,在三类中占的比例较高,应该引起有关人员的注意。统计设计方案的使用情况不同,较好的为第Ⅰ类和第Ⅱ类,最差的为第Ⅲ类,但三类文章中均存在一定的问题。所以重视并加强科研人员的统计学培训是一个任重而道远的过程,提醒有关人员引起足够的重视。
我国医药卫生期刊论著中统计学误用率高达80%左右,其根源在于论文作者统计学水平低、期刊编辑部把关不严和期刊管理部门严重失职。发表论文只是科研工作的一种表现形式,关键是与论文相对应的科研工作本身是否具有很高的科学性。然而,很多科研工作者从一开始就忽视统计学的指导作用,始终抱着单因素设计的思想去研究多因素多指标并带有随机性的课题,在这样的基础上撰写出来的论文,出错似乎已是必然。
参考文献
[1]金丕焕,主编.医用统计方法.上海医科大学出版社,1993,1:144
[2]胡良平,刘惠刚.神经科研究中设计类型的辨析方法.
中华神经科杂志,2002,35(1):58~59
[3]秦小琪,孙可淳.临床医学统计设计应注意的问题 ......
您现在查看是摘要介绍页,详见PDF附件(1680KB,3页)。