浅析临床科研论著中对照缺陷问题
作者:毛宗福 丁元林 孔丹莉
单位:湖北医科大学基础医学院(430071)
关键词:
中国卫生统计990126 选择合适的对照组是临床科研设计的核心问题之一,也是研究结果真实性与可靠性的重要保证。Willianson〔1〕调查发现,70年代前,根本无对照或对照不适合的比例高达71%,70年代占60%,80年代后,国外Avram〔2〕调查表明,应该设立对照而未设立对照或对照不恰当的比例为18%,但国内调查结果表明,80年代中期和90年代中期,对照不合适的比例均接近一半。鉴于此,摘选一些典型实例,对几种常见的对照缺陷问题进行评析,旨在引起广大医学工作者的重视,提高临床科研质量。
实例分析
例1.卵巢癌患者血清及腹水中可溶性白细胞介素的受体水平测定.中华妇产科杂志,1994;29(8):478。
, 百拇医药
实验与对照方案:卵巢癌患者血清及腹水SIL-IR与正常人血清SIL-IR比较,实验结果见表1。
表1 卵巢癌患者血清及腹水中SIL-IR水平(±s) 组别
例数±s(kv/L)
P
正常组血清
35
235±90
患者组血清
31
, 百拇医药
857±428
<0.05
患者组腹水
14
871±315
<0.01
评析:合适对照的前提条件是对照组与实验组应有比较的基础,即具有同质性,本例选择正常人血清SIL-IR与患者血清SIL-IR行差异性比较是恰当的,但同时与患者腹水中SIL-IR进行比较则不合适,缺乏比较的基础。
例2.婴幼儿支气管肺炎合并心力衰竭的血流动力学改变及治疗研究.中华儿科杂志,1994;32(6):344
研究目的:本例通过治疗前后心脏血流参数的改变探讨婴幼儿支气管肺炎合并心力衰竭合适的治疗方案。
, 百拇医药
评析:临床试验研究中,有时设置一个对照组就能说明问题,但有时设置两个对照组都不一定能说明问题,究竟设置几个对照组较为合适,应视研究目的而定。本例将患者分为酚妥拉明组和地高辛组。地高辛组20例,其中14例为用酚妥拉明治疗后心衰好转又复发的病例,另6例为不适宜用酚妥拉明治疗,而直接用地高辛治疗。研究者根据两组治疗前后心脏血流参数的改变,作统计分析发现地高辛组优于酚妥拉明组,于是认为:“可先用酚妥拉明,随之开始用地高辛治疗,可取得满意疗效。”显然该设计方案难以支持此观点,达不到研究目的,其原因是对照不充分。建议适当增加病例数,随机分为三组,一组用酚妥拉明治疗,另一组用地高辛治疗,第三组先用酚妥拉明,后用地高辛治疗。
例3.不同剂量米非司酮和米索前列腺醇终止早孕的临床研究.中华妇产科杂志,1994;79(12):735。
研究目的:探讨不同剂量米非司酮和米索前列腺醇配合使用对终止早孕的临床疗效。
, http://www.100md.com
实验与对照方案:600例停经49天要求终止妊娠的早孕妇女,根据治疗开始时间,按预先编制的2∶1∶1随机表,分为3个治疗组。组Ⅰ:301例,米非司酮总剂量150mg,每片25mg,首剂80mg,以后每12h口服25mg,共口服4次。第三天晨一次口服米索前列腺醇600μg;组Ⅱ:150例米非司酮剂量与服法同组Ⅰ,第三天晨阴道应用卡孕栓1mg;组Ⅲ:149例,单次口服米非司酮200mg,第三天晨一次口服米索前列腺醇600μg。
评析:多余对照不仅会造成人力、物力和财力的浪费,同时会导致试验结果解释困难。本例组Ⅱ中使用的米非司酮剂量与组Ⅰ的相同,体现不出米非司酮的“不同剂量”,而且不是与米索前列腺醇而是与卡孕栓配合使用,属多余对照。
例4.系统性红斑狼疮患者淋巴细胞粘附分子表达的观察.中华内科杂志,1995;34(8):545。
实验与对照方案:SIE患者35例,男3例,女32例,年龄17~52岁,平均32.4岁。其中活动型21例,稳定型14例,正常对照组30例,男16例,女14例,年龄19~54岁,平均34.8岁,均为健康医务人员及学生。
, 百拇医药
评析:在临床试验研究中,性别往往是影响试验结果的非处理因素之一,因此要求对照组与实验组的性别分布均衡。本例两组性别分布不均衡,(χ2=20.5,P<0.01),而且医务人员及学生是一个非常特殊的人群,作为正常对照组,代表性偏倚难以避免。
例5.胰岛细胞抗体ABC法检测及临床意义初步探讨.中华内科杂志,1994;33(2):92。
实例与对照方案:IDDM组17例,男10例,女7例,年龄15~28岁,NIDDM组20例,男9例,女11例,年龄44~65岁,非糖尿病组20例,男11例,女9例,年龄5~61岁。
评析:就大多疾病而言,年龄是影响试验结果的因素之一。本例实验组(IDDM)对象是青少年,对照组(NIDDM组)为中老年,组间年龄因素显然不可比。
例6.几种常用方法治疗Graves病的预后探讨。中华内科杂志,1995;34(1):38。
, 百拇医药
实验与对照方案:本例将224例Graves病人分成三组,分别用三种常用方法进行治疗,分组详细情况见表2。表2 三组病人的性别、年龄、病情及突眼情况 分组
例数
性别
年龄(岁)
病情
突眼
男
女
轻
重
无
轻
, 百拇医药
重
A组
82
25
57
7~65(38.9±11.7)
50
32
70
10
2
B组
100
, 百拇医药
24
76
27~65(43±9.3)
15
85
4
90
6
C组
42
12
30
15~61(33±10.8)
, http://www.100md.com
2
40
15
18
9
评析:临床试验研究中,组间除了性别、年龄因素外,病情及其他主要非处理因素亦应均衡可比,本例相互对照的三组中,性别(χ2=1.0,P>0.05)和病情(χ2=1.0,P>0.05)因素均衡,但年龄(F=13.7,P<0.01)及突眼(χ2=145.8,P<0.01)因素不均衡,可比性差。小结与讨论
对照组是否合适,上升到哲学高度归根结底是一个知识逻辑和推理逻辑是否正确的问题。现代临床流行病学要求:(1)设置的对照组与实验组必须具有同质可比性。“风马牛不相及”的东西进行比较是没有意义的;(2)设置的对照组必须与研究目的相符。“对照不足”和“多余对照”不仅对文章的观点或结论不能给予有力的支持,有时还会导致试验结果解释困难;(3)对照组本身必须具有代表性。对照组代表性差,就好象“尺子”的刻度不准确一样,作为比较的标准,会使试验结果发生偏倚。
, http://www.100md.com
另外,对照组与实验组主要非处理因素均衡可比,也是对照组设置是否合适的一个重要方面。近年来,国外临床医学工作者对此非常重视,Altman〔4〕对80篇临床试验论著调查表明,91%的论著对其组间主要非处理因素均衡性问题进行了讨论,其中50%的论著讨论的非处理因素数量超过9个,58%的论著进一步对主要的非处理因素进行了均衡性检验。我们对中华系列三种主要医学杂志1994年~1995年刊载的67篇临床论著调查表明,正常对照组中的正常人来源、年龄、性别、排除与纳入标准描述完整的仅占26%。仅考察年龄、性别两个因素发现,约一半的论著组间均衡性较差。笔者认为,临床试验研究中,除了结合研究目的考察可能会影响试验结果的一些主要非处理因素组间均衡性外,年龄、性别、病情三个最基本的非处理因素组间均衡性问题不能忽视,均衡性差的应进一步考虑采用调整的分析方法或多因素统计分析。
目前,国内探讨对照缺陷问题的文献并不多,特别是系统深入的研究更为少见。愿本文能起到抛砖引玉的作用,激起广大医务工作者对对照缺陷问题的重视和深入研究。评析偏颇之处,恳请专家们指教。
, 百拇医药
参考文献
1.Willianson Jw,Goldschmidt PG,Colton T.The quality of medical literature:An analysis of validation assessments.See in :Medical uses of statistics.Bailar JC,Mosteller F.Massachusetts.Medical Society.1986
2.Avram MJ,Shands CA,Dydes M,et al.Statistical methods in anesthesia articles:an evalution of two American jouranls during twosix-month periods.Anesth.Anglg 1985;64:607
3.Gore SM,Jones G,Thompson SG,The Lancent's statistical review process:areas for improvement by authors.Lancet.1992;340:100.
4.Altman DG,Dore CJ.Randomisation and baseline comparissos in clinical trials.Lancet 1990;335:149.
5.毛宗福,罗毅平,叶金华.我国临床治疗论著中试验设计应用状况.中国卫生质量管理,1998;(6):42, http://www.100md.com
单位:湖北医科大学基础医学院(430071)
关键词:
中国卫生统计990126 选择合适的对照组是临床科研设计的核心问题之一,也是研究结果真实性与可靠性的重要保证。Willianson〔1〕调查发现,70年代前,根本无对照或对照不适合的比例高达71%,70年代占60%,80年代后,国外Avram〔2〕调查表明,应该设立对照而未设立对照或对照不恰当的比例为18%,但国内调查结果表明,80年代中期和90年代中期,对照不合适的比例均接近一半。鉴于此,摘选一些典型实例,对几种常见的对照缺陷问题进行评析,旨在引起广大医学工作者的重视,提高临床科研质量。
实例分析
例1.卵巢癌患者血清及腹水中可溶性白细胞介素的受体水平测定.中华妇产科杂志,1994;29(8):478。
, 百拇医药
实验与对照方案:卵巢癌患者血清及腹水SIL-IR与正常人血清SIL-IR比较,实验结果见表1。
表1 卵巢癌患者血清及腹水中SIL-IR水平(±s) 组别
例数±s(kv/L)
P
正常组血清
35
235±90
患者组血清
31
, 百拇医药
857±428
<0.05
患者组腹水
14
871±315
<0.01
评析:合适对照的前提条件是对照组与实验组应有比较的基础,即具有同质性,本例选择正常人血清SIL-IR与患者血清SIL-IR行差异性比较是恰当的,但同时与患者腹水中SIL-IR进行比较则不合适,缺乏比较的基础。
例2.婴幼儿支气管肺炎合并心力衰竭的血流动力学改变及治疗研究.中华儿科杂志,1994;32(6):344
研究目的:本例通过治疗前后心脏血流参数的改变探讨婴幼儿支气管肺炎合并心力衰竭合适的治疗方案。
, 百拇医药
评析:临床试验研究中,有时设置一个对照组就能说明问题,但有时设置两个对照组都不一定能说明问题,究竟设置几个对照组较为合适,应视研究目的而定。本例将患者分为酚妥拉明组和地高辛组。地高辛组20例,其中14例为用酚妥拉明治疗后心衰好转又复发的病例,另6例为不适宜用酚妥拉明治疗,而直接用地高辛治疗。研究者根据两组治疗前后心脏血流参数的改变,作统计分析发现地高辛组优于酚妥拉明组,于是认为:“可先用酚妥拉明,随之开始用地高辛治疗,可取得满意疗效。”显然该设计方案难以支持此观点,达不到研究目的,其原因是对照不充分。建议适当增加病例数,随机分为三组,一组用酚妥拉明治疗,另一组用地高辛治疗,第三组先用酚妥拉明,后用地高辛治疗。
例3.不同剂量米非司酮和米索前列腺醇终止早孕的临床研究.中华妇产科杂志,1994;79(12):735。
研究目的:探讨不同剂量米非司酮和米索前列腺醇配合使用对终止早孕的临床疗效。
, http://www.100md.com
实验与对照方案:600例停经49天要求终止妊娠的早孕妇女,根据治疗开始时间,按预先编制的2∶1∶1随机表,分为3个治疗组。组Ⅰ:301例,米非司酮总剂量150mg,每片25mg,首剂80mg,以后每12h口服25mg,共口服4次。第三天晨一次口服米索前列腺醇600μg;组Ⅱ:150例米非司酮剂量与服法同组Ⅰ,第三天晨阴道应用卡孕栓1mg;组Ⅲ:149例,单次口服米非司酮200mg,第三天晨一次口服米索前列腺醇600μg。
评析:多余对照不仅会造成人力、物力和财力的浪费,同时会导致试验结果解释困难。本例组Ⅱ中使用的米非司酮剂量与组Ⅰ的相同,体现不出米非司酮的“不同剂量”,而且不是与米索前列腺醇而是与卡孕栓配合使用,属多余对照。
例4.系统性红斑狼疮患者淋巴细胞粘附分子表达的观察.中华内科杂志,1995;34(8):545。
实验与对照方案:SIE患者35例,男3例,女32例,年龄17~52岁,平均32.4岁。其中活动型21例,稳定型14例,正常对照组30例,男16例,女14例,年龄19~54岁,平均34.8岁,均为健康医务人员及学生。
, 百拇医药
评析:在临床试验研究中,性别往往是影响试验结果的非处理因素之一,因此要求对照组与实验组的性别分布均衡。本例两组性别分布不均衡,(χ2=20.5,P<0.01),而且医务人员及学生是一个非常特殊的人群,作为正常对照组,代表性偏倚难以避免。
例5.胰岛细胞抗体ABC法检测及临床意义初步探讨.中华内科杂志,1994;33(2):92。
实例与对照方案:IDDM组17例,男10例,女7例,年龄15~28岁,NIDDM组20例,男9例,女11例,年龄44~65岁,非糖尿病组20例,男11例,女9例,年龄5~61岁。
评析:就大多疾病而言,年龄是影响试验结果的因素之一。本例实验组(IDDM)对象是青少年,对照组(NIDDM组)为中老年,组间年龄因素显然不可比。
例6.几种常用方法治疗Graves病的预后探讨。中华内科杂志,1995;34(1):38。
, 百拇医药
实验与对照方案:本例将224例Graves病人分成三组,分别用三种常用方法进行治疗,分组详细情况见表2。表2 三组病人的性别、年龄、病情及突眼情况 分组
例数
性别
年龄(岁)
病情
突眼
男
女
轻
重
无
轻
, 百拇医药
重
A组
82
25
57
7~65(38.9±11.7)
50
32
70
10
2
B组
100
, 百拇医药
24
76
27~65(43±9.3)
15
85
4
90
6
C组
42
12
30
15~61(33±10.8)
, http://www.100md.com
2
40
15
18
9
评析:临床试验研究中,组间除了性别、年龄因素外,病情及其他主要非处理因素亦应均衡可比,本例相互对照的三组中,性别(χ2=1.0,P>0.05)和病情(χ2=1.0,P>0.05)因素均衡,但年龄(F=13.7,P<0.01)及突眼(χ2=145.8,P<0.01)因素不均衡,可比性差。小结与讨论
对照组是否合适,上升到哲学高度归根结底是一个知识逻辑和推理逻辑是否正确的问题。现代临床流行病学要求:(1)设置的对照组与实验组必须具有同质可比性。“风马牛不相及”的东西进行比较是没有意义的;(2)设置的对照组必须与研究目的相符。“对照不足”和“多余对照”不仅对文章的观点或结论不能给予有力的支持,有时还会导致试验结果解释困难;(3)对照组本身必须具有代表性。对照组代表性差,就好象“尺子”的刻度不准确一样,作为比较的标准,会使试验结果发生偏倚。
, http://www.100md.com
另外,对照组与实验组主要非处理因素均衡可比,也是对照组设置是否合适的一个重要方面。近年来,国外临床医学工作者对此非常重视,Altman〔4〕对80篇临床试验论著调查表明,91%的论著对其组间主要非处理因素均衡性问题进行了讨论,其中50%的论著讨论的非处理因素数量超过9个,58%的论著进一步对主要的非处理因素进行了均衡性检验。我们对中华系列三种主要医学杂志1994年~1995年刊载的67篇临床论著调查表明,正常对照组中的正常人来源、年龄、性别、排除与纳入标准描述完整的仅占26%。仅考察年龄、性别两个因素发现,约一半的论著组间均衡性较差。笔者认为,临床试验研究中,除了结合研究目的考察可能会影响试验结果的一些主要非处理因素组间均衡性外,年龄、性别、病情三个最基本的非处理因素组间均衡性问题不能忽视,均衡性差的应进一步考虑采用调整的分析方法或多因素统计分析。
目前,国内探讨对照缺陷问题的文献并不多,特别是系统深入的研究更为少见。愿本文能起到抛砖引玉的作用,激起广大医务工作者对对照缺陷问题的重视和深入研究。评析偏颇之处,恳请专家们指教。
, 百拇医药
参考文献
1.Willianson Jw,Goldschmidt PG,Colton T.The quality of medical literature:An analysis of validation assessments.See in :Medical uses of statistics.Bailar JC,Mosteller F.Massachusetts.Medical Society.1986
2.Avram MJ,Shands CA,Dydes M,et al.Statistical methods in anesthesia articles:an evalution of two American jouranls during twosix-month periods.Anesth.Anglg 1985;64:607
3.Gore SM,Jones G,Thompson SG,The Lancent's statistical review process:areas for improvement by authors.Lancet.1992;340:100.
4.Altman DG,Dore CJ.Randomisation and baseline comparissos in clinical trials.Lancet 1990;335:149.
5.毛宗福,罗毅平,叶金华.我国临床治疗论著中试验设计应用状况.中国卫生质量管理,1998;(6):42, http://www.100md.com