重视科研设计 提高临床科研质量
作者:王 家 良
单位:610041 成都,华西医科大学第一附属医院临床流行病学资源与培训中心
关键词:
中华医学杂志990201 有了很好的临床科研课题,即使获得了国家重点课题的资助,如果没有科学的研究设计,很难达到预期的理想目的,甚者,可能造成人力、物力和财力,特别是宝贵时间的浪费。据抽样调查1985年和1995年两个年度5种中华医学会系列杂志发表的112篇有关诊断性试验的论著的结果显示,90.0%以上的论文科研设计不合理。其中16.0%缺乏金标准评价;35.7%的文献仅有阳性率的报道,而无敏感性、特异性等基本的诊断性指标,更未涉及似然比及受试者工作特征曲线(ROC)等分析与评价。在治疗性研究方面,抽样调查1985~1996年35种中华医学会系列杂志发表的随机对照试验(RCT)研究论著,共计164篇,其中交待随机分组方法者仅为15.2%;交待了随机分组方法,但有错误者为5.5%;竟有79.3%的文献提到研究的本身为随机对照试验,但根本未见关于随机分组方法与方式的叙述。至于报道的分层随机对照试验则矛盾更多。此外,据近期有关国家重点临床科研课题的不完全评价与分析,科研设计的缺陷率亦达30%左右。这些问题的存在,十分严重地阻碍着我国临床医学研究水平的提高,对临床医学的进步亦有重要的负性影响。
, http://www.100md.com
中华医学会临床流行病学学会、中国临床流行病学协作网和中华医学杂志编辑委员会于1998年7月联合召开了全国临床科研设计专题研讨会。会议研讨分析了当前我国临床医学科研设计中存在的问题,提出了改进的对策(详见本刊本期第89页全国临床科研设计专题研讨会纪要)。会议呼吁广大临床医学工作者要进一步重视临床医学研究的科研设计,以提高临床医学研究质量,使有价值的研究课题获得预期的成果,实现临床医学的现代化和科学化,更好地为人民的健康服务。现就诊断性试验和治疗性研究设计中的某些问题进行简要评述。
一、 诊断性试验设计
任何拟研究的新的临床诊断性试验,务必要具备公认的标准诊断方法作为试验研究的“金标准”(gold standard)。用这种金标准诊断阳性者为病例组;阴性者为对照组。健康人群不应作为临床诊断性试验的对照。两组对象的例数要根据试验的假设水平,计算两组研究对象的最低需要的样本量;新的诊断试验要同步地施检于两组对象;这样两组对象将会获得真阳性与假阳性、真阴性与假阴性的受试者例数的结果。于是就可以按公式计算新试验的敏感性(sensitivity)、特异性(specificity)、患病率(prevalence)、准确性(validity)、预测值(predictive value)及似然比(likelihood ratio)等指标,而不仅仅限于某些论著报道的阳性率及阴性率。如果涉及到对同一种疾病同步应用多种诊断试验,进行比较研究以筛选最佳诊断试验者,则可同时将各自试验的连续变量,分别设定不同的临界值(cut off point),计算出一系列的敏感性和特异性指标,绘制出ROC工作曲线,分别计算各个试验的ROC曲线下的面积(AUCROC),作各试验的AUCROC比较,哪一个试验的AUCROC最大,则该诊断的价值最佳。从这种设计方法与结果中所提供的具体指标和数据,是评价诊断性试验质量和水平的科学依据,也是指导临床医生合理应用有关诊断性试验于病例筛选、诊断及鉴别诊断的临床实践。
, 百拇医药
二、临床治疗性研究设计
前瞻性的临床治疗性研究设计,最佳设计方案为随机对照试验(randomized control trial, RCT): 从5种中华医学会系列杂志统计,1985年发表的640篇论著中,RCT仅8篇(1.3%);而1995年发表的954篇论著中,有40篇RCT(4.2%),无论从绝对数字与百分比看,确有上升,涉及到研究设计并影响研究质量的主要问题,表现在:
1.研究对象的诊断问题:入组研究对象的诊断标准非常重要,涉及到研究课题的质量基础。因此,一定要准确无误,并为公认。然而,有的全国性多中心大型协作研究课题,从报道的论文中却发现诊断标准存在着某种缺陷,不能不影响其质量与水平;有的重点课题仅考虑入组病例诊断的严格性,而排除标准竟设计了17项,使合格的纳入对象约占整个患该病人群的10%左右,而90%左右的患者却被排除掉。即使该研究的结果有高度的内在真实性(internal validity),其代表性也仅为10%左右。因此,对于治疗性研究纳入试验的对象,其诊断标准无论在设计方案内或在发表的论文中,一定要交待准确,符合公认的诊断标准。根据课题研究的目的,宜制订合适和可行的纳入和排除的标准,在保证研究质量的前提下,一定要考虑研究成果的代表性和今后推广的受益面。
, 百拇医药
2.随机对照不是“随便”对照,一定要按照真正的随机抽样或随机分组的正规方法执行。因此,在研究设计方案和论著中要交待清楚和具体,使读者了解报道的结果确实是真正的随机对照试验而非“随便”。随机分组后的试验组及对照组的研究对象,除试验和对照的措施之外,他们之间可能影响疗效后果的主要临床特点的基线状况,一定要相似而无显著的差异性。这样,就能使试验组和对照组最终的试验结果有可靠的可比性,否则,将会影响研究的质量。此外,对于成千上万例大型多中心RCT研究课题,由于样本量很大,随机分组后组间的临床基线差异性可能并不显著。即使有显著差异,最后可以应用分层分析的方法进行比较分析。因此,对研究质量不会造成不良影响,故这种大样本研究就不强调基线的可比性。
3.治疗试验疗效假设水平的设计:一项新的治疗性试验措施或药物,当投入临床试验时,总是期望其效果比对照组为佳。因此,在研究设计中,应该有试验组的疗效水平及其与对照组相比、疗效差异水平的假设(hypothesis)。这种假设必须有赖于临床前期研究的科学依据或者以预试验的结果作为依据。有了这些假设数据,又规定了α-错误及β-错误容许水平,就可以应用相应的样本量的估算公式,计算出研究课题的最低样本需求量。这样才能为整个研究工作的安排和样本来源的可行性提供科学的参考依据。从我国发表的治疗性文献分析,疗效假设水平的设计十分稀少,RCT报道的样本量最少为10例,最多达15 000例,绝大多数为数十例。可见,这方面的设计内容十分薄弱。国际水平的文献对此十分重视。
, 百拇医药
4.治疗性试验的试验措施或药物,包括对照性治疗措施在内,一定要有科学依据,而且要安全有效。务必要遵照世界医学会制订的关于人体试验的赫尔辛基宣言,我国有的科研课题或多或少地存在这方面的缺陷,是值得注意改进的。
5.统计学方法的正确应用问题:临床治疗性研究要涉及到疗效测试的指标及其影响疗效的有关因素、预期结果的数据资料及其类型、统计分析的方法和类别(如单因素和多因素相关性分析)以及统计软件的选择等等。因此,统计学方法的抉择与应用必须贯穿于整个课题设计以及资料分析和处理之中,而不是等着研究结果搞出来了,数据资料已经木已成舟了,才找统计师帮忙处理。如果这样做,科研质量是难以保证的。我国许多临床科研论文数据的统计学处理之所以不够完善,估计多与此有关,需要改进。
三、科研道德问题
临床科研重点是研究人类疾病的诊治和预防,是关系到改善人民的健康、促进医学事业发展的大事,一切研究课题和发表的学术论文,务必要有科学的依据,要遵照实事求是的原则,不能损害病人的利益,要有崇高的医德和科研道德,千万搞不得“假冒伪劣产品”,否则必将造成害人害己和身败名裂的恶果。针对临床科研中的某种趋势,为防患于未然,建议中华系列医学杂志编委会和编辑部除加强对学术内容的审查和评价外,最好增加一份供稿法人单位对稿件提供伦理考核合格的保证书,如发现稿件有违反科研道德及医德或弄虚作假的证据者,建议中华医学会在各杂志公布作者及其单位名单,在限期整改期内一律不刊登该单位的学术论著。
临床科研课题存在设计缺陷,会严重地影响研究质量和成果的水平。为了避免人力、财力、物力的浪费,提高研究的质量,建议今后凡是国家级以及部级资助的中标课题,由主管行政部门组织科研设计研讨会,课题负责人参加并报告详细的设计方案,聘请有关专家咨询、讨论和评价,补充修改使之完善化,经考核合格后,国家方启动资助基金,这样,也许会产生积极的效果。
(收稿:1998-10-07), 百拇医药
单位:610041 成都,华西医科大学第一附属医院临床流行病学资源与培训中心
关键词:
中华医学杂志990201 有了很好的临床科研课题,即使获得了国家重点课题的资助,如果没有科学的研究设计,很难达到预期的理想目的,甚者,可能造成人力、物力和财力,特别是宝贵时间的浪费。据抽样调查1985年和1995年两个年度5种中华医学会系列杂志发表的112篇有关诊断性试验的论著的结果显示,90.0%以上的论文科研设计不合理。其中16.0%缺乏金标准评价;35.7%的文献仅有阳性率的报道,而无敏感性、特异性等基本的诊断性指标,更未涉及似然比及受试者工作特征曲线(ROC)等分析与评价。在治疗性研究方面,抽样调查1985~1996年35种中华医学会系列杂志发表的随机对照试验(RCT)研究论著,共计164篇,其中交待随机分组方法者仅为15.2%;交待了随机分组方法,但有错误者为5.5%;竟有79.3%的文献提到研究的本身为随机对照试验,但根本未见关于随机分组方法与方式的叙述。至于报道的分层随机对照试验则矛盾更多。此外,据近期有关国家重点临床科研课题的不完全评价与分析,科研设计的缺陷率亦达30%左右。这些问题的存在,十分严重地阻碍着我国临床医学研究水平的提高,对临床医学的进步亦有重要的负性影响。
, http://www.100md.com
中华医学会临床流行病学学会、中国临床流行病学协作网和中华医学杂志编辑委员会于1998年7月联合召开了全国临床科研设计专题研讨会。会议研讨分析了当前我国临床医学科研设计中存在的问题,提出了改进的对策(详见本刊本期第89页全国临床科研设计专题研讨会纪要)。会议呼吁广大临床医学工作者要进一步重视临床医学研究的科研设计,以提高临床医学研究质量,使有价值的研究课题获得预期的成果,实现临床医学的现代化和科学化,更好地为人民的健康服务。现就诊断性试验和治疗性研究设计中的某些问题进行简要评述。
一、 诊断性试验设计
任何拟研究的新的临床诊断性试验,务必要具备公认的标准诊断方法作为试验研究的“金标准”(gold standard)。用这种金标准诊断阳性者为病例组;阴性者为对照组。健康人群不应作为临床诊断性试验的对照。两组对象的例数要根据试验的假设水平,计算两组研究对象的最低需要的样本量;新的诊断试验要同步地施检于两组对象;这样两组对象将会获得真阳性与假阳性、真阴性与假阴性的受试者例数的结果。于是就可以按公式计算新试验的敏感性(sensitivity)、特异性(specificity)、患病率(prevalence)、准确性(validity)、预测值(predictive value)及似然比(likelihood ratio)等指标,而不仅仅限于某些论著报道的阳性率及阴性率。如果涉及到对同一种疾病同步应用多种诊断试验,进行比较研究以筛选最佳诊断试验者,则可同时将各自试验的连续变量,分别设定不同的临界值(cut off point),计算出一系列的敏感性和特异性指标,绘制出ROC工作曲线,分别计算各个试验的ROC曲线下的面积(AUCROC),作各试验的AUCROC比较,哪一个试验的AUCROC最大,则该诊断的价值最佳。从这种设计方法与结果中所提供的具体指标和数据,是评价诊断性试验质量和水平的科学依据,也是指导临床医生合理应用有关诊断性试验于病例筛选、诊断及鉴别诊断的临床实践。
, 百拇医药
二、临床治疗性研究设计
前瞻性的临床治疗性研究设计,最佳设计方案为随机对照试验(randomized control trial, RCT): 从5种中华医学会系列杂志统计,1985年发表的640篇论著中,RCT仅8篇(1.3%);而1995年发表的954篇论著中,有40篇RCT(4.2%),无论从绝对数字与百分比看,确有上升,涉及到研究设计并影响研究质量的主要问题,表现在:
1.研究对象的诊断问题:入组研究对象的诊断标准非常重要,涉及到研究课题的质量基础。因此,一定要准确无误,并为公认。然而,有的全国性多中心大型协作研究课题,从报道的论文中却发现诊断标准存在着某种缺陷,不能不影响其质量与水平;有的重点课题仅考虑入组病例诊断的严格性,而排除标准竟设计了17项,使合格的纳入对象约占整个患该病人群的10%左右,而90%左右的患者却被排除掉。即使该研究的结果有高度的内在真实性(internal validity),其代表性也仅为10%左右。因此,对于治疗性研究纳入试验的对象,其诊断标准无论在设计方案内或在发表的论文中,一定要交待准确,符合公认的诊断标准。根据课题研究的目的,宜制订合适和可行的纳入和排除的标准,在保证研究质量的前提下,一定要考虑研究成果的代表性和今后推广的受益面。
, 百拇医药
2.随机对照不是“随便”对照,一定要按照真正的随机抽样或随机分组的正规方法执行。因此,在研究设计方案和论著中要交待清楚和具体,使读者了解报道的结果确实是真正的随机对照试验而非“随便”。随机分组后的试验组及对照组的研究对象,除试验和对照的措施之外,他们之间可能影响疗效后果的主要临床特点的基线状况,一定要相似而无显著的差异性。这样,就能使试验组和对照组最终的试验结果有可靠的可比性,否则,将会影响研究的质量。此外,对于成千上万例大型多中心RCT研究课题,由于样本量很大,随机分组后组间的临床基线差异性可能并不显著。即使有显著差异,最后可以应用分层分析的方法进行比较分析。因此,对研究质量不会造成不良影响,故这种大样本研究就不强调基线的可比性。
3.治疗试验疗效假设水平的设计:一项新的治疗性试验措施或药物,当投入临床试验时,总是期望其效果比对照组为佳。因此,在研究设计中,应该有试验组的疗效水平及其与对照组相比、疗效差异水平的假设(hypothesis)。这种假设必须有赖于临床前期研究的科学依据或者以预试验的结果作为依据。有了这些假设数据,又规定了α-错误及β-错误容许水平,就可以应用相应的样本量的估算公式,计算出研究课题的最低样本需求量。这样才能为整个研究工作的安排和样本来源的可行性提供科学的参考依据。从我国发表的治疗性文献分析,疗效假设水平的设计十分稀少,RCT报道的样本量最少为10例,最多达15 000例,绝大多数为数十例。可见,这方面的设计内容十分薄弱。国际水平的文献对此十分重视。
, 百拇医药
4.治疗性试验的试验措施或药物,包括对照性治疗措施在内,一定要有科学依据,而且要安全有效。务必要遵照世界医学会制订的关于人体试验的赫尔辛基宣言,我国有的科研课题或多或少地存在这方面的缺陷,是值得注意改进的。
5.统计学方法的正确应用问题:临床治疗性研究要涉及到疗效测试的指标及其影响疗效的有关因素、预期结果的数据资料及其类型、统计分析的方法和类别(如单因素和多因素相关性分析)以及统计软件的选择等等。因此,统计学方法的抉择与应用必须贯穿于整个课题设计以及资料分析和处理之中,而不是等着研究结果搞出来了,数据资料已经木已成舟了,才找统计师帮忙处理。如果这样做,科研质量是难以保证的。我国许多临床科研论文数据的统计学处理之所以不够完善,估计多与此有关,需要改进。
三、科研道德问题
临床科研重点是研究人类疾病的诊治和预防,是关系到改善人民的健康、促进医学事业发展的大事,一切研究课题和发表的学术论文,务必要有科学的依据,要遵照实事求是的原则,不能损害病人的利益,要有崇高的医德和科研道德,千万搞不得“假冒伪劣产品”,否则必将造成害人害己和身败名裂的恶果。针对临床科研中的某种趋势,为防患于未然,建议中华系列医学杂志编委会和编辑部除加强对学术内容的审查和评价外,最好增加一份供稿法人单位对稿件提供伦理考核合格的保证书,如发现稿件有违反科研道德及医德或弄虚作假的证据者,建议中华医学会在各杂志公布作者及其单位名单,在限期整改期内一律不刊登该单位的学术论著。
临床科研课题存在设计缺陷,会严重地影响研究质量和成果的水平。为了避免人力、财力、物力的浪费,提高研究的质量,建议今后凡是国家级以及部级资助的中标课题,由主管行政部门组织科研设计研讨会,课题负责人参加并报告详细的设计方案,聘请有关专家咨询、讨论和评价,补充修改使之完善化,经考核合格后,国家方启动资助基金,这样,也许会产生积极的效果。
(收稿:1998-10-07), 百拇医药