学术期刊如何防假
“假货”不知是何时诞生的?自其诞生之日起,就一直伴随着人们的生活。随着“打假”的力度不断加强和技术不断提高,“造假”的手段亦变得越来越高明,侵害的范围也越来越广。连“科学”这座神圣的殿堂,也难免遭受污泥浊水的浸泡。从“上世纪90年代初4名德国医学研究人员,因收受其国内烟草制造商的贿赂而编造实验数据,发表了多篇有关‘吸烟无害健康’的文章;到2000年前后美国贝尔实验室科学家舍恩至少在16篇论文中造假,再到韩国首尔大学于2005年12月23日上午宣布‘黄禹锡造假事件’属实”,这些震惊世界的学术丑闻,不难看出整个世界都面临着“真与假”的较量,这种较量不仅体现在人们的日常生活、工作和交往之中,而且已经渗透到科学领域中来。
造假论文为什么能发表
作为一名生物医学统计学工作者,在审阅大量学术论文和解答很多统计咨询问题过程中,笔者发现,在学术论文、科研成果和课题申请中,造假行为并非鲜见,只不过很多人的论文未发表在世界顶尖级杂志上,没有人去认真追究而已;有些成果评审完后,被锁在保险柜里,几乎无人有动力和欲望去探查其真伪;有些人为了使申请的科研项目容易获得资助,申请时邀请统计学专家参与,等到获得几十万甚至数百万元资助经费后,就一脚将原先邀请的统计学专家踢开。这些卑劣的造假和欺诈行为经常能看见。
假东西为何能被视为“科学”而公开发表呢?笔者认为,在我国主要是以下四个原因所致:
第一、造假者手段较高明,其假象不易被发现;
第二、审阅者或评审者洞察力不足,被假象所迷惑。相当多的评审者连基本的统计学常识都不懂,经常把有严重科研设计错误的论文评价为“实验设计合理、数据可靠、统计分析正确”。另外也存在很多腐败的同行评议现象;
第三、管理者官僚主义作风严重,在选拔评审者时不能做到任人唯贤。一些学术权威部门,在评定职称、评审科研成果和审阅学术论文时,把真正有学术造诣的统计学专家排斥在外;
第四、某些学术权威机构(如学术委员会、杂志社等)只是一味地追求利润最大化,不重视或者忽视了对论文质量把关的投入。例如,一些杂志社或编辑部只知道让专家审稿,但对专家所付出的智力劳动很不尊重。在这种扭曲价值观的影响下,“严格把好期刊质量关”就成了一句空话。
发现论文造假的技巧与策略
下面举一些笔者在审稿过程中碰到的真实案例,以说明学术期刊如何防假、打假。
一、通过论文数据发现可能的造假行为
实例 测定10名20岁男青年的身高(cm)与前臂长(cm)如下,试分析身高与前臂长之间的相互关系和依赖关系(设身高为自变量),并回答所求的直线回归方程有无实用价值。
得出这样的专业结论:因决定系数r2=0.99988,说明前臂长的变异中有99.988%的信息可以由身高来决定,即所求得的直线回归方程有很高的实用价值。
怀疑造假的突破口:由医学常识可知,人的身高与前臂长之间确实有某种关系存在。但这两个变量都是随机变量(因为有个体差异存在,不经过准确测量,是不知道每个人在这两个定量指标上的具体取值的),随机变量之间一般不具有十分理想的数量关系,而在本例中,Pearson相关系数r=0.99994,r2=0.99988,P<0.0001,这说明两个定量变量之间几乎是绝对地呈直线关系。若绘制出反映两个定量变量同时变化的散布图,10个观测点几乎全部落在通过坐标原点且斜率为0.26311的那条直线上。这样“漂亮”的结果在生物医学实验研究中几乎是不可能出现的。所以,我们有理由怀疑“原始数据”被造假了。
二、通过原始实验记录发现可能的造假行为
要想比较准确地了解稿件中的实验研究结果是否被造假了,一个非常有效的办法就是查看其实验设计、实验过程记录、原始实验数据的记录(包括实验数据、照片、自动化仪器中存储的图像和直接输出结果)。
如果实验记录被篡改或被重新抄录了,就是值得怀疑的;如果实验记录的真实性可以得到确认,但原始数据与稿件中提供的数据不吻合,说明在数据的取舍方面带有随意性或故意将某些“过大或过小”的数据人为舍弃或篡改,这就是明显的造假行为;如果稿件中的数据与原始记录中的数据完全一致,只是因为统计分析方法选用不当,得出了不正确的结论,这属于误用统计分析方法所致,应重新选用正确的统计分析方法,重新报告实验结果与陈述实验结论。
三、运用专业知识和统计学知识发现可能的造假行为
实例 某研究者在某农村进行了一项调查研究,研究的内容是居民被狗咬伤的情况。将当地居民(包括小孩)按年龄分成若干个组,统计该地各年龄组居民被狗咬伤的发生率。最后运用统计学中线性回归分析方法,研究由年龄推算被狗咬伤的发生率的直线回归方程,运用假设检验方法对此直线回归方程进行检验,得到的P<0.05,认为可以根据居民的年龄去预测其被狗咬伤的发生率。请问:对此研究项目和分析结果能作出什么评价呢?
怀疑造假的突破口:假定原研究者的研究结果是真实可靠的,则可以得到这样的推论,即该地的狗很有数学和统计学“头脑”,能按直线规律去咬人!但只要我们稍微有一点基本常识和专业知识,就可以判断这条所谓的经过统计学上假设检验而判为有实用价值的直线回归方程纯属于捏造规律的结果。两组定量资料之间是否存在直线变化趋势,不能仅看其直线回归方程在统计学上是否成立,最关键点有两个:第一,要考察两定量变量之间在专业上是否有联系;第二,应绘制并分析反映两定量变量变化趋势的散布图。事实上,本例很难通过第一个关键点的考核。因为居民是否被狗咬伤,表面上看似乎与年龄有关,但最主要的原因还是该地居民养狗的种类、密度、人们对待养狗的态度和居民在户外活动的频繁程度等。若将反映咬伤率随年龄变化趋势的散布图绘制出来,可以预计其各散点将呈一“倒S形”或“浴盆形”分布状态,因为小孩与老人跑不快,对狗攻击时的应付能力弱,容易被狗咬伤;而青壮年人被狗咬伤的可能性就要小得多了。这个研究项目即使在数据上没有造假,由于严重误用统计学分析方法,难逃“捏造数学和统计学规律”的“罪名”。
四、通过重复实验去发现可能的造假行为
造假的科研结论,肯定不具有重现性。世界上就有很多著名的论文最终被撤回,就是通过重复实验,发现结论不能重复出现而被认为存在造假。因此,对于那些有重大影响的研究成果,如果怀疑存在造假,在排除了实验设计和统计分析错误的前提下,应组织专业技术人员深入原研究者所在的实验室,监察实验的过程和结果,验证原先的研究结果能否重复出现。
总的来说,研究结果不真实或是错误的主要由以下几种原因所致:实验数据造假;过失误差(如数据抄写或输入错误、仪器或试剂未校准或实验中途出了问题);实验设计错误;统计分析错误。
若属于第一种情形,则属于科研道德极差的问题;若属于第二种情形,则属于工作态度不严谨问题,可以通过加强责任心教育来解决;若属于第三、四种情形,则属于科研素质和科研能力不够格问题,可以通过继续教育和加强稿件审稿力度使错误率降低。根据笔者多年来审阅生物医学期刊论文和稿件的经验,发现学术期刊论文中存在的大部分问题属于后两种情形。
为了尽量降低“造假”给科学界造成的极坏影响和损失,全世界都应大力弘扬科学道德观,鄙视和惩罚造假者的丑恶行径。另外熟练的统计学知识、科学的统计学思维也是发现学术论文中假、乱和差错的一个法宝,故我们的期刊编辑、杂志的审稿专家也应当重视和充分利用这双慧眼,严格把好期刊论文质量关,使得造假的论文得不到发表、质量差的论文少发表,而发表更多高质量的优秀论文。, http://www.100md.com
造假论文为什么能发表
作为一名生物医学统计学工作者,在审阅大量学术论文和解答很多统计咨询问题过程中,笔者发现,在学术论文、科研成果和课题申请中,造假行为并非鲜见,只不过很多人的论文未发表在世界顶尖级杂志上,没有人去认真追究而已;有些成果评审完后,被锁在保险柜里,几乎无人有动力和欲望去探查其真伪;有些人为了使申请的科研项目容易获得资助,申请时邀请统计学专家参与,等到获得几十万甚至数百万元资助经费后,就一脚将原先邀请的统计学专家踢开。这些卑劣的造假和欺诈行为经常能看见。
假东西为何能被视为“科学”而公开发表呢?笔者认为,在我国主要是以下四个原因所致:
第一、造假者手段较高明,其假象不易被发现;
第二、审阅者或评审者洞察力不足,被假象所迷惑。相当多的评审者连基本的统计学常识都不懂,经常把有严重科研设计错误的论文评价为“实验设计合理、数据可靠、统计分析正确”。另外也存在很多腐败的同行评议现象;
第三、管理者官僚主义作风严重,在选拔评审者时不能做到任人唯贤。一些学术权威部门,在评定职称、评审科研成果和审阅学术论文时,把真正有学术造诣的统计学专家排斥在外;
第四、某些学术权威机构(如学术委员会、杂志社等)只是一味地追求利润最大化,不重视或者忽视了对论文质量把关的投入。例如,一些杂志社或编辑部只知道让专家审稿,但对专家所付出的智力劳动很不尊重。在这种扭曲价值观的影响下,“严格把好期刊质量关”就成了一句空话。
发现论文造假的技巧与策略
下面举一些笔者在审稿过程中碰到的真实案例,以说明学术期刊如何防假、打假。
一、通过论文数据发现可能的造假行为
实例 测定10名20岁男青年的身高(cm)与前臂长(cm)如下,试分析身高与前臂长之间的相互关系和依赖关系(设身高为自变量),并回答所求的直线回归方程有无实用价值。
得出这样的专业结论:因决定系数r2=0.99988,说明前臂长的变异中有99.988%的信息可以由身高来决定,即所求得的直线回归方程有很高的实用价值。
怀疑造假的突破口:由医学常识可知,人的身高与前臂长之间确实有某种关系存在。但这两个变量都是随机变量(因为有个体差异存在,不经过准确测量,是不知道每个人在这两个定量指标上的具体取值的),随机变量之间一般不具有十分理想的数量关系,而在本例中,Pearson相关系数r=0.99994,r2=0.99988,P<0.0001,这说明两个定量变量之间几乎是绝对地呈直线关系。若绘制出反映两个定量变量同时变化的散布图,10个观测点几乎全部落在通过坐标原点且斜率为0.26311的那条直线上。这样“漂亮”的结果在生物医学实验研究中几乎是不可能出现的。所以,我们有理由怀疑“原始数据”被造假了。
二、通过原始实验记录发现可能的造假行为
要想比较准确地了解稿件中的实验研究结果是否被造假了,一个非常有效的办法就是查看其实验设计、实验过程记录、原始实验数据的记录(包括实验数据、照片、自动化仪器中存储的图像和直接输出结果)。
如果实验记录被篡改或被重新抄录了,就是值得怀疑的;如果实验记录的真实性可以得到确认,但原始数据与稿件中提供的数据不吻合,说明在数据的取舍方面带有随意性或故意将某些“过大或过小”的数据人为舍弃或篡改,这就是明显的造假行为;如果稿件中的数据与原始记录中的数据完全一致,只是因为统计分析方法选用不当,得出了不正确的结论,这属于误用统计分析方法所致,应重新选用正确的统计分析方法,重新报告实验结果与陈述实验结论。
三、运用专业知识和统计学知识发现可能的造假行为
实例 某研究者在某农村进行了一项调查研究,研究的内容是居民被狗咬伤的情况。将当地居民(包括小孩)按年龄分成若干个组,统计该地各年龄组居民被狗咬伤的发生率。最后运用统计学中线性回归分析方法,研究由年龄推算被狗咬伤的发生率的直线回归方程,运用假设检验方法对此直线回归方程进行检验,得到的P<0.05,认为可以根据居民的年龄去预测其被狗咬伤的发生率。请问:对此研究项目和分析结果能作出什么评价呢?
怀疑造假的突破口:假定原研究者的研究结果是真实可靠的,则可以得到这样的推论,即该地的狗很有数学和统计学“头脑”,能按直线规律去咬人!但只要我们稍微有一点基本常识和专业知识,就可以判断这条所谓的经过统计学上假设检验而判为有实用价值的直线回归方程纯属于捏造规律的结果。两组定量资料之间是否存在直线变化趋势,不能仅看其直线回归方程在统计学上是否成立,最关键点有两个:第一,要考察两定量变量之间在专业上是否有联系;第二,应绘制并分析反映两定量变量变化趋势的散布图。事实上,本例很难通过第一个关键点的考核。因为居民是否被狗咬伤,表面上看似乎与年龄有关,但最主要的原因还是该地居民养狗的种类、密度、人们对待养狗的态度和居民在户外活动的频繁程度等。若将反映咬伤率随年龄变化趋势的散布图绘制出来,可以预计其各散点将呈一“倒S形”或“浴盆形”分布状态,因为小孩与老人跑不快,对狗攻击时的应付能力弱,容易被狗咬伤;而青壮年人被狗咬伤的可能性就要小得多了。这个研究项目即使在数据上没有造假,由于严重误用统计学分析方法,难逃“捏造数学和统计学规律”的“罪名”。
四、通过重复实验去发现可能的造假行为
造假的科研结论,肯定不具有重现性。世界上就有很多著名的论文最终被撤回,就是通过重复实验,发现结论不能重复出现而被认为存在造假。因此,对于那些有重大影响的研究成果,如果怀疑存在造假,在排除了实验设计和统计分析错误的前提下,应组织专业技术人员深入原研究者所在的实验室,监察实验的过程和结果,验证原先的研究结果能否重复出现。
总的来说,研究结果不真实或是错误的主要由以下几种原因所致:实验数据造假;过失误差(如数据抄写或输入错误、仪器或试剂未校准或实验中途出了问题);实验设计错误;统计分析错误。
若属于第一种情形,则属于科研道德极差的问题;若属于第二种情形,则属于工作态度不严谨问题,可以通过加强责任心教育来解决;若属于第三、四种情形,则属于科研素质和科研能力不够格问题,可以通过继续教育和加强稿件审稿力度使错误率降低。根据笔者多年来审阅生物医学期刊论文和稿件的经验,发现学术期刊论文中存在的大部分问题属于后两种情形。
为了尽量降低“造假”给科学界造成的极坏影响和损失,全世界都应大力弘扬科学道德观,鄙视和惩罚造假者的丑恶行径。另外熟练的统计学知识、科学的统计学思维也是发现学术论文中假、乱和差错的一个法宝,故我们的期刊编辑、杂志的审稿专家也应当重视和充分利用这双慧眼,严格把好期刊论文质量关,使得造假的论文得不到发表、质量差的论文少发表,而发表更多高质量的优秀论文。, http://www.100md.com