全世界只有3.14 % 的人关注了
爆炸吧知识
导读:学术造假已经不再是什么新鲜话题,历史上的学术骗子也是数不胜数。其中骗子之王更是达到前无古人的地步,发表论文数212篇,因涉嫌造假而遭到撤稿的就达到了183篇之多。然而打假的过程并不是一帆风顺,也因此诞生了有名的“学术警察”。
学术界可能是这世界上仅以“自我审查”作为主要行为监督方法的群体之一。
2000年4月,学术期刊《麻醉与镇痛》(Anesthesia & Analgesia)发表了一篇由Peter Kranke和两个同事寄给杂志编辑的、语气挖苦的投诉信。这三位麻醉学家攻击的对象,是同为麻醉学家的日本学者藤井善隆(Yoshitaka Fujii)。藤井之前在这个期刊上发表了一篇利用一种药物来防止术后恶心、呕吐的论文。“捉假三人组”在信中称,藤井的研究数据“完美到难以置信。”
完美的骗局
在科学界,称实验结果“完美得不可思议”并不是一种赞誉——这相当于质疑作者学术不端甚至造假。但《麻醉与镇痛》杂志并没有特别注意这一警告,而是打了个圆场:在发表致编辑部信函的同时,还发表了来自藤井的解释,藤井反问道:“到底要提供多少证据,才能证实我的证据可信?”换言之,“不相信我?随你。”在此之后,藤井又先后在该杂志上发表了11篇论文。致编辑部信函的共同作者之一克里斯蒂安·阿普费尔(Christian Apfel)曾赴美国食品与药物管理局提醒他们注意藤井的问题,但并没有收到回复。
或许感到他的好运要受到挑战了,在2005年前后,藤井便差不多终止了在麻醉学领域的文章发表,继而转战眼科和耳鼻喉科学。截至2011年,藤井已发表文章200多篇,在他的研究领域可算非常高产了。2011年12月,他在《麻醉学期刊》(Journal of Anesthesia)上发表了一篇文章,这成了他所发表的最后一篇文章。
日本麻醉医生藤井善隆。图:arstechnica
随后的两年里,他在大部分研究中造假的事实露馅了。如今他雄踞个人撤稿篇数榜首,遭撤稿的文章有惊人的183篇之多,一个人就占了从1980年到2011年撤稿总篇数的7%。这个爬得高又摔得痛的故事还开启了学术出版的新纪元:诞生了用于搜寻学术造假的统计学工具,以及乐意用它们寻找造假的“学术警察”。
学术界的警醒
2009年,史蒂夫·伊恩提斯(Steve Yentis)成为《麻醉》(Anaesthesia)杂志的主编。他承认当时“并没有意识到问题已经很严重”。
2010年,故事迎来了关键的转折。和10年前的《麻醉与镇痛》一样,《麻醉》杂志发表了一篇由多位作者署名,质疑藤井研究结果的评论,并且呼吁加强论文监管,过滤虚假结果。
这篇评论是由伊恩提斯授权发表的,后来他在“谎言、致命谎言和统计”一文中写到,这篇评论一经发出便收到了洪水般的来信,其中一位读者说“为研究者歪曲证据基础的事感到惋惜”,还督促麻醉学期刊的编辑要有所行动。这封信的作者是英国麻醉学家约翰·卡莱尔(John Carlisle)。
无独有偶,此时的麻醉学领域正处于两次大型学术不端冲击的恢复阶段。第一次冲击来自塔夫茨大学的疼痛学专家斯科特·鲁本(Scott Reuben),他在临床实验中数据作假,最终被判入狱。紧接着在第二年,德国的高产研究者约阿希姆·博尔特(Joachim Boldt)被揭发篡改论文,违反学术道德,近90篇论文遭撤稿。
斯科特·鲁本(左)和约阿希姆·博尔特(右)
《麻醉》发表过6篇博尔特的文章,这让伊恩提斯有些难堪,因此当他读到卡莱尔的来信时,他看到了机遇。他回信直言卡莱尔要有所行动并拿出证据,“我督促相关来信人对藤井的研究进行分析”。卡莱尔坦白他那时并未掌握统计学的专业技术,在麻醉学同行中也不算很出名。但是他的结论却简单而又令人无法忽略——藤井的数据根本不可能从真实实验中获得。
卡莱尔将藤井从1991~2011年间168篇符合临床实验“金标准”的论文,与其他调查者文章中的数据进行对比。他对比的变量包括患者试验前的身高、血压,以及药物副作用出现的比例等。
通过这种手段,卡莱尔在2012年发表于《麻醉》杂志的文章中得出结论:在藤井的一些文章中,通过其试验得到最终研究结论的概率是10-33——一个低得可怕的数字。卡莱尔解释道:“这些数据偏离随机样本的程度足以说明它们根本不可能成为证据。”换言之:如果一件事好得难以置信,数学便会告诉你,它确实是不可信的。
讽学术造假持续数十年的插画。图片来源:Acme Science. Aurich Lawson
卡莱尔的结论与2000年揭发藤井的观点很像,不同的是这次受到了人们关注。在他的研究结果发表后不久,日本一项调查研究显示,藤井所发表的212篇论文中仅有3篇的数据明显可靠,有38篇无法定论是否造假,另外171篇则被认定完全伪造。调查最后总结道:“这相当于一个人坐在书桌前,写了一本关于科研点子的小说。”
卡莱尔的统计分析方法不仅适用于麻醉,还还适用于人体科学研究。他说:“这个方法可以应用于任何随机分组的研究,无论是植物、动物还是矿物研究”这对于其他学术刊物来说也“相当容易”施行。
斯坦福大学麻醉学家,时任《麻醉与镇痛》主编的史蒂文·谢弗(Steven Shafer)说:“约翰·卡莱尔的基本方法已经作为一种检测研究造假的工具开始得到推广,尽管它还在不断完善中。” 谢弗、伊恩提斯以及许多人都在为此努力。谢弗表示,他们的一个目标是使这个过程自动化。
谢弗表示,在2012年,他曾经亲自使用卡莱尔的方法鉴别出一篇投给《麻醉与镇痛》的论文存在造假。谢弗退稿后,又得知它被投递给了其他期刊。他说:“同一篇论文,不同的数据!我在拒稿信中暗示了这是造假论文,论文作者看到之后又编造了新的数据。”他与编辑通知了该论文作者所在机构的负责人,对方回复:“这些人以后不会再进行研究了。”
举步维艰的打击造假之路
卡莱尔的方法需要与期刊编辑合作,但许多人并不愿意参与。有人认为有理由拒绝修订论文,论文作者们则认为他们是“围剿”的受害者。通常在允许匿名评论论文的网站上,如PubPeer.com,一篇论文出现大量批评后媒体会跟进报道,这时才会有人采取行动。
例如,因发明了致癌物检测手段(埃姆斯测试)而闻名的布鲁斯•埃姆斯(Bruce Ames),在2009年与同事共同开展了一项与卡莱尔类似的分析研究。研究对象是三篇印度科学家Palaninathan Varalakshmi团队的论文。与卡莱尔不同,在这次调查中,三位研究者对他们进行了反击——他们称埃姆斯的方法“不公平”,说它是对因果关系和相关性的混用。这一次,负责Varalakshmi论文的编辑站在了Varalakshmi这一边。在这三位科学家发表过论文的期刊中,至今仍没有一家对他们的问题论文采取行动。
遗憾的是,这才是学术造假调查的典型结果。对造假者追责困难的部分原因在于学术出版本身。伊恩提斯说,学术出版“一直依赖于人,而不是体系;同行评审过程有其自身的优劣性,而造假鉴别不是它的强项”。
出版都建立在信任之上,即使可以获取原始数据,同行评审员通常也会匆匆略过。例如《自然》(Nature)杂志要求作者“进行适当的统计检验,尤其需要说明数据是否符合统计检验的假设”。PLOS杂志的执行编辑韦罗妮克•基尔默(Veronique Kiermer)认为,编辑“会将作者自证的过程作为评审的一部分,但不会系统地检查论文涉及的全部深层数据的统计学分布。”同行评审同样也不要求检查全部数据统计。
2014年,《自然》出现了一起令人心痛的干细胞论文撤稿事件(小保方晴子STAP细胞论文造假事件),小保方晴子的导师笹井芳树随后自杀。但杂志依旧认为:“我们和评审者不能发现论文背后的致命问题。”《自然》在另一篇评论中提到,抓得太严会造成真的问题,期刊“仅仅宣布撤稿可能就会受到起诉的威胁,更别说在撤稿声明中提到学术不端了。”
当年STAP细胞造假事件主角,小保方晴子
《自然》或许乐于于将繁重的监管工作留给学术机构,但伊恩提斯已吸取教训。尽管2010年由他授权发表的评论引起了读者对藤井善隆论文造假问题的关注,但他却无视了评论信息。直到看到一堆信件,包括卡莱尔的信,他才行动起来。因此,直到2012年才刊出了那篇决定性的分析报告。伊恩提斯说:“如果现在评论中出现这样的指控,我不会再放任不管。”
本文来源:环球科学ScientificAmerican、学术圈、科研小助手