顶刊论文“翻车”世卫也被误导 满身漏洞的数据公司如何“骗”过了所有人?

红星新闻 2020-06-08 19:08
进入
全球热点
阅读更多内容

本月4日,全球科学界被一条“爆炸性”新闻震惊了,在数小时内,两项具有重要意义的全球性新冠病毒研究分别被《新英格兰医学杂志》及《柳叶刀》两大权威期刊撤回,原因是“作者无法核实研究结果所依赖的数据库是否真实”。

5eddf7cb4dfe4.jpg▲两大权威期刊撤回两篇“具有重要意义”的新冠研究论文。图据《卫报》

据悉,这两项研究皆由哈佛大学心脏病学“大牛”曼迪普·梅赫拉教授(Dr. Mandeep Mehra)主导,其中一项研究认为,引人注目的抗疟药物氯喹和羟氯喹会对新冠患者造成更大危险;另一研究则是证明某些降压药并不会增加新冠治疗风险,甚至可能起到保护作用。 

据《纽约时报》介绍,这两项研究在新冠全球大流行期间都扮演了关键角色,甚至影响了全球科学领域对新冠病毒的研究进程,并促使一些拉美国家政府根据该研究结果,修改了其全国新冠肺炎治疗指南。

然而,在半个月喋喋不休的争论和不断发酵的质疑后,这两项研究均被曝出,其所依赖的研究数据库可能“从头到尾就是一场骗局”,而且性质之恶劣,堪称近年来全球最大的医学研究丑闻之一。

/ 论文 /

迫使世卫暂停试验项目

“现在很明确的是,当我希望能在这个紧迫时期为新冠研究做贡献时,我没有做足够的工作以确保数据源的适用性,”梅赫拉博士在对《纽约时报》的声明中表示。“对于因此而造成的所有直接、间接干扰,我深感抱歉。” 

梅赫拉博士是一名备受崇敬的心脏病学专家,除了在哈佛大学任职外,他同时还担任波士顿布里格姆女子医院心脏和血管中心的医学主任。此前,他还曾担任国际心肺移植学会(ISHLT)主席及旗下《心肺移植杂志》期刊主编,以及美国心脏衰竭协会主席。

maxresdefault.jpg▲两篇论文的主要作者梅赫拉博士。图据《科学新闻》

5月22日,他在《柳叶刀》发表了一篇关于抗疟疾药物氯喹和羟基氯喹的研究论文,因其“令人震惊的结论”而成为了全球头条新闻。该论文称,在涉及全球六大洲、671家医院的96,000名受试者的研究中发现,正在探索用于治疗新冠肺炎的抗疟药羟氯喹(HCQ)与患者较高的死亡率有关。 

论文发布后,世界卫生组织(WHO)立即暂停了“团结试验”中涉及HCQ的部分临床试验工作,全球范围内的相关临床试验也陆续被叫停。与此同时,感到惊恐的研究人员开始对HCQ进行安全性审查。不仅如此,据英国《卫报》报道,该论文还成为了一些拉丁美洲国家治疗新冠肺炎政策的基础。而在本月3日,在两大期刊提出对研究的担忧后,WHO立即宣布将恢复氯喹和羟基氯喹的临床试验。 

5eddf7cb76184.jpg▲羟氯喹(HCQ)。图据STAT新闻

据《纽约时报》报道,梅赫拉教授的两项研究主要基于一个庞大的国际患者医疗记录数据库,它来自一家名为“Surgisphere”的医疗数据分析公司。该公司声称,数据库拥有六大洲1200家医院及医疗机构共享的患者信息。正因为如此,梅赫拉教授在两篇论文中,都将该数据公司创始人兼CEO萨潘·德赛博士列为作者。

/ 质疑 /

四处漏风的数据“误差”

然而很快,对这篇论文的质疑声开始陆续涌现。比如,研究人员发现,Surgisphere从5家医院获取的数据记录显示,截至4月21日,澳大利亚有73例新冠肺炎死亡病例。但约翰斯·霍普金斯大学的数据却显示,截至4月21日,澳大利亚只有67人死于新冠肺炎。随后,《柳叶刀》对数据进行了修正,称“一家亚洲医院不小心被纳入了澳大利亚的数据,导致数据出现误差”。 

此后,《卫报》联系了墨尔本的五家医院和悉尼的两家关键医院,但所有人都否认加入了这样一个数据库,并表示从未听说过Surgisphere。 

随后,梅赫拉的研究中“所用数据和数据集来源不规范”引发了大量关注,其研究的结论也似乎越来越站不住脚。有人指出了一些应当在同行评审过程中被发现的异常,比如为何在新冠大流行早期就能收集到大量的注册病例信息,甚至很少有电子健康记录的非洲也囊括在内? 

5月底,全球120名科学家在一封致《柳叶刀》编辑的公开信中,通过对梅赫拉所使用的数据提出质疑,表达了对该研究真实性的怀疑。本月3日,《柳叶刀》和《新英格兰医学杂志》均刊文表达了类似的担忧。 

事实上,另一项发布于《新英格兰医学杂志》、基于同一数据来源的研究,也遭遇了同样的命运。该研究通过Surgisphere数据库发现,抗寄生虫药“伊维菌素”可以降低新冠肺炎重症患者的死亡率。据《卫报》报道,这一研究促使秘鲁政府将伊维菌素添加到国家新冠肺炎治疗指南中。 

梅赫拉教授在一份声明中称,随着争议达到顶峰,研究的其他三名作者已委托独立审计机构对Surgisphere数据的来源和真实性进行调查。“6月3日,(审计人员)通知我们,Surgisphere无法移交进行此次审计所需的数据,原因是其与客户达成了协议,而且文件中包含机密信息。”他补充道。由于无法验证数据的真实性,梅赫拉教授及合著者随后要求两大期刊撤回已发布的研究论文。

5eddf7cb355b6.jpg▲上周,《柳叶刀》期刊在其官方推特账号发表了撤回声明。截图自推特

/ 疑点 /

图书出版商摇身成为大数据公司

由于几篇论文的影响力,原本默默无名的Surgisphere公司成了新冠危机中异军突起的黑马,而眼下的这场学术争议又让形势再度反转,但无论如何,这家曾经鲜为人知的小公司已经成为全球科学界的“聚焦点”。

据其创始人兼CEO德赛的介绍,Surgisphere仅有11名员工,他们用了12年的时间成功创建了“一个庞大的全球私人医疗信息数据库,囊括了全球各国患者的详细医疗信息”。然而,这个“庞大”的数据库却鲜少有专业人士知晓。

5eddf7cc1d540.jpg▲萨潘·德赛。图据《卫报》

最令科学界困惑的一个问题是,这家由德赛于2008年创办的、出版教科书的医学教育公司Surgisphere,是如何“摇身一变”成为了一家拥有强大国际数据库的数据公司。

梅赫拉博士称,自己通过研究的其中一名合著者认识了德赛博士,并被告知存在一个由Surgisphere汇编的大型患者医疗记录私人数据库。据《波士顿环球报》旗下的医疗媒体STAT新闻8日报道,布里格姆女子医院发言人向其表示,介绍梅赫拉教授与德赛认识的人,正是论文作者之一的阿米特·帕特尔——目前,美国犹他大学已宣布终止对他的教职任命。

就这样,当初,德赛向梅赫拉教授“慷慨地”提供了用于心脏研究及羟基氯喹研究的统计数据。在梅赫拉教授的论文发布后,许多研究人员惊讶地发现,世界上竟然还存在这样一个数据库,可以如此迅速地对全球多个大陆成千上万的医疗记录进行收集和分析。

上周,德赛在一次采访中极力为Surgisphere数据库辩护,称自己完全支持信息透明化,但他与数百家客户医院签订了保密规定,因此不能向任何人展示原始数据信息。他还“喊冤”称:“我们想在这样(疫情形势严峻)的情况下提供帮助,并没有从中牟利,我们完全是自费在做这件事,这也是我从事医学的原因。”

5eddf7cb670fc.jpg▲Surgisphere在其官网对《柳叶刀》的批评做出回应。图据《纽约时报》

然而,他的说法并不能让人信服。职场社交平台LinkedIn(领英)的公开资料显示,Surgisphere的几名员工几乎或完全没有统计学或科学相关背景。一名被列为科学编辑的员工此前是科幻作家、幻想艺术家,她的职业简介表明写作是其曾经的全职工作。另一名被列为市场营销主管的员工则是一名模特和活动主持人。 

与此同时,尽管Surgisphere声称运营着世界上最大、最快的医院数据库之一,但它几乎没有任何线上服务。公司的推特账号只有不到170个粉丝,在2017年10月至2020年3月的近三年里,没有发布过任何帖子。此外,该公司LinkedIn(领英)主页上的“取得联系”链接,还被定向到一个加密货币网站的模板——那么问题来了:全球这么多家医院是如何能联系到这家公司,并加入其数据库的? 

而公司创始人德赛,在今年2月前一直在伊利诺伊州阿灵顿高地的西北社区医院担任血管外科医生。《卫报》在对其进行背景调查后发现,德赛的名字曾出现在三起美国医疗事故诉讼中,其中有两起发生在2019年11月。在其中一项诉讼中,病人约瑟夫·维塔利亚诺指控德赛及其任职的西北社区医院“粗心大意”,导致手术造成永久性损伤。 

/ 反思 / 

期刊严谨的评审标准正被侵蚀

发布新冠肺炎相关研究的Medicine Uncensored网站负责人詹姆斯·托达罗曾表示:“Surgisphere突然凭空出现,并且在短短几周内,就进行了一项可能对新冠肺炎大流行病最具影响力的全球研究。这完全讲不通,要实现这种规模的跨国研究,需要的研究人员要比它声称的多得多。” 

而德赛则告诉《卫报》,Surgisphere自2008年开始运营,其医疗保健数据分析服务几乎在同一时间开启,并持续增长。“我们使用大量的人工智能和机器学习来尽可能地使过程自动化——这是这类任务可能实现的唯一方式。Surgisphere作为一个数据聚合器,对这些数据进行分析。我们不负责源数据,因此,从电子健康记录(EHR)中导出数据、将其转换为所需格式,以及完全消除身份识别等劳动密集型任务,都由合作机构完成。” 

2697 (1).jpg▲事件发酵后,德赛在其博客页面上发表讲话,但仍尚未充分解释该公司如何收集数据。图据Vimeo

然而,为联邦政府提供数据集成项目的国际管理咨询公司Nous Group首席数据科学家彼得·埃利斯表达了自己的担心,他坦言Surgisphere数据库“几乎可以肯定是一个骗局”。埃利斯认为,“这不是任何医院都能做到的事情,消除身份识别不仅仅是删除病人名字的问题,它是一个巨大而困难的过程。我怀疑医院是否有能力做到,毕竟这是多年来美国国家统计机构通过一整个团队一直在做的事情。” 

耶鲁大学纽黑文医院的心脏病专家、卫生保健研究员哈兰·克鲁姆霍尔兹博士称,建立如此庞大的患者医疗记录数据库并非不可能,如果医院系统与供应商签订合同,由供应商将记录传递给其他大数据公司是可能实现的。然而即便如此,他表示,Surgisphere数据库之所以引发怀疑,是因为“如果这个数据库这么好,为什么之前我们没有人使用它?”他补充说,无处不在的“大数据”对科研人员很有吸引力,但在引用前,他们必须了解数据的来源、真实性和质量。 

surgisphere-the-firm-behind-two-retracted-hydroxychoroquine-studies-claimed-they-had-data-on-150000-covid-patients-but-couldnt-prove-15000-in-their-journal-report-1.jpg▲Surgisphere公司原本是一家出版教科书的医学教育公司。图据《今日医学要闻》

《柳叶刀》在一份最新声明中表示,围绕Surgisphere公司和研究中使用的数据有许多悬而未决的问题,“现在迫切需要对Surgisphere的研究合作进行制度审查。”

与此同时,论文撤回事件也引发了人们对科学研究现状的担忧。随着新冠肺炎疫情的蔓延,成千上万的相关论文在几乎没有同行评审的情况下,被匆忙地刊发在网上和期刊上。批评人士担心,在迅速审查和传播新的科学成果的压力之下,即使是最挑剔的期刊,那些长期所坚持的标准也正在被侵蚀。 

红星新闻记者 王雅林 徐缓

编辑 李彬彬