BMJ:中国癌症论文三分之一或来自论文工厂

2026-02-03 18:00点击次数:15

关键词:

为应对日益猖獗的学术论文造假现象,澳大利亚昆士兰科技大学(QUT)主导的研究团队开发了一种可识别造假论文的新型机器学习工具,发在癌症研究领域识别出数量惊人的伪造论文。


由于造假论文大多依赖「论文工厂」的样板文件,研究人员训练了一个名为 BERT 的语言模型,可识别重复出现的文本模板,「鉴假」准确率高达 91%。


BERT 对 1999 年至 2024 年间发表的约 260 万篇癌症研究论文进行了分析和标记。结果发现,其中约 26 万篇论文表现出与「论文工厂」作品相似的文本特征,占比近 10%,波及主要出版商旗下的数千种期刊,不乏高影响力刊物。从时间趋势看,这类可疑论文的比例从 21 世纪初的约 1% 攀升至 2022 年的超过 16%;研究领域方面,可疑论文主要集中在分子癌症生物学和早期实验室研究领域,胃癌、肝癌、骨癌和肺癌等类型的研究占比较为突出;地域分析显示,超过 17 万篇可疑论文来自中国机构,约占同期中国癌症论文总数的 36%。


研究警告称,如果伪造的研究混入科学证据库,将误导其他学者,影响临床试验、药物开发和患者护理,最终阻碍医学进步。目前已有三家科学期刊开始试用该工具进行稿件筛查。但研究者强调,工具标记的结果仅为疑似,最终仍需人工专家核实。相关论文 1 月 30 日发表于《英国医学杂志》(The BMJ)。


来源:昆士兰科技大学

新闻图片1