大规模多组学数据增强2型糖尿病风险预测
Large-scale multi-omics enhance risk prediction for type 2 diabetes
背景:多基因风险评分(PRS)、代谢组学和蛋白质组学各自在改善2型糖尿病风险预测方面显示出潜力,但它们在现有临床模型之外的联合应用价值尚不明确。本研究旨在评估整合多组学生物标志物是否能在单组学扩展及包含HbA1c测量的临床剑桥糖尿病风险评分(CDRS)基础上,进一步提升10年2型糖尿病风险预测能力。方法:我们分析了英国生物银行中42,840名基线时未诊断糖尿病参与者的数据。研究人群分为用于拟合模型的推导集(代谢组学第一阶段数据,N=23,108)和用于评估性能的独立验证集(第二阶段数据,N=19,732)。在CDRS基础上加入2型糖尿病PRS、11种代谢物和15种蛋白质数据,构建多组学预测模型。采用Harrell's C指数和净重分类指数(NRI)评估模型性能。结果:在10年随访期间,1090名参与者新发2型糖尿病。在各单组学层面,蛋白质组学对预测性能提升贡献最大,将C指数从0.862(临床CDRS)提高至0.884(ΔC指数 +0.022;P<0.001),连续NRI达42.0%。与临床CDRS联合蛋白质组学数据的模型相比,完整多组学模型进一步显著提升C指数(C指数0.891;ΔC指数 +0.007;P<0.001)。结论:将蛋白质组学、代谢组学和糖尿病PRS整合到临床模型中,能显著改善2型糖尿病风险预测,效果优于单组学扩展。部分筛选出的蛋白质和代谢物位于心血管疾病通路,凸显了糖尿病与心血管风险之间的关联。然而,蛋白质组学扩展模型与完整多组学扩展模型间的C指数差异较小,且仅需测量15种蛋白质的蛋白质组学扩展临床模型更易转化为常规诊疗。未来需通过外部验证和成本效益分析以支持临床推广应用。