机器学习预测癌症相关血栓:来自维也纳癌症与血栓研究的结果
Prediction of cancer-associated thrombosis by machine learning: results from the Vienna Cancer and Thrombosis Study
背景:提升癌症相关静脉血栓栓塞(VTE)的风险预测能力仍是一项未满足的临床需求。本研究旨在应用机器学习技术预测癌症相关VTE。 患者与方法:数据来源于维也纳癌症与血栓研究(Vienna-CATS),这是一项纳入2003至2019年癌症患者的前瞻性队列研究。研究利用患者特征和实验室检测指标(包括多种常规及实验性实验室检测)训练并验证了六种VTE预测分类模型。采用蒙特卡洛交叉验证方法,将80%样本随机分配至训练集,20%分配至测试集。为避免数据泄露,基于训练数据拟合的预处理算法统一应用于测试数据。评估了模型的区分度及输入参数的影响。 结果:共纳入2193例患者(女性占46.6%),中位年龄62岁(四分位距52-68岁)。最常见的肿瘤类型为肺癌(18.1%)、脑癌(15.3%)和乳腺癌(15.1%)。6个月内及2年内分别发生124例(累积发生率6.4%)和186例(10.7%)VTE事件。表现最佳的VTE预测模型为机器学习增强的逻辑回归(LGR),其在6个月和2年的曲线下面积分别为0.66[95%置信区间(CI)0.65-0.67]和0.62(95% CI 0.61-0.62),与现有风险评估模型(RAMs)性能相当。在LGR模型中,对VTE风险贡献最大的因素包括纯合子因子V Leiden突变、直肠癌、睾丸癌、胰腺癌、新诊断癌症及VTE病史。 结论:整合广泛临床指标与生物标志物组的机器学习模型在预测癌症相关VTE方面未优于现有RAMs。