可解释机器学习整合多源生物标志物用于骨关节炎诊断及机制研究:以颞下颌关节为例
Interpretable machine learning integrates multi-source biomarkers for osteoarthritis diagnosis and mechanistic insights: A temporomandibular joint model
目的:骨关节炎(OA)是一种以软骨退化和软骨下骨重塑为特征的全关节退行性疾病。颞下颌关节(TMJ)因其解剖结构和早发性疾病特点,为早期OA研究提供了独特模型。当前诊断依赖于晚期变化,凸显了整合生物标志物的必要性。我们假设,结合影像学、分子和临床数据的机器学习(ML)能提高诊断准确性,且SHapley Additive exPlanations(SHAP)可阐明关键预测因子及其相互作用,从而增强对疾病异质性机制的理解。设计:本研究为病例对照研究,纳入162名参与者(81例TMJ OA患者和81例年龄、性别匹配的对照者),整合了临床数据、高分辨率影像学数据(影像组学、骨小梁结构、关节间隙)以及系统性/关节生物标志物(血清和唾液)。通过嵌套10折交叉验证评估了77种ML组合。结果:最终集成模型表现出较强的诊断性能(AUC=0.828,95% CI: 0.757-0.892)。SHAP分析揭示了头痛严重程度、骨小梁增厚、睡眠不安、肌肉酸痛、张口受限和关节间隙狭窄等关键预测因子。机制性相互作用捕捉了早期炎症、结构和神经血管变化,包括影像组学-软骨退化的关联(如髁突灰度不均匀性与唾液CXCL-16)、临床-分子关联(如头痛与唾液VE-cadherin)以及软骨下微结构相关性(如灰度不均匀性与游程不均匀性)。结论:本研究提出了一种临床可用、可解释的OA诊断AI模型。关键预测因子和跨领域相互作用提高了诊断准确性,并阐明了早期疾病机制。虽然交叉验证降低了过拟合风险,但仍需外部验证。这些发现支持生物标志物驱动的精准诊断,并强调多组织预测因子作为早期OA干预的潜在靶点。