整合外显子组测序与机器学习鉴定MICB和干扰素通路基因对系统性硬化症风险的贡献
Integrative exome sequencing and machine learning identify MICB and interferon pathway genes as contributors to SSc risk
目的:系统性硬化症(SSc)是一种复杂的自身免疫性疾病,其遗传因素既有已知的也有尚未明确的。尽管全基因组关联研究(GWAS)已提示多个相关位点,但许多位于非编码区域。我们旨在通过整合外显子测序(ES)、进化作用-机器学习(EAML)框架、单细胞RNA测序(scRNA-seq)及表达数量性状位点(eQTL)分析,识别新的蛋白质编码变异和致病通路。方法:在高加索裔的2,559例SSc患者和893例对照中进行GWAS,并在欧洲裔的9,846例患者和18,333例对照中进行验证。EAML用于优先筛选具有高影响错义变异且可预测疾病的基因。分析来自SSc和对照皮肤活检的公共scRNA-seq数据,以定位基因在不同细胞类型中的表达。利用全血eQTL数据识别风险变异的调控效应。结果:发现并验证了一个新的SSc风险位点MICB(rs2516497,P = 3.66 × 10-13)。EAML突出显示了284个在干扰素信号通路中富集的基因。scRNA-seq将MICB和NOTCH4定位于成纤维细胞和内皮细胞,而HLA II类基因在巨噬细胞和成纤维细胞中富集。eQTL分析证实了MICB、NOTCH4及其他优先基因的调控效应,将SSc相关变异与转录失调联系起来。结论:这项整合基因组学研究识别了SSc中新的风险位点和机制通路,突出了MICB、NOTCH4及干扰素相关基因的作用。研究结果为理解SSc的细胞和调控结构提供了见解,并支持在复杂疾病遗传学中结合使用ES、机器学习、scRNA-seq和eQTL数据的实用性。