丁香实验_LOGO
登录
提问
我要登录
|免费注册
点赞
收藏
wx-share
分享

机器学习揭示卵巢癌基因表达与预后的相关性

852

众所周知,癌症的复杂性是现代医学无法克服的。每个肿瘤都有许多驱动其生长的畸变。因此,针对单一脆弱性的治疗通常是短期有效的。在2013年被诊断为晚期卵巢癌后,我敢打赌,所需要的是一种能够消化和分析复杂性的算法,以提供一个特定肿瘤中多种因素的详细视图。

为了实现这一目标,我开始与专门分析大数据的Greg Ver Steeg合作,将最先进的机器学习应用于最近发布的癌症基因组图谱(TCGA)的大规模数据。TCGA包含公开的33种癌症关键基因组变化的全面地图。

寻找模式

Greg先前开发了一种称为CorEx的机器学习方法,我们将其应用于TCGA肿瘤数据。CorEx使用信息论原理来寻找隐藏的因素,解释数据中的关系。在我们的病例中,这些因素解释了肿瘤基因之间的依赖性(相关性)。

在我们最初的讨论中,很明显CorEx显示出了希望,但是需要改进以从嘈杂的基因表达数据中挤出尽可能多的信息。在此背景下的后续创新使CorEx能够有效地从相对较少的患者基因组图谱中学习模式。

格雷格和我使用改进的CorEx在420例卵巢肿瘤的RNA-seq基因表达数据中寻找模式。CorEx能够在数据中发现大量的结构,其中大部分与已知的细胞功能和途径有关。我们确定了那些在卵巢癌中似乎与表达相关的基因,并且绘制出了所有这些表达依赖关系图,我们可以开始询问它们如何融入一个更大的框架中,以便理解肿瘤生物学和治疗。

走向靶向治疗

我们问的问题之一是如何结合治疗以延长患者的生存期。我们能够证明CorEx因子的组合(即CorEx识别的基因表达模式)与TCGA患者的生存率显著相关。这为今后的临床试验提供了一种根据这些模式选择联合疗法的方法。

我们还询问是否有任何因素与长期生存相关(我特别担心!)。作为候选人,有一个特别的因素很突出。它含有一些调节干细胞特性的蛋白质,如细胞自我更新和分化成不同细胞类型的能力,这些都与侵袭性转移疾病和化疗抵抗有关。

我们的分析表明,含有许多具有干细胞样基因表达的细胞的肿瘤与患者长期生存率低有关。CorEx特别擅长于检测大量变量中的弱相关性,这可能是它首次在卵巢癌表达数据中检测到这种特殊模式的原因。

虽然这些都是有趣的总体亮点,但我们发现的真正意义在于CoreEx能够识别单个肿瘤中的多个靶网络。当我在完成初次化疗不到一年后复发时,我能够将我的肿瘤基因表达与CorEx在TCGA数据中确定的基因表达模式进行比较。我注意到肿瘤中的表达因子暗示了一种非常有利的免疫激活。一般来说,这可以预测化疗的良好反应,但不幸的是,这并不是最初的结果。

我利用CorEx提供的信息选择了一种非传统的第二种化疗方案,包括一种免疫检查点抑制剂,它允许免疫细胞识别和攻击癌细胞。

格雷格和我的努力取得了成果:我仍在接受18个月以上的治疗,第二次病情缓解至少是第一次的两倍,这在复发性卵巢癌中是罕见的。

虽然我们不能确定延长缓解期是由于我的算法驱动的治疗选择,但可以肯定的是,一些患者从个性化治疗选择中受益匪浅,而且有很大的必要将这种受益扩大到更多的患者。

我们对TCGA卵巢癌RNA-seq的分析呈现了丰富的肿瘤生物学图表,其中我们只触及了表面。我们期望对驱动个体肿瘤生长、扩散和生存的各种因素进行更深入的探索,将产生进一步的见解,为更合理、更有针对性的治疗选择提供信息。尽管在这一方法得到广泛应用之前还需要进一步的研究,像CorEx这样的算法能够解决肿瘤细胞生物学中令人生畏的复杂性,但我们希望这一趋势很快会得到更多癌症患者的青睐。

ad image
提问
扫一扫
丁香实验小程序二维码
实验小助手
丁香实验公众号二维码
扫码领资料
反馈
TOP
打开小程序