【经验宝典】别老说看文献,你到底从文献里看出什么了!
常常喊看文献看文献,到处都在讲文献,可是文献不应该看完就完了。今天给大家来点干货,来讲一讲如何从一篇文章中获得新的研究思路。
比方说这篇发表于《nature communications》的《Enriched variations in TEKT4 and breast cancer resistance to paclitaxel》,文章显示,使用外显子组测序与预处理活检相比,发现有两种 TEKT4 种系变异富集于治疗后的肿瘤中。在独立的一组 84 对样本中,研究人员发现 10% 的化疗前后发生了 TEKT4 变异。异位表达 TEKT4 变异体可通过降低微管稳定性,引起乳腺癌对紫杉醇耐药。
使用 GCBI 来重新解读文章,让我们看看在应用 GCBI 的各部分功能模块时会为我们带来哪些不一样的新思路,去完成我们自己的 story。
首先,通过在 GCBI-Pubmed 上搜索到了 31 篇关于 TEKT4 基因的文章,然而搜索 TEKT4+breast cancer 只有一篇文章,说明在乳腺癌研究中对 TEKT4 基因的关注较少,而且多数还是以小鼠为研究模型。
接着在 GCBI-Dictionary 搜索 TEKT4 基因,发现了 3 个同源序列分别是人、大鼠和小鼠。而注释信息 (Ontology) 显示该基因与组织细胞投影 (cell projection organization) 有关。在 OMIM 数据库中发现 TEKT4 基因有备案,但没有具体信息。令人惊喜的是, 在 microRNA 信息中只有一个 miRNA 即 has-miR-335-5p 是被实验验证过的 TEKT4 靶基因,文章中并没有提到,然而在 GCBI 继续查询这个 miRNA,发现与乳腺癌转移密切相关 (PMID: 18185580 ,Impact Factor: 38.597),那我们可不可以尝试将命题再深入一下呢?
图1 基因 TEKT4 的相关信息
在 GCBI-Sample 搜索 paclitaxel breast cancer 选择了一篇以紫杉醇作为化疗药物而化疗前后患者的症状是否减轻的文章 (PMID: 20068102 Impact Factor: 7.837),样本信息发送到我们在 GC-Lab 建立的实验室,这里导入的是“Affymetrix Human Genome U133 Plus 2.0 Array”的数据,来看看从乳腺癌表达谱数据中能够得到什么新启发。
值得一提的是,在 GC-Lab 里首页上,可以点击进入示范实验室,这里提供了 21 套常见分析方案,包括:两分组和趋势性分组,mRNA、microRNA、lncRNA 的研究方案,基础和深入分析方案。这些方案以人、大小鼠为例,覆盖了实验数据中各种常见分析方案。除了可以了解各种类型实验分析流程,还可以查看每个分析节点的结果呈现,但是,在示范实验室只能查看不能更改任何设置。点击设计方案界面的右上角“更多”,可以“复制方案到项目”,将方案借鉴到我们实验室直接使用。
图 2 GC-Lab 示范实验室
设计的方案思路如下:通过实验组和对照组得到差异基因,接着进行注释 (GO-Analysis) 和通路分析 (Pathway-Analysis),其交集基因进行挑选核心基因的网络分析 (Signal-Net)。
图 3 分析方案思路图
回到实验室,打开设置好的方案,导入样本并设置好参数后,点击执行。大约 10-20 分钟后,即可得到结果。
很遗憾的是我们在差异结果中没能找到 TEKT4,但我们可以重新对数据的分析,如 Signal-Net 得到在乳腺癌中起到核心调控作用的基因或蛋白。
图 4 GC-Lab 生成的部分 Signal-Net
我们使用其明芯片检测平台发现 HTA2.0 等四款芯片里有 TEKT4,但还没应用在乳腺癌上的芯片公共数据。
图 5 其明芯片检测平台
这时您可能会产生一个疑问:同样是研究乳腺癌,外显子组测序得到 TEKT4 基因,然而研究 has-miR-335-5p 的文章使用表达谱芯片 (U133) 进行分析却没有发现 TEKT4?这是因为外显子组测序对躲在基因间隙的 miRNA 没有很好的检测效果,而 U133 芯片由于芯片设计的问题不能检测到 TEKT4。那么,我们使用这样的方法使用高通量数据进行「has-miR-335-5p+ TEKT4」的联合分析。
根据上述数据结果,大概有以下几个思路:
● 将紫杉醇处理乳腺癌的基因表达谱数据与 miRNA 高通量数据联合分析,探讨 has-miR-335-5p 调控靶基因时是否有与 TEKT4 拥有同一调控作用和同一通路的基因。
● 我们知道组织细胞投影、微管细胞骨架组织是 TEKT4 基因的注释信息,那么通过查找和这些注释和通路有关的基因,是不是就可能对 TEKT4 基因的机制进行进一步探讨。
● 根据 Signal-net 挑选出位于核心调控地位的基因或蛋白,可以看看是哪些基因、蛋白或者转录因子在紫杉醇治疗乳腺癌过程中起到核心调控作用。
最后,让我们一起整理一下思路:我们在使用 GCBI 重新解读一篇文章时,Pubmed、Dictionary、Sample 是环环相扣的,从文章找到基因——基因的分析——样本的选择——GC-Lab 快速分析等改变了我们以往对一篇文章的认知,我们发现生物信息其实可以很简单,不再有脚本、代码的困扰,大数据平台帮我们解决了问题。不知不觉中,GCBI 缩短了处理数据的时间,尤其是节约了探索过程所消耗的时间成本,这就是 GCBI 的魅力所在。