GCBI:基因数据指导精准医疗

如何从「Science」文章中挖掘出新方向

   2015-11-11
字体大小:

经常拜读大牛们发表的《Science》和《Nature》,但是我们可不可以从这些文章中学到精髓,也来发表一篇高分论文呢?

举个例子,比方说发表在《Science》上的这篇文章《The STAT3-Binding Long Noncoding RNA lnc-DC Controls Human Dendritic Cell Differentiation》,我们得知: 抑制 lnc-DC 可破坏体外人类外周血单核细胞以及体内的小鼠骨髓细胞分化为 DC,并减小了 DCs 刺激 T 细胞活化能力。lnc-DC 通过激活转录因子 STAT3 来调节这些效应,lnc-DC 直接结合细胞质中的 STAT3 上,通过阻止 STAT3 结合 SHP1 及脱磷酸作用,提高 STAT3 在 tyrosine-705 上磷酸化。这篇文章主要涉及的内容有树突状细胞的分化和功能,来搜索一下「Dendritic cell differentiation and function」,搜索结果很多,可以设置「影响因子」和「是否拥有样本」缩小范围来进行下一步筛选。如果只是简单的翻阅文章可能理解的还不够深入,我们可以使用文章提供的样本来还原作者的实验思路,甚至还有可能发现更多。

 11.png

图 1 搜索结果及筛选工具

 22.png

图 2 Science 文章及样本界面

OK,就看 Science 这篇文章,文章和样本中提到 Monocytes 经过 6 个时间点分化为 Dendritic Cell,而这批数据通过 HTA 2.0 芯片检测可获得 mRNA、lncRNA 表达数据。根据从 GCBI-Sample 下载的数据 (GSE54143),首先我们可以分析 mRNA、lncRNA 随分化时间而发生表达变化的趋势,同时对 mRNA 进行 GO、Pathway 分析,不仅如此,我们还可以分析 lncRNA 调控 mRNA 的共表达网络,找到核心调控 lncRNA 和 mRNA。

 23.png

图 3 拓展分析思路图

运行方案后稍等 10-20 分钟,就可以查看各部分详细结果并下载完整的结果报告。结果很多,包括刚才提到的显著 mRNA、lncRNA 及其趋势等,而在共表达网络图部分发现一些核心基因 CCL22、TFRC、SELL、IL23A、FOSB。

 33.png

图 4 lncRNA 和 mRNA 共表达网络图

这些基因不了解没关系,接下来再回到知识库以 Immune 为关键词检索文献,发现共有 905027 篇,而与刚才提到的基因相关的文献分别为:CCL22(36 篇)、TFRC(20 篇)、SELL(106 篇)、IL23A(176 篇),而 FOSB 只有 3 篇。通过 Dictionary 查询,发现 FOSB 参与破骨细胞分化信号通路,样本为诱导单核细胞分化为树突状细胞,bingo!然而在 microRNA 部分只有 has-miR-224-5p 已经被验证过,由于最近 ceRNA 研究很热,这可以作为下一个研究课题。

好的,我们来梳理一下:文章提到了转录因子 STAT3 和 lnc-DC 之间的关系,通过对数据的挖掘再分析,发现核心基因 FOSB 以及相关 miRNA,而这些都是文章没有提到同时研究很少,那么我们是不是可以做点什么了?


编辑: wuch    来源:丁香园

了解 GCBI:www.gcbi.com.cn
电话:400-600-4643