时间序列分析:分析不同的基因或蛋白表达水平随时间表现出怎样的动力学特征
时间序列分析介绍
能够识别表达谱的潜在时间序列表达模式,并将相似模式的基因聚类,以帮助我们了解基因的动态模式以及它们功能的联系。
示例
不同代谢物的浓度随时间变化情况。一些分子在运动后增加并迅速恢复到基线水平(Cluster 1),而其他一些分子在运动后出现延迟增加,然后恢复到基线水平(Cluster 2)。其余的分子在运动响应中减少,其中一些在1小时内恢复到基线水平(Cluster 3),而另一些则在恢复期间继续下降(Cluster 4)。
参考文献:Cell 181, 1112–1130, May 28, 2020
主成分分析:可视化样本间差异
主成分分析介绍
主成分分析是一种常用的数据分析方法,用于降低数据的维度和提取主要信息。通过主成分分析,可以将多个相关变量转化为少数几个不相关的主成分,这些主成分可以解释原始数据的大部分变异。可用于数据简化、样本聚类等。
示例
213个微阵列数据集的PCA图。早期胚胎(n= 17,绿色),中期胚胎(n= 39,黑色),晚期胚胎(n=26,橙色),新生时期胚胎 (n= 16,蓝色)和成年时期胚胎(n = 114,红色)。
参考文献:Cell Reports 13, 1705–1716, November 24, 2015
气泡图:可视化展示基因功能富集分析
气泡图介绍
气泡图用于展示不同处理下基因富集状况,其以直观形式展现结果,可助于:揭示处理对基因富集的作用;比较各处理组间差异;它为综合分析基因富集提供便利,利于快速洞察相关模式与趋势,为后续研究与决策提供参考。
示例
血浆代谢物和复合脂质的途径/化学类富集分析。通路方向是每个通路中重要分子相对于基线的中位数log2倍变化(蓝色,下调;红色,上调)。点的大小表示通路显著性。
参考文献:Cell 181, 1112–1130, May 28, 2020
热图: 根据基因表达模式将样本聚类
热图依据基因表达情况对样本聚类,能可视化表达差异,揭示样本间相关性,精简数据并发现模式,为后续分析提供方向。
示例
不同样本之间显著差异表达的线粒体基因表达谱。
参考文献:Cell 183, 1185–1201, November 25, 2020
以网络的形式可视化基因功能富集分析
基因功能富集分析是一种用于探究大量基因所涉及的生物学过程、分子功能和细胞组件的方法。它基于特定的基因集,与已知的功能注释数据库进行对比,以统计显著富集的功能类别。该分析在转录组学、基因组学等研究中有广泛应用,可帮助理解基因的功能和作用机制,发现潜在的生物学过程和通路,为疾病相关基因研究提供线索,为进一步实验研究指明方向。
示例
KEGG通路使用网络框架进行整合,如果两个通路共享大量基因,则它们之间通过边缘连接。在两个或多个组织中显示出失调的通路。通路的上下调节由节点颜色编码,多个组织失调的通路被映射到更大的节点大小。
参考文献:Cell 183, 1185–1201, November 25, 2020
多组学联合分析
联合转录组、蛋白组与代谢组分析是一种综合性的多组学研究手段。它旨在通过对不同层面生物分子的探究,以全方位把握生物系统的功能与状态。转录组分析聚焦于基因的转录表达情形,蛋白组分析揭示蛋白质的表达与修饰情况,而代谢组分析则着重于小分子代谢产物的研究。此种联合分析的优势在于其全面性,能提供更为完备的生物系统信息;不同组学数据间可相互补充与印证,有助于深入解析基因表达、蛋白质功能与代谢产物间的关联,从而更好地理解生物学过程;在疾病研究领域,对疾病的诊断、机制探索和治疗靶点的发现具有重要意义;在药物研发中,可为药物的作用机制和药效评估提供有价值的线索。
使用Escher包可视化在肌肉中碳水化合物相关代谢图。
参考文献:Cell 183, 1185–1201, November 25, 2020
蛋白互作网络分析
蛋白质互作网络(PPI, Protein-Protein Interaction Networks)是由蛋白通过彼此之间的相互作用构成,来参与生物信号传递、基因表达调节、能量和物质代谢及细胞周期调控等生命过程的各个环节。系统分析大量蛋白在生物系统中的相互作用关系,对了解生物系统中蛋白质的工作原理,了解疾病等特殊生理状态下生物信号和能量物质代谢的反应机制,以及了解蛋白之间的功能联系都有重要意义。
示例
对75个转录和染色质相关基因的STRING分析揭示了一个由35个基因产物组成的蛋白质相互作用网络,其中CREBBP和EP300位于网络中心。没有参与任何相互作用的基因也被显示出来(底部)。
参考文献:NATUR GENETICS | VOL 52 | OCTOBER 2020 | 1024–1035 |
相关性热图:基因/代谢物/样本间相关性分析
可直观展示不同变量之间的相关性的图表;它可以帮助我们发现变量之间的关联模式,比如某些因素之间的正相关或负相关关系。这对研究、诊断和治疗等都有重要的参考价值。
示例
热图中红色代表正相关,蓝色代表互相关。不仅可以发现代谢物之间的相关性,还能清楚的显示代谢物的分组信息。
参考文献:Cell 183, 1185–1201, November 25, 2020
KEGG pathway分析
通过对通路中基因、蛋白质等的分析,能了解生物过程的分子机制
类固醇激素生物合成途径,代谢产物在妊娠过程中增加(红色)或减少(蓝色)。
参考文献: Cell 183, 1185–1201, November 25, 2020
火山图,选择性展示样本间差异表达基因
火山图在选择性展示样本间差异表达基因时,就像是一座“山峰”,纵轴表示基因表达差异的程度,横轴表示差异的显著性。通过它,可以快速发现那些表达差异显著的基因,为进一步研究提供线索。同时,也能帮助我们更好地理解疾病发生发展过程中基因表达的变化情况。
X轴负轴表示实验组与对照组相比下调的基因,正轴代表上调的基因。横坐标代表差异变化倍数,纵坐标表示p值。
参考文献: 2 1 4 | N A T U R E | V O L 5 7 1 | 1 1 J U LY 2 0 1 9
加权基因共表达网络分析
WGCNA(Weighted Gene Co-Expression Network Analysis ),即加权基因共表达网络分析,用于寻找高度相关的基因构成的基因模块module,利用模块特征基因eigengene(模块内第一主成分)或模块内的关键基因Hub gene来总结这些模块,将模块与样本性状进行关联。可发现潜在的基因模块、寻找疾病相关基因、预测基因功能、药物靶点筛选;
WGCNA鉴定出8个基因簇,在y轴上用不同颜色表示。它们与临床测量的相关性以红框表示正相关,蓝框表示负相关。不同模块中的基因做功能富集分析。
参考文献:Circulation. 2021;143:120–134. DOI:10.1161/CIRCULATIONAHA.120.050498
单细胞分析:细胞分群,拟时间分析,差异基因分析,细胞间交互作用(细胞通讯)分析
它可以帮助我们解析细胞异质性,揭示疾病发生发展过程中不同细胞类型的变化。通过对单细胞的转录组、蛋白质组等进行分析,能够发现新的疾病标志物和治疗靶点,为精准医疗提供有力支持。同时,单细胞分析还能用于研究肿瘤微环境、免疫细胞功能等,为疾病机制的深入理解和个性化治疗方案的制定提供重要依据。
参考文献:Developmental Cell 53, 102–116, April 6, 2020
染色质可及性分析:表观遗传层面探究基因表达
染色体可及性分析就像是在探索染色体的“秘密通道”它可以检测染色体上不同区域的可接触程度。从表观遗传修饰角度展示基因表达情况。
展示目标基因在不同分组中的染色质可及性及启动子H3K27乙酰化修饰丰度
参考文献:Science 372, 201–205 (2021)
Chip-seq分析:表观遗传层面探究基因表达
它可以通过检测与特定蛋白质结合的 DNA 片段,来确定蛋白质在基因组上的结合位点。这在医学领域有着广泛的应用,比如研究基因调控、发现新的疾病相关基因等。
可视化具体某一个基因表观修饰丰度
参考文献:Science 372, 201–205 (2021)
转录因子分析:分析基因上游转录因子
转录因子分析就像是在解开基因表达的“密码”它可以帮助我们了解转录因子如何与 DNA 相互作用,调控基因的转录过程。这对于研究疾病的发生机制、寻找潜在的治疗靶点都非常重要。
展示不同转录因子motif
参考文献:3 8 4 | n A T u R e | V O L 5 4 6 | 1 5 J u n e 2 0 1 7
绘制图文摘要:投稿时需要绘制图文摘要
可助于快速传达研究的要点,让科研人员更容易理解和记忆。主要可实现的目的:快速传达研究方向、增强理解和记忆、提高研究影响力、辅助论文发表和推广;
文章需要一个图文摘要
参考文献:Cell 181, 1112–1130, May 28, 2020
韦恩图:取不同实验分组中交集或者差异基因
韦恩图介绍
韦恩图可以用于比较不同组的数据、分析基因表达的重叠情况等,能够帮助我们更好的理解和研究各种现象;主要可实现的目的:展示数据的重叠与差异、辅助数据分析与比较、发现潜在的关联或模式;
展示不同实验分组共有的基因及差异基因
Cell 183, 1185–1201, November 25, 2020