真核 mRNA 测序分析的研究对象为特定细胞在某一功能状态下所能转录出来的所有 mRNA 的总和。转录组研究是基因功能及结构研究的基础和出发点,通过新一代高通量测序,能够全面快速地获得某一物种特定组织或器官在某一状态下的几乎所有转录本序列信息!
有参转录组测序:对有参考序列的物种利用双端测序技术对 mRNA 进行测序,通过与参考序列进行比对,统计基因的表达量,并进行差异分析和功能富集分析,同时可以进行可变剪切分析,并预测新的转录本。
无参转录组测序:对没有参考序列的物种利用双端测序技术对 mRNA 进行测序,利用 Trinity 软件拼接序列,组装获得的转录本作为参考序列,对基因的表达量进行统计,并进行差异分析和功能富集分析。
表达谱测序:必须有参考序列,利用单末端测序技术对 mRNA 测序,通过与参考序列进行比对,统计基因的表达量,并进行差异分析和功能富集分析。
注:如样本数>10,需延长项目周期
有参转录组标准信息分析
(1) 对原始数据进行去除接头、污染序列及低质量 reads 的处理;
(2) 测序评估:比对统计、测序随机性评估、比对上序列在染色体的分布、比对上序列在基因区域的分布、比对结果可视化;
(3) 基因表达注释:基因表达量、表达量分布、样品聚类;
(4) 基因差异表达分析;
(5) 差异基因表达模式聚类分析;
(6) 差异表达基因 GO 功能显著性富集分析:GO 子类统计、GO 富集分析、富集 GO q 值分布;
(7) 差异表达基因 Pathway 显著性富集分析:KO 富集分析、富集 KO q 值分布、通路结果注释;
(8) 基因的可变剪接分析:可变剪接鉴定、统计、表达量分析;
(9) 预测新转录本:新转录本注释、表达量统计、差异分析;
(10) SNP 分析;
(11) 蛋白质互作网络分析。
无参转录组标准信息分析
(1) 对原始数据进行去除接头、污染序列及低质量 reads 的处理;
(2) 数据产出统计及测序数据的碱基含量和质量评估;
(3) 组装结果分析:组装结果统计及转录本长度分布;
(4) 组装结果评估:
●I 比对率分析、均一性分析;
●II 组装准确性评估、组装结果注释比例评估、Reads 利用率及嵌合体比例评估、核心蛋白比率评估。
(5) 预测编码蛋白框(CDS);
(6) Unigene 功能注释;
(7) Unigene 的 COG 分类;
(8) Unigene 的 GO 分类;
(9) Unigene 代谢通路分析;
(10) Unigene 表达量分析:Unigene 的表达量估计及其分布统计,实验样品的聚类;
(11) Unigene 表达差异分析;
(12) 差异表达的 Unigene 结果统计:数目统计、聚类分析、组间差异表达的 Unigene 分布统计;
(13) 差异表达的 Unigene GO 分类和 Pathway 富集性分析;
(14) 差异表达的 Unigene 功能注释;
(15) SNP 分析;
(16) SSR 分析与引物设计。
数字基因表达谱标准信息分析
(1) 对原始数据进行去除接头、污染序列及低质量 reads 的处理;
(2) 测序评估:比对统计、测序随机性评估、比对上序列在染色体的分布、比对上序列在基因区域的分布、比对结果可视化;
(3) 基因表达注释:基因表达量、表达量分布、样品实验聚类;
(4) 基因差异表达分析;
(5) 差异基因表达模式聚类分析;
(6) 差异表达基因 GO 功能显著性富集分析:GO 子类统计、GO 富集分析、富集 GO q 值分布;
(7) 差异表达基因 Pathway 显著性富集分析:KO 富集分析、富集 KO q 值分布、通路结果注释;
(8) 蛋白质互作网络分析。
(1)样品类型:去蛋白并进行 DNase 处理后的完整总 RNA;
(2)样品需求量:植物和真菌样品 ≥ 10 μg;人、大鼠、小鼠样品 ≥ 2 μg;其他类型动物 ≥ 5 μg;
(3)样品浓度:植物和真菌样品 ≥ 250ng/μl;人、大鼠、小鼠样品 ≥ 65ng/μl;其它类型动物样品 ≥ 150ng/μl;
(4)样品纯度:OD260/280 = 1.8~2.2;OD260/230 = 1.8~2.2;动物样品 RIN ≥ 7.0,植物样品 RIN ≥ 6.5,28S:18S ≥ 1.0;昆虫样本无此指标。