GCBI:基因数据指导精准医疗

GCBI 带你学测序系列:测序基本分析介绍

   2016-04-25
字体大小:

点击链接查看课程视频>>

本节课将由 GCBI 学院的顾大师主要从测序流程和测序基础分析两个方面为大家分享。

1.png
1 测序流程

下图是一般的测序流程,首先是原始数据通过软件与标准基因组进行序列比对,根据原始数据可以统计每个样本的测序深度和质控情况。另外,根据比对结果,还可以得到 SNP、InDel、SV 检测情况,最后根据数据库得到 SNP、InDel、SV 的注释结果。通过生物信息学的分析,可以找到突变对生物体的影响,可以预测哪些突变与疾病相关。由于测序数据量比较大,通过这样的流程处理 1 个样本需要 1 周的时间,接下来我们看看 GCBI 对此进行了怎样的优化。
2.png
下图为 GCBI 测序分析流程,GCBI 在传统测序流程上进行了改进,从而将测序分析速度提高至 2.5 小时左右。首先是原始数据通过序列比对、去冗余、去重,然后再对数据进行 SNP 或 InDel 的分析。接下来以 SNP 为例,通过 GCBI 快速整合样本数据进行单样本、样本-样本、样本组-样本组的分析,并且还可以快速给出哪些基因发生明显的变化。至于这里面具体的门道就听顾大师给你细讲咯,戳上方视频!

2 测序基础分析

不管是哪种流程都要涉及到原始数据,这里以常用的 Fastq 文件为例。一个 Fastq 文件完整的测序信息包括四行:碱基序列的标签信息、测得的碱基序列、质量序列的标签信息和质量序列。其实这一部分的具体含义,上节课孙教授和顾大师都有讲过,大家可以详看上方视频。

对于测序数据我们都会对其进行质量评估,来评估测序数据的准确性,例如:样本碱基质量、原始测序产量、平均测序深度、转换与颠换比值。那么什么范围内我们认为这份数据比较好呢,详见上方视频。

3.png
如果一条序列,有较多的测序错误的碱基,那么在往标准基因组上比对的时候,就会出现比对不上,或者强行比对上,会对后续的 SNP,INDEL,CNV,SV 的检测结果造成影响,使得假阳性的结果增多,所以需要对数据进行过滤。

每周四晚八点,GCBI 带你学测序系列课程在线直播,点击链接立即报名听课>>

GCBI 周年庆第二波大礼正在派送中,4 月 18 日至 5 月 1 日,开通半年分析实验室账户,即可获得 ipad mini4 或 iwatch 一部。

4.jpg

编辑: qimx    来源:丁香园

了解 GCBI:www.gcbi.com.cn
电话:400-600-4643