GCBI:基因数据指导精准医疗

GCBI 带你学测序系列:测序原始数据介绍

   2016-04-25
字体大小:

点击链接查看 课程视频>>

本节课由 GCBI 的孙教授详细的给大家讲解测序的深度以及原始数据到底是什么、数据量的衡量标准等,也会解答大家最常见的问题就是样本测序该如何选择合适的测序数据量和测序深度,绝对的防骗实用课程!

首先给大家介绍基础概念:PE:Pair end,即检测过程中分别从同一条序列的两端进行测序;SE:Single end,即从序列的一端开始测序。

那么在什么情况下选择 PE 或 SE 呢?

通常我们都希望测序 Reads 读长,越长越好,这样有利于后续分析,因此目前倾向于 PE;而选择 SE 的情况比方说小 RNA 测序,SE 可以满足这一需求。

6.png
而下一组概念,Gb 和 GB,大家常常会搞混。Gb:是指在测序过程中测到的基因碱基数量;GB,是指一种储存单位,即文件大小。搞清楚两者定义后,那么什么时候说的是 Gb or GB 呢?快看视频吧!

7.png
这两个概念是在数据质量评估常用的。Q30:碱基识别正确率 99.9%;Q20:碱基识别正确率 99%。实际应用中,应该如何用两者去评估数据呢? 快看视频吧!

8.png
另外,还有两组概念:转换和颠换、fasta 和 fastaq,这两组分别代表了什么,在测序过程中有什么用呢?快看视频吧!

最后一个介绍的概念是测序深度,小伙伴常常容易糊涂的概念。

测序深度:测序得到的碱基总量(bp)与基因组大小(Genome)的比值,常用 X(读作层) 来表示,例如 30X,就是平均每个碱基覆盖 30 次的碱基总量。那么我们在选择测序检测时,应该选择多少覆盖深度比较好呢,例如全基因组冲侧向、外显子捕获测序?有什么参考的标准呢?看视频吧!

如何来评估测序数据的质量呢?每个参数代表了什么意义呢?孙教授在视频中讲解的非常清楚,所以请大家认真的看视频吧!
每周四晚八点,GCBI 带你学测序系列课程在线直播,点击链接立即 报名听课>>


编辑: qimx    来源:丁香园

了解 GCBI:www.gcbi.com.cn
电话:400-600-4643