免疫组库测序技术分析策略
分析流程:
1、测序数据下机后,首先对下机数据进行质控。
2、参考序列的构建:采用IMGT数据库中所有V/D/J germline序列与特异性的引物比对。
3、将下机数据paired end reads拼接成一整条contig,merged后的contig即是测到的受体的重组基因序列。
4、使用对比程序将clean data与IMGT免疫细胞受体库的V\D\J基因比对,搜索相应的基因片段。
5、为确保结果的高准确度,在完成初步比对后,将比对序列再次与数据库做重比对,以寻找精确的V\D\J基因片段和序列的位点。
6、在比对分析鉴定出测序数据对应的基因片段后,即可分析测序数据的序列结构特征。由于华大的流程中使用了重比对的方法,对比结果的准确性较高,因此,碱基插入缺失的检出率也更加准确。
免疫组库测序信息分析内容:
1、基本数据统计
1)数据过滤,对原始数据进行去除接头污染序列及低质量reads的处理
2)数据搭建,数据拼接,消除测序背景及有效数据构建
3)数据统计,数据产出统计及测序数据的成分和质量评估
2、数据比对分析
1)比对分析,与数据库(IMGT)V/D/J基因片段比对
2)重新比对,寻找最佳V/D/J比对结果
3)比对结果分析,与数据库(IMGT)比对去掉无效序列(未比对、假基因、终止子、无开放阅读框)和Primer
3、序列结构分析
1)分析CDR序列组成及序列碱基成分
2)分析CDR序列的碱基插入和缺失
3)编码CDR序列翻译成氨基酸和肽链
4、免疫组库构建
1)构建免疫组库表达谱,统计多样性抗体库克隆表达情况
2)免疫组库多样性呈现,绘制V/J基因表达的2D、3D图
信息分析内容正在升级中,敬请期待!我们也可结合客户的需求,协商定制化信息分析内容。