NextGENe 提供了新一代大规模基因测序工程的整套软件解决方案,用于实现序列装配和序列比对,同时用于DNA序列的SNP/Indel检测以及Digital Expression Analysis。此软件主要处理新一代测序仪器Roche 454系统以及Illumina的Solexa系统以及ABI的SOLiD系统(即fasta和cfasta格式的数据),其数据的特点是数据量大,且序列长度较短,这给序列装配(Assembly)工作增加了难度和复杂度。目前世界上对于新一代测序仪器产生的序列分析工作还没有很好的解决办法,而NextGENe软件给出的完善的解决方案将填补这一空白。
NextGENe功能介绍:
Condensation Assembly Tool (CAT)
* 根据关键字对原始序列分组
* 利用统计学原理发现变异以及去除原始输入错误
* 拼接原始短序成为更长更精确的序列和所有的序列拼装工具一样,CAT的目标是对原始短序通过分析及统计,并得到合适长度的更精确的序列,为下一步的使用做准备。新一代测序仪器得到的短序,由于序列长度较短(36-200碱基),一般难以在原始基因中唯一定位。为了解决这一难题,CAT首先根据关键字(一般12碱基)对原始序列进行分组,包含某一关键字的所有短序会根据左右外延的统计结果被分成若干组,每一子组可以得到一个更长更精确的序列。
NextGENe解决方案:
1、Condensation Assembly
有效地对原始序列进行过滤和除错,并将原始序列扩展到2-4倍的长度。
2、Assembler
在Condensation Assembly的基础之上进行序列拼接,可以得到几倍甚至几十倍于原始序列的组装参考序列。
3、Sequence Alignment
具备强大的界面显示和报表输出功能,可以分析序列比对结果,查看变异信息等。这三个主功能相互配合,使得对于新一代序列分析工作变得更加简易、高效和准确。
GENe应用范围:
*人类及其他基因组测 序工程
*序列装配
*序列比对和分析
*医学领域疾病检查和 基因缺陷分析等
NextGENe主要应用:
NextGENe对新一代测序系统都提供软件支持包括Illumina Genome Analyzer, the Applied Biosystem SOLiD™ System 以及the Genome Sequencer FLX System from Roche Applied Science。
* 创造性地引入Condensation算法,采用数理统计学的原理,有效地去除原始数据中的错误,并使得发现SNP更加容易,取得了世界性里程碑式的进展
* 序列装配过程中,可以有效地过滤和识别较短的“Repeat”,提高装配的正确率和组装长度
* 使用两组方法进行序列比对:BLAST算法以及SoftGenetics’ Alignment算法,其中SoftGenetics’s Alignment算法是自主创新的全新序列比对算法,准确性更高
* 提供完美的序列比对可视化界面,并具备强大的报表输出功能
* 支持任意大小基因组的拼接(仅受内存限制)和比对
* 支持多种序列数据文件格式的处理,尤其是加入了对SOLiD数据格式的处理
* 支持批量任务处理,自动化程度高,高效简练
* 提供两种选项设置选择,既有复杂的高级选项,也有方便易懂的简易选项设置
* 算法高效,支持多线程,提高CPU的利用率和运算速度
* 提供一些对用户十分有用的工具,如序列文件格式转换、文件分割合并、文件过滤等