1.RNA Ontology Consortium简介RNA本体联盟(RNA Ontology ConsortiumROC)是用来搭建一个整合的概念架构-RNA本体( OntologyRO)-用它来理解RNA在生物学上的功能用它进行RNA生物学、化学以及基因组学前沿研究。确切的目标就是创建一套有关RNA兼容的结构、具有动态形式的控制字汇和分类系统,这些都是以RNA序列、次级结构以及三维结构为基础。 ...
1. Functional_RNAsa. Non-Coding RNA databaseNon-translatable RNA transcripts that appear to work at the RNA level. b. RfamDatabase of structure-annotated multiple sequence alignments covariance models ...
COBALT is a multiple sequence alignment tool that finds a collection of pairwise constraints derived from conserved domain database protein motif database and sequence similarity using RPS-Blast BLAST ...
蛋白质结构预测 一、蛋白质结构及其数据库 一般情况下,蛋白质的结构分为4个层次:初级结构–蛋白质序列;二级结构–а-螺旋和β-折叠片(β-sheets)模式;三级结构–残基在空间的布局;四级结构–蛋白质之间的互作。近年来,另一个介于二级和三级结构之间的蛋白质结构层次–所谓蛋白质折叠(fold)已被证明非常有用。”fold”描述的是二级结构元素的混合组合方式。 根据序列或多序 ...
蛋白质功能预测 一、根据序列预测功能的一般过程如果序列重叠群(contig)包含有蛋白质编码区,则接下来的分析任务是确定表达产物–蛋白质的功能。蛋白质的许多特性可直接从序列上分析获得,如疏水性,它可以用于预测序列是否跨膜螺旋(transmenbrane helix)或是前导序列(leader sequence)。但是,总的来说,我们根据序列预测蛋白质功能的唯一方法是通过数据库搜寻,比较该蛋白是 ...
多序列比对的数据库多序列比对的意义在于它能够把不同种属的相关序列的比对结果按照特定的格式输出,并且在一定程度上反映它们之间的相似性。多序列比对结果所提供的信息对于提高数据库搜索灵敏度也具有很大帮助。因此,方便实用的多序列比对数据库也就应运而生。目前,互联网上可用的多序列比对数据库已经不少。其中一些利用计算机程序将一次数据库按家族分类;另外一些则是通过手工或自动方法根据基因家族构建二次数据库。 ...
多序列比对 简介:双序列比对是序列分析的基础。然而,对于构成基因家族的成组的序列来说,我们要建立多个序列之间的关系,这样才能揭示整个基因家族的特征。多序列比对在阐明一组相关序列的重要生物学模式方面起着相当重要的作用。多序列比对有时用来区分一组序列之间的差异,但其主要用于描述一组序列之间的相似性关系,以便对一个基因家族的特征有一个简明扼要的了解。与双序列比对一样,多序列比对的方法建立在某个数学或生物 ...
比对方法 1.手工比对方法手工比对方法在文献中经常看到。因为难免加入一些主观因素,手工比对通常被认为有很大的随意性。其实,即使用计算机程序进行自动比对,所得结果中的片面性也不能予以忽视。在运行经过测试并具有比较高的可信度的计算机程序基础上,结合实验结果或文献资料,对多序列比对结果进行手工修饰,应该说是非常必要的多序列比对的软件已经有许多,其中一些带有编辑程序。最好的办法是将自动比对程序和编 ...
核酸与蛋白质结构和功能的预测分析人们获得各种核酸和蛋白质序列的目的是了解这个序列在生物体中充当了怎样的角色。例如,DNA序列中重复片段、编码区、启动子、内含子/外显子、转录调控因子结合位点等信息;蛋白质的分子量、等电点、二级结构、三级结构、四级结构、膜蛋白的跨膜区段、酶的活性位点、以及蛋白质之间相互作用等结构和功能信息。虽然用实验的方法是多年以来解决这类问题的主要途径,但新的思路是利用已有的对生物 ...
生物信息数据库与查询近年来大量生物学实验的数据积累,形成了当前数以百计的生物信息数据库。它们各自按一定的目标收集和整理生物学实验数据,并提供相关的数据查询、数据处理的服务。随着因特网的普及,这些数据库大多可以通过网络来访问,或者通过网络下载。一般而言,这些生物信息数据库可以分为一级数据库和二级数据库。一级数据库的数据都直接来源于实验获得的原始数据,只经过简单的归类整理和注释;二级数据库是在一级数据 ...
概述当前人类基因组研究已进入一个重要时期,2000年将获得人类基因组的全部序列,这是基因组研究的转折点和关键时刻,意味着人类基因组的研究将全面进入信息提取和数据分析阶段,即生物信息学发挥重要作用的阶段。到1999年12月15日发布的第115版为止,GenBank中的DNA碱基数目已达46亿5千万,DNA序列数目达到535万;其中EST序列超过339万条; UniGene的数目已达到7万个;已有25 ...
Blast(Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。Blast中常用的程序介绍:1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知 ...
我在此介绍几个进化树分析及其相关软件的使用和应用范围。这几个软件分别是PHYLIP、PUZZLE、PAUP、TREEVIEW、CLUSTALX和PHYLO-WIN(LINUX)。在介绍软件之前,我先简要地叙述一下有关进化树分析的一些方法学问题。进化树也称种系树,英文名叫“Phyligenetic tree”。对于一个完整的进化树分析需要以下几个步骤:⑴ 要对所分析的多序列目标进行排列(To ali ...
COBALT是一个蛋白的多序列比对工具,也用到RPS-Blast BLASTP 和PHI-BLAST等工具,并且也用到了conserved domain database (CDD) 和PROSITE protein-motif database来保证COBALT比对结果的质量。关于在线COBALT的用法看另一篇文章” COBALT:NCBI在线蛋白多序列比对(比ClustalW还强大的工具) ...
酶切图谱(Macrorestriction Map):描述限制性内切酶的酶切点的位置和距离信息的图谱。这里简单介绍一下用DanMan软件怎样做限制性酸切图。这是以前上生物信息学(选修课来着)这门课程时学到的。我并不需要用到这些,所以对于这个没有深入研究。这里只是简单介绍一下做酶母菌质粒的酶切图。有不对的请指出。画酶切图基本的思路就是,找到全长的序列(最好是GenBank格式),然后借助软件画图。就 ...
序列的Fasta格式是最经常看到的格式之一。下面简介说明一下什么是FASTA格式。Fasta格式开始于一个标识符:"",然后是一行描述,下面是一行行的序列。每一行最好不要超过80个字母。如:gi|532319|pir|TVFV2E|TVFV2E envelope proteinELRLRYCAPAGFALLKCNDADYDGFKTNCSNVSVVHCTNLMNTTVTTGLLLNGSYSENRTQ ...
CLUSTAL-X是一个图形化的多序列比对工具,利用这个工具可以对数据进行比对,除掉结构相同的或者只有个别碱基序列不同的序列,最后对保留的结果得到最后对保留的结果得到“.phy”格式文件。PHYLIP软件是一个免费的集成的进化分析工具,有华盛顿大学遗传学系Joseph felsenstein 编写,1980年首次释放,目前已经升级到3.6.7版本。PHYLIP包含了35个程序,这些程序基本上囊括了 ...
大家好:我在此介绍几个进化树分析及其相关软件的使用和应用范围。这几个软件分别是PHYLIP、PUZZLE、PAUP、TREEVIEW、CLUSTALX和PHYLO-WIN(LINUX)。在介绍软件之前,我先简要地叙述一下有关进化树分析的一些方法学问题。进化树也称种系树,英文名叫“Phyligenetic tree”。对于一个完整的进化树分析需要以下几个步骤:⑴ 要对所分析的多序列目标进行排列(To ...
20世纪后期,生物科学技术迅猛发展,无论从数量上还是从质量上都极大地丰富了生物科学的数据资源。数据资源的急剧膨胀迫使人们寻求一种强有力的工具去组织这些数据,以利于储存、加工和进一步利用。而海量的生物学数据中必然蕴含着重要的生物学规律,这些规律将是解释生命之谜的关键,人们同样需要一种强有力的工具来协助人脑完成对这些数据的分析工作。另一方面,以数据分析、处理为本质的计算机科学技术和网络技术迅猛发展?并 ...
生物学与信息科学是当今世界上发展最迅速、影响最大的两门科学。而这两门科学的交叉融合形成了广义的生物信息学,正以崭新的理念吸引着科学家的注意。生物信息学(Bioinformatics)是生命科学领域中的新兴学科,面对人类基因组计划所产生的庞大的分子生物学信息,生物信息学的重要性将越来越突出,它无疑将会为生命科学的研究带来革命性的变革。 生命现象是在信息控制下不同层次上的物质、能量与信息的交换与传递 ...