|
马上注册,结交更多好友,下载更多分子模拟资源。
您需要 登录 才可以下载或查看,没有帐号?我想注册
x
本帖最后由 西大-song 于 2012-12-27 18:48 编辑
我们在同源建模时候,有一个条件“预测序列和模板序列的一致性?同源性?相似性?需要高于30%”,这里到底是什么经常被大家误读。还有我们分析的两条序列,比对完成后,到底该怎么描述两者的亲缘关系,什么情况下该用同源性,相似性和一致性这三种描述方法?
关于这三个名词的概念,好多同学一直以来都是很模糊的,三者的概念有一定的交叉,所以平时我们在使用的时候经常会出现错误。但是三者还是有着关键的区别的,所表述的意思也是大不相同。
同源性(homology):进化过程中源于同一祖先的分支之间的关系,同源性是来描述物种之间的进化关系的,所以在同源性的表达中只能用“有”或者“无”,对于有同源性的物种可以描述为“部分同源”或者“完全同源”。至于有些同学喜欢说“A和B之间有54%的同源性”,这种说法是错误的,A和B之间要么就是同一个祖先来的(有同源性),要么就不是同一祖先进化来的(没有同源性),同源性百分之多少的说法是错误的,。
相似性(similarity):是指所检测的序列与目标序列之间相同的碱基或氨基酸占整个序列的比例(相对宏观的一个描述)。感谢阿里的提醒,补充一点相似性的内容:在氨基酸序列比对中相似性还包括,除了完全相同的残基外,在对应位置的两个残基是否具有相似的特性,如侧链基团的大小、电荷性、亲疏水性等。比如,我们在氨基酸序列的比对中(以vector NTI为例),完全相同的氨基酸都会被标为黄色,特性相似的氨基酸会被标为绿色。
一致性(identity):是对两条序列间相同位点的一致性程度的描述。(相对精确度更高的一个描述)
三者的关系
同源性(homology)这个概念不能量化,“两条序列具有同源性”或者“不具有同源性”。而相似性(similarity)和一致性(identity)可以看做是从不同的角度对同源性的量化指标,一般地,两条序列之间的相似性(similarity)的程度会大于一致性(identity)的程度。一般来说,序列之间的相似性(similarity)和一致性(identity)越高,序列之间同源的可能性越大。下面这段描述是三者正确的描述。
例:A序列包含有一个1500bp的ORF,通过BLAST,得知该序列与B序列同源,相似性高达94.3%,一致性达89.6%。
所以开始那句话正确的表达是,“预测序列和模板序列的一致性需要高于30%”。
欢迎大家拍砖补充。O(∩_∩)O哈哈哈~ |
|