关于同源性,相似性和一致性的辨析
本帖最后由 西大-song 于 2012-12-27 18:48 编辑我们在同源建模时候,有一个条件“预测序列和模板序列的一致性?同源性?相似性?需要高于30%”,这里到底是什么经常被大家误读。还有我们分析的两条序列,比对完成后,到底该怎么描述两者的亲缘关系,什么情况下该用同源性,相似性和一致性这三种描述方法?
关于这三个名词的概念,好多同学一直以来都是很模糊的,三者的概念有一定的交叉,所以平时我们在使用的时候经常会出现错误。但是三者还是有着关键的区别的,所表述的意思也是大不相同。
同源性(homology):进化过程中源于同一祖先的分支之间的关系,同源性是来描述物种之间的进化关系的,所以在同源性的表达中只能用“有”或者“无”,对于有同源性的物种可以描述为“部分同源”或者“完全同源”。至于有些同学喜欢说“A和B之间有54%的同源性”,这种说法是错误的,A和B之间要么就是同一个祖先来的(有同源性),要么就不是同一祖先进化来的(没有同源性),同源性百分之多少的说法是错误的,。
相似性(similarity):是指所检测的序列与目标序列之间相同的碱基或氨基酸占整个序列的比例(相对宏观的一个描述)。感谢阿里的提醒,补充一点相似性的内容:在氨基酸序列比对中相似性还包括,除了完全相同的残基外,在对应位置的两个残基是否具有相似的特性,如侧链基团的大小、电荷性、亲疏水性等。比如,我们在氨基酸序列的比对中(以vector NTI为例),完全相同的氨基酸都会被标为黄色,特性相似的氨基酸会被标为绿色。
一致性(identity):是对两条序列间相同位点的一致性程度的描述。(相对精确度更高的一个描述)
三者的关系
同源性(homology)这个概念不能量化,“两条序列具有同源性”或者“不具有同源性”。而相似性(similarity)和一致性(identity)可以看做是从不同的角度对同源性的量化指标,一般地,两条序列之间的相似性(similarity)的程度会大于一致性(identity)的程度。一般来说,序列之间的相似性(similarity)和一致性(identity)越高,序列之间同源的可能性越大。下面这段描述是三者正确的描述。
例:A序列包含有一个1500bp的ORF,通过BLAST,得知该序列与B序列同源,相似性高达94.3%,一致性达89.6%。
所以开始那句话正确的表达是,“预测序列和模板序列的一致性需要高于30%”。
欢迎大家拍砖补充。O(∩_∩)O哈哈哈~ 好贴啊正在学这方面的东西 好贴啊正在学这方面的东西 以前也有点模糊,现在终于明白了。非常好的帖子。 song同学写的好啊!哈哈~但是有个基本的问题需要指出来,就是相似性和一致性的差别并不在于一个宏观,一个精确,相似性是指在蛋白质序列比对中除了完全相同的残基外,在对应位置的两个残基是否具有相似的特性,如侧链基团的大小、电荷性、亲疏水性等。因此,两个序列的相似性是一定大于一致性的! 大工-阿里巴巴 发表于 2012-12-26 12:27 static/image/common/back.gif
song同学写的好啊!哈哈~但是有个基本的问题需要指出来,就是相似性和一致性的差别并不在于一个宏观,一个 ...
写的时候确实只想起核酸序列的,忽略了对氨基酸序列中残基相似性的延伸解释,阿里补充的非常好:handshake 大工-阿里巴巴 发表于 2012-12-26 12:27 static/image/common/back.gif
song同学写的好啊!哈哈~但是有个基本的问题需要指出来,就是相似性和一致性的差别并不在于一个宏观,一个 ...
写的时候确实只想起核酸序列的,忽略了对氨基酸序列中残基相似性的延伸解释,阿里补充的非常好:handshake 惭愧呀,终于弄清楚了概念,受用了 哇,原来以前自己的描述都是错误滴……我的错误到此结束啦,谢谢亲们,要是在文章中犯此类错误,估计审稿人会崩溃的 qiuqiushine 发表于 2013-1-31 11:57 static/image/common/back.gif
哇,原来以前自己的描述都是错误滴……我的错误到此结束啦,谢谢亲们,要是在文章中犯此类错误,估计审稿人 ...
开始我也总是混淆三个的说法,哈哈
页:
[1]
2