lrf1980 发表于 2014-11-27 14:48:03

to woniuzhixing 补全蛋白质残基

最近在这个版面写下了modeller学习的过程,很多同志发站内信问我问题,很是受鼓舞,说来惭愧,大部分问题我都回答不出来,大家一起学习吧。今天以woniuzhixing的问题为例子,记录一下怎么补全蛋白质残基,其实有人发过了,再记录一下。
我个人理解,通过modeller来补全残基,一般是序列中间的,两头的残基补全好像不太能做的,不知道谁知不知道如何做,如果可以麻烦分享。

1QS4是woniuzhixing提到的蛋白质。首先我们需要到www.pdb.org去下载这个蛋白质,下载完成后,去查看它的氨基酸序列,然后copy 完整的氨基酸序列,生成一个ali文件,我命名成1QS4F.ali. 下面是1QS4F.ali的内容:

>P1;1QS4F
sequence:1QS4F:::::::0.00: 0.00
CSPGIWQLDCTHLEGKILVAVHVASGYIEAEVIPAETGQETAYFLLKLAGRWPVKTVHTDNGSNFTSTTVKAAC
EWGGIKQEFGIPYNPQSQGVIESMNKELKKIIGQVRDQAEHLKTAVQMAVFIHNKKRKGGIGGYSAGERIVDIIAT
DIQ*

当我们有这个ali时,并且目录里已经有1QS4.pdb,我们就可以运行align2d.py这个脚本,这个脚本的内容如下:
from modeller import *
env = environ()
aln = alignment(env)
mdl = model(env, file='1QS4', model_segment=('FIRST:A','LAST:A'))
aln.append_model(mdl, align_codes='1QS4', atom_files='1QS4.pdb')
aln.append(file='1QS4F.ali', align_codes='1QS4F')
aln.align2d()
aln.write(file='1QS4F-1QS4.ali', alignment_format='PIR')
aln.write(file='1QS4F-1QS4.pap', alignment_format='PAP')
运行mod9.14 align2d.py 可以得到两个文件,1QS4F-1QS4.ali and 1QS4F-1QS4.pap. 贴在附件中。

然后运行model-single.py 脚本就能生成补全了残基的蛋白质文件。model-single.py的内容如下:
from modeller import *
from modeller.automodel import *
#from modeller import soap_protein_od
log.verbose()                     # Request verbose output
env = environ()                   # Create a new modeller environment to build this mode in directories for input atom files
env.io.atom_files_directory = './:../atom_files'
# Read in HETATM records from template PDBs
env.io.hetatm = True
a = automodel(env, alnfile='1QS4F-1QS4.ali',
            knowns='1QS4', sequence='1QS4',
            assess_methods=(assess.DOPE,
                              #soap_protein_od.Scorer(),
                              assess.GA341))
a.starting_model = 1
a.ending_model = 5
a.make()

woniuzhixing同志,你完全按照附件的文件运行一下吧,如果还是不成功,你需要把错误信息贴出来让大家帮忙参考一下。



天理-小新 发表于 2014-11-28 10:42:21

C端与N端缺失的残基(你所谓的两头的残基),也是可以用modeller补全的, 只是你得去找这两端的同源序列。当然你也可以不找,直接进行,就像是将两端缺失的残基进行de novo design一样,准确性就差了点。其实本身这两端的柔性比较大,相应的建模准确性就差了点。不过对于活性位点,或者所研究的残基未参与两端的残基(也不影响)的话可以忽略了。

lrf1980 发表于 2014-11-28 20:53:25

天理-小新 发表于 2014-11-28 10:42
C端与N端缺失的残基(你所谓的两头的残基),也是可以用modeller补全的, 只是你得去找这两端的同源序列。 ...

谢谢,学习了,如果两端有同源序列,就可以进行建模。如果两端没有同源的话,我试过一次,出来的基本上就是一条笔直的氨基酸链,都没有什么折叠,我觉得很普靠谱,尤其对一些膜蛋白什么的。

天理-小新 发表于 2014-12-1 21:36:44

lrf1980 发表于 2014-11-28 20:53
谢谢,学习了,如果两端有同源序列,就可以进行建模。如果两端没有同源的话,我试过一次,出来的基本上就 ...

好像掉了个字吧,应该是很不靠谱吧?

lrf1980 发表于 2014-12-1 22:50:32

天理-小新 发表于 2014-12-1 21:36
好像掉了个字吧,应该是很不靠谱吧?

haha. 是的

天理-小新 发表于 2014-12-1 23:41:27

{:soso_e181:}

棠梨煎雪 发表于 2017-6-5 12:05:56

天理-小新 发表于 2014-11-28 10:42
C端与N端缺失的残基(你所谓的两头的残基),也是可以用modeller补全的, 只是你得去找这两端的同源序列。 ...

您好,我现在正在补全受体C端缺失的残基,而且此处是与配体作用的关键,我用的是chimera补全的,但是补全部分差异很大,所以不太敢用,请问,您是否看过用modeller补全C端残基的参考文献呢?盼复。
页: [1]
查看完整版本: to woniuzhixing 补全蛋白质残基