to woniuzhixing 补全蛋白质残基

lrf1980 发表于 2014-11-27 14:48:03

最近在这个版面写下了modeller学习的过程，很多同志发站内信问我问题，很是受鼓舞，说来惭愧，大部分问题我都回答不出来，大家一起学习吧。今天以woniuzhixing的问题为例子，记录一下怎么补全蛋白质残基，其实有人发过了，再记录一下。
我个人理解，通过modeller来补全残基，一般是序列中间的，两头的残基补全好像不太能做的，不知道谁知不知道如何做，如果可以麻烦分享。

1QS4是woniuzhixing提到的蛋白质。首先我们需要到www.pdb.org去下载这个蛋白质，下载完成后，去查看它的氨基酸序列，然后copy 完整的氨基酸序列，生成一个ali文件，我命名成1QS4F.ali. 下面是1QS4F.ali的内容：

>P1;1QS4F
sequence:1QS4F:::::::0.00: 0.00
CSPGIWQLDCTHLEGKILVAVHVASGYIEAEVIPAETGQETAYFLLKLAGRWPVKTVHTDNGSNFTSTTVKAAC
EWGGIKQEFGIPYNPQSQGVIESMNKELKKIIGQVRDQAEHLKTAVQMAVFIHNKKRKGGIGGYSAGERIVDIIAT
DIQ*

当我们有这个ali时，并且目录里已经有1QS4.pdb，我们就可以运行align2d.py这个脚本，这个脚本的内容如下：
from modeller import *
env = environ()
aln = alignment(env)
mdl = model(env, file='1QS4', model_segment=('FIRST:A','LAST:A'))
aln.append_model(mdl, align_codes='1QS4', atom_files='1QS4.pdb')
aln.append(file='1QS4F.ali', align_codes='1QS4F')
aln.align2d()
aln.write(file='1QS4F-1QS4.ali', alignment_format='PIR')
aln.write(file='1QS4F-1QS4.pap', alignment_format='PAP')
运行mod9.14 align2d.py 可以得到两个文件，1QS4F-1QS4.ali and 1QS4F-1QS4.pap. 贴在附件中。

然后运行model-single.py 脚本就能生成补全了残基的蛋白质文件。model-single.py的内容如下：
from modeller import *
from modeller.automodel import *
#from modeller import soap_protein_od
log.verbose()                   # Request verbose output
env = environ()                # Create a new modeller environment to build this mode in directories for input atom files
env.io.atom_files_directory = './:../atom_files'
# Read in HETATM records from template PDBs
env.io.hetatm = True
a = automodel(env, alnfile='1QS4F-1QS4.ali',
         knowns='1QS4', sequence='1QS4',
         assess_methods=(assess.DOPE,
                           #soap_protein_od.Scorer(),
                           assess.GA341))
a.starting_model = 1
a.ending_model = 5
a.make()

woniuzhixing同志，你完全按照附件的文件运行一下吧，如果还是不成功，你需要把错误信息贴出来让大家帮忙参考一下。

天理-小新 发表于 2014-11-28 10:42:21

C端与N端缺失的残基（你所谓的两头的残基），也是可以用modeller补全的，只是你得去找这两端的同源序列。当然你也可以不找，直接进行，就像是将两端缺失的残基进行de novo design一样，准确性就差了点。其实本身这两端的柔性比较大，相应的建模准确性就差了点。不过对于活性位点，或者所研究的残基未参与两端的残基（也不影响）的话可以忽略了。

lrf1980 发表于 2014-11-28 20:53:25

天理-小新发表于 2014-11-28 10:42
C端与N端缺失的残基（你所谓的两头的残基），也是可以用modeller补全的，只是你得去找这两端的同源序列。 ...

谢谢，学习了，如果两端有同源序列，就可以进行建模。如果两端没有同源的话，我试过一次，出来的基本上就是一条笔直的氨基酸链，都没有什么折叠，我觉得很普靠谱，尤其对一些膜蛋白什么的。

天理-小新 发表于 2014-12-1 21:36:44

lrf1980 发表于 2014-11-28 20:53
谢谢，学习了，如果两端有同源序列，就可以进行建模。如果两端没有同源的话，我试过一次，出来的基本上就 ...

好像掉了个字吧，应该是很不靠谱吧？

lrf1980 发表于 2014-12-1 22:50:32

天理-小新发表于 2014-12-1 21:36
好像掉了个字吧，应该是很不靠谱吧？

haha. 是的

天理-小新 发表于 2014-12-1 23:41:27

{:soso_e181:}

棠梨煎雪 发表于 2017-6-5 12:05:56

天理-小新发表于 2014-11-28 10:42
C端与N端缺失的残基（你所谓的两头的残基），也是可以用modeller补全的，只是你得去找这两端的同源序列。 ...

您好，我现在正在补全受体C端缺失的残基，而且此处是与配体作用的关键，我用的是chimera补全的，但是补全部分差异很大，所以不太敢用，请问，您是否看过用modeller补全C端残基的参考文献呢？盼复。

页: [1]

生物分子模拟论坛's Archiver

to woniuzhixing 补全蛋白质残基