|
马上注册,结交更多好友,下载更多分子模拟资源。
您需要 登录 才可以下载或查看,没有帐号?我想注册
x
最近在这个版面写下了modeller学习的过程,很多同志发站内信问我问题,很是受鼓舞,说来惭愧,大部分问题我都回答不出来,大家一起学习吧。今天以woniuzhixing的问题为例子,记录一下怎么补全蛋白质残基,其实有人发过了,再记录一下。
我个人理解,通过modeller来补全残基,一般是序列中间的,两头的残基补全好像不太能做的,不知道谁知不知道如何做,如果可以麻烦分享。
1QS4是woniuzhixing提到的蛋白质。首先我们需要到www.pdb.org去下载这个蛋白质,下载完成后,去查看它的氨基酸序列,然后copy 完整的氨基酸序列,生成一个ali文件,我命名成1QS4F.ali. 下面是1QS4F.ali的内容:
>P1;1QS4F
sequence:1QS4F:::::::0.00: 0.00
CSPGIWQLDCTHLEGKILVAVHVASGYIEAEVIPAETGQETAYFLLKLAGRWPVKTVHTDNGSNFTSTTVKAAC
EWGGIKQEFGIPYNPQSQGVIESMNKELKKIIGQVRDQAEHLKTAVQMAVFIHNKKRKGGIGGYSAGERIVDIIAT
DIQ*
当我们有这个ali时,并且目录里已经有1QS4.pdb,我们就可以运行align2d.py这个脚本,这个脚本的内容如下:
from modeller import *
env = environ()
aln = alignment(env)
mdl = model(env, file='1QS4', model_segment=('FIRST:A','LAST:A'))
aln.append_model(mdl, align_codes='1QS4', atom_files='1QS4.pdb')
aln.append(file='1QS4F.ali', align_codes='1QS4F')
aln.align2d()
aln.write(file='1QS4F-1QS4.ali', alignment_format='PIR')
aln.write(file='1QS4F-1QS4.pap', alignment_format='PAP')
运行mod9.14 align2d.py 可以得到两个文件,1QS4F-1QS4.ali and 1QS4F-1QS4.pap. 贴在附件中。
然后运行model-single.py 脚本就能生成补全了残基的蛋白质文件。model-single.py的内容如下:
from modeller import *
from modeller.automodel import *
#from modeller import soap_protein_od
log.verbose() # Request verbose output
env = environ() # Create a new modeller environment to build this mode in directories for input atom files
env.io.atom_files_directory = './:../atom_files'
# Read in HETATM records from template PDBs
env.io.hetatm = True
a = automodel(env, alnfile='1QS4F-1QS4.ali',
knowns='1QS4', sequence='1QS4',
assess_methods=(assess.DOPE,
#soap_protein_od.Scorer(),
assess.GA341))
a.starting_model = 1
a.ending_model = 5
a.make()
woniuzhixing同志,你完全按照附件的文件运行一下吧,如果还是不成功,你需要把错误信息贴出来让大家帮忙参考一下。
|
|