使用MolAICal 进行分子对接
本帖最后由 MolAICal 于 2021-10-20 17:21 编辑使用MolAICal进行分子对接 作者:MolAICal (update 2021-10-16) 更多教程(含英文教程)请见如下:MolAICal官方主页:https://molaical.github.ioMolAICal官方主页中国镜像:https://molaical.gitee.ioMolAICal 文章介绍:https://arxiv.org/abs/2006.09747 和 https://doi.org/10.1093/bib/bbaa161MolAICal中文博客:https://molaical.github.io/cntutorial.htmlMolAICal Twitter:https://twitter.com/MolAICalMolAICal QQ学术讨论群: 1151656349
1.简介SARS-CoV-2导致2019年冠状病毒病(COVID-19)在世界范围内迅速传播。在本教程中,选择在冠状病毒复制中起重要作用的SARS-CoV-2主蛋白酶(Mpro)作为示例目标。已经报道了SARS-CoV-2Mpro的晶体结构包括PDB ID:6LU7,6Y2F等。在本教程中,基于MolAICal (https://doi.org/10.1093/bib/bbaa161)介绍了蛋白质和配体之间的分子对接。在3130复合物的实验结合亲和力的测试中,Autodock Vina的Pearson和Spearman相关系数(rp/rs)为0.5259和0.5421,对于MolAICal,在与Autodock Vina相同测定条件下,rp/rs分别为0.5335和0.5489。这表明MolAICal比Autodock Vina具有较好的“对接”和“排名”能力。
2.材料2.1软件需求1)MolAICal: https://molaical.github.io国内镜像MolAICal: https://molaical.gitee.io 2)UCSF Chimera: https://www.cgl.ucsf.edu/chimera
2.2示例文件1)All the necessary tutorial files are downloaded from: https://gitee.com/molaical/tutorials/tree/master/0000-docking
3.步骤3.1处理受体和配体1. 打开与配体结合的SARS-CoV-2主蛋白酶文件(PDB ID:6Y2F):File-->Open(见图1)。 图1 2. 准备 Mpro 受体并保存名为“protein.pdb”的 Mpro 受体。详细过程如图2所示。 图2 3. 准备配体并保存名为“ligand.pdb”的配体。详细过程如图3所示。 图3 3.2将受体和配体转换为 PQBQT 格式 1. 使用cd命令切换到protein.pdb所在的文件夹,并使用以下命令获取受体的 PDBQT 格式:#> MolAICal-xxx\molaical.exe -dock receptor -i protein.pdb注意:MolAICal-xxx是您下载的MolAICal版本的目录。它将生成名为“protein.pdbqt”的文件,该文件具有与“protein.pdb”相同的前缀名称。
2. 使用以下命令获取配体的PDBQT格式:#> MolAICal-xxx\molaical.exe -dock ligand -i ligand.pdb它将生成名为“ligand.pdbqt”的文件,该文件具有与“ligand.pdb”相同的前缀名称。
3.3. 获取对接盒的中心和长度1. 依次打开protein.pdb和ligand.pdb。 然后打开Chimera的“命令行”:Favorites-->Command Line(见图4)。 图4
2. 确定配体的开放序列。如果蛋白质首先打开,它将对应于“Active models 0”。 第二个打开对应于“Active models 1”,依此类推(见图5)。 在这里,配体是第二个打开的(“Active models 1”)。将以下命令放入命令行(见图5):define centroid mass false #1并按“Enter”键。然后,依次点击图5中的序号。它将显示配体的几何中心坐标 (x,y, z) 为(10.879, -0.251, 20.754)。
图5 3. 通过 UCSF Chimera确定框大小和中心。 打开盒子工具: Tools-->Surface/Binding Analysis-->Autodock Vina选择盒子大小: 选择正确的受体(此处命名为“protein.pdb”)和配体(此处命名为“ligand.pdb”)(参见图6)。将上述中心坐标“10.879,-0.251,20.754”填入中心框内(见图6),用户可以尝试大小,直到找出合适的尺寸。 图6 注意:用户可以勾选 “Resize search volumeusing button 1, 2 or 3”。按钮1、2或3表示鼠标左键、中键或右键单击。如果用户选择此功能,他们可以通过鼠标调整框大小。如果你对它感兴趣,你可以试试这个功能。
4.假设配置文件名为“conf.txt”,最终的配置文件可以写成: out = all.pdbqt
cpu = 4
receptor = protein.pdbqt
center_x = 10.879
center_y = -0.251
center_z = 20.754
size_x = 20
size_y = 20
size_z = 20
num_modes = 3其中“out”是输出文件名。“cpu”是使用CPU的数量。“receptor”代表受体名称。“num_modes”是生成对接构象的数量。如果“num_modes”为3,它将生成3个配体的对接结构。
3.4MolAICal 的分子对接 1. 现在MolAICal软包中的MolAICalD用于受体与配体的分子对接:#> MolAICal-xxx\molaicald --config conf.txt --ligand ligand.pdbqt注意:MolAICal-xxx是您下载的MolAICal版本的目录。 在某些情况下,配体分子有很多旋转键,这样就需要多次试验才可以得到较好的对接结果,可以通过多次运行MolAICal找出合适的random seed来得到较好的对接结果, 这个randomseed 可以进一步用来这个靶点的分子对接或虚拟筛选(见图7)。
图7
例如, 本教程中,用户可以用筛选出的random seed:555767984来重复本教程。请输入下面的命令:#> MolAICal-xxx\molaicald --config conf.txt --ligand ligand.pdbqt --seed 555767984
2. 将结果拆分为单个分子#> MolAICal-xxx\molaical.exe -tool pdbqt -i all.pdbqt -o ./单个分子被命名为1.pdbqt、2.pdbqt或3.pdbqt等。“1.pdbqt”包含结合亲和力最好的对接构象,以此类推。用户可以直接通过Pymol 软件查看 1.pdbqt、2.pdbqt 或3.pdbqt。在这里,UCSFChimera 用于检查结果。它需要首先通过MolAICal使用以下命令将“pdbqt”转化为“pdb”格式: 1) 加氢(选项)#> MolAICal-xxx\molaical.exe -dock addh -i 1.pdbqt
2) 将“pdbqt”更改为“pdb”格式#> MolAICal-xxx\molaical.exe -dock pdbqt2pdb -i 1.pdbqt用户可以在本教程中对2.pdbqt 和 3.pdbqt使用相同的方式。现在,打开 UCSFChimera 并加载protein.pdb、1.pdb、2.pdb 和 3.pdb:
3) 用户可以通过Favorites-->Model Panel在所有分子加载时选择显示或隐藏分子(见图8)
图8 注意:如果用户想分析蛋白质和对接配体之间的相互作用,用户可以选择在protein.pdb上添加氢。
结果显示“1.pdb”有部分结构跟原始配体有叠合,而“3.pdb”与原始配体有相似的重叠部分。这个体系做过分子动力学模拟(见教程MM/GBSA:https://molaical.gitee.io/tutorial.html)。MM/GBSA教程的结果显示原始配体N3的Andricioaei熵值是-84.70646297459386 (kcal/mol)。这表明原始配体N3在SARS-CoV-2Mpro的口袋中是不稳定的。
参考文献 JinZ, Du X, Xu Y, Deng Y, Liu M, Zhao Y, et al. Structure of Mpro from COVID-19virus and discovery of its inhibitors. bioRxiv. 2020. ZhangL, Lin D, Sun X, Curth U, Drosten C, Sauerhering L, et al. Crystal structure ofSARS-CoV-2 main protease provides a basis for design of improvedalpha-ketoamide inhibitors. Science. 2020. doi: 10.1126/science.abb3405. PubMedPMID: 32198291
页:
[1]