马上注册,结交更多好友,下载更多分子模拟资源。
您需要 登录 才可以下载或查看,没有帐号?我想注册
x
本帖最后由 MolAICal 于 2020-9-7 16:59 编辑
使用MolAICal的深度学习模型和分子对接程序进行药物的虚拟筛选
更多教程(含英文教程)请见如下: MolAICal官方主页:https://molaical.github.io MolAICal 文章介绍:https://doi.org/10.1093/bib/bbaa161 MolAICal中文博客:https://molaical.github.io/cntutorial.html MolAICal blogspot:https://qblab.blogspot.com
1.简介 一种新药的研发大概需要耗费26亿美元。即使有大量资金的投入,90%的新药仍会在临床试验和获批上市过程中夭折[1]。本教程介绍了MolAICal基于人工智能和分子对接进行药物虚拟筛选的流程,其中model.pdb是优化的蛋白质模型文件,你可以替换成自己的蛋白质模型。此方法将帮助药物学家、化学家及其它领域的科学家根据靶点的活性口袋合理设计药物。
2.工具 2.1. 所需软件下载地址 1) MolAICal(win64 or linux64): https://molaical.github.io 2) UCSFChimera: https://www.cgl.ucsf.edu/chimera/ 3) MGLTools: https://ccsb.scripps.edu/mgltools/downloads/ 4) Python: https://www.python.org/ 5) Pymol: http://www.lfd.uci.edu/~gohlke/pythonlibs
前四个软件的安装相对简单,可根据提示轻松完成安装。Pymol的安装需要numpy,pmw, pymol_launcher 和 pymol组件,上述四个组件的版本需要与你操作系统上选择的Python版本保持一致,这些组件可在下面的网站下载: https://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy https://www.lfd.uci.edu/~gohlke/pythonlibs/#pymol-open-source 下载后把对应版本的numpy, pmw,pymol_launcher 和 pymol组件放到同一个文件中,使用以下命令安装Pymol: [mw_shl_code=bash,true]#> pip install --no-index --find-links="%CD%" pymol_launcher[/mw_shl_code]
Pymol软件名称为“pymol.exe”将安装在Python目录下的“Scripts”文件夹中。你可以在桌面创建此软件的快捷方式。确保所有的软件正确安装。
2.2. 操作示例文件 所有用到的操作教程文件均可在下面的网站下载: https://github.com/MolAICal/tutorials/tree/master/002-AIVS
3.操作流程 这一步是在分子对接前的蛋白质结构处理。如果你熟悉Autodock vina,请自动忽略该步。你可以在https://youtu.be/-GVZP0X0Tg8 网站上观看或者在http://vina.scripps.edu/tutorial.html网站上下载该步的教程视频进行学习。为了使本教程更加完善,处理蛋白结构的步骤陈述如下:
3.1.使用UCSF Chimera将蛋白质和配体结构分开 1) 首先,在UCSF Chimera中载入复合物结构。File-->Open-->model.pdb (如图1所示) 图1.载入蛋白结构文件
2) 选择配体LIG并将其删除 (如图2所示)。使用图2中相同的方法将水HOH选中并删除。 图2. 选中并删除配体
3) 保存没有配体的蛋白质结构并且命名为“protein.pdb” (如图3所示)。 图3. 保存蛋白质结构
4) 关闭本次会话, 重新载入“model.pdb”, 选择配体,反选并删除反选的蛋白 (如图4所示)。 图4.选中并删除受体蛋白
5) 将配体文件保存为“ligand.pdb” (如图5所示)。 图5.保存配体文件
3.2. 计算盒子质心和长度 1.参照上述步骤选择配体或者重新载入“ligand.pdb” 并选择配体。然后选择距离工具: Tools-->Structure Analysis-->Distance (如图6所示): 图6. 选择距离工具
2.根据配体计算蛋白质活性口袋的质心坐标 (如图7所示)。 图7. 获得质心坐标
创建 “conf.txt” 并将质心坐标写入该文件: -------------------------------------------------------------------------------- center_x= -10.733 center_y= 12.416 center_z= 68.829 -------------------------------------------------------------------------------- 注意: 配置文件的文件名 “conf.txt” 是固定的。 如果你使用其它字母创建文件名,MolAICal 将不能识别该文件名。
3.设置对接盒子的体积 计算最终盒子尺寸。你可以将X, Y, Z长度分别设置为25, 30, 25。在MolAICal中使用下文提到的命令生成“box.bild”(注意: X, Y, Z 坐标的双引号是必须添加的,X, Y, Z坐标之间的间隔为一个空格。):
1) 执行以下命令,获得“box.bild”: [mw_shl_code=bash,true]#> molaical.exe -tool box -i "-10.733 12.416 68.829" -l "25.0 30.0 25.0" -o "box.bild"[/mw_shl_code]
2) File-->open,然后打开“box.bild”,检查生成的盒子大小是否合适 (如图8所示)。 图8. 使用UCSF Chimera打开box.bild
如上图所示盒子大小25, 30, 25 是合适的,因此确定最终质心参数为-10.733, 12.416, 68.829,最终盒子沿X, Y, Z轴的长度为25.0, 30.0, 25.0。 注意:如果你用VMD软件计算了几何中心,最终的中心点参数将是-10.86,12.57, 68.82。这两种方法得到的结果都可以用于本教程,本教程暂使用UCSFChimera算出来的质心坐标。
3.3.虚拟筛选前将蛋白质结构转换为PDBQT格式 1.打开“AutoDockTools”, File-->Read Molecule-->protein.pdb, 加上极性氢 (如图9所示)。 图9. 加极性氢
2.将蛋白保存为PDBQT格式。Grid-->Macromolecule-->Choose…,然后点击“protein”选择 “Select Molecule” ,将蛋白结构保存为“pro.pdbqt” (如图10所示). 图10.用PDBQT格式保存蛋白
3.4. 用深度学习模型和分子对接进行虚拟筛选 #>cd 002-AIVS
最后在后台运行以下命令:
Linux系统:
[mw_shl_code=bash,true]#> molaical.exe -dock AI -s ZINCMol -n 6 -nf 3 -nc 3 >& vs.log &
-n: 代表对接产生的总分子数目
-nf: 单个文件夹中包含的分子数量
-nc: 执行命令使用的CPU数
[/mw_shl_code]
Windows系统(使用PowerShell): [mw_shl_code=bash,true]#> molaical.exe -dock AI -s ZINCMol -n 6 -nf 3 -nc 3
如果要在后台运行,请执行下面的命令:
#> powershell -windowstyle hidden -command “molaical.exe -dock AI -s ZINCMol -n 6 -nf 3 -nc 3”
[/mw_shl_code]
如果你想依据已知的药物数据库进行经典的虚拟筛选,可以参考MolAICal教程中药物设计部分的第三部分(https://molaical.github.io/tutorial.html)。
4.结果 你可使用OpenBabel将分子的PDBQT格式转化为PDB格式,然后在使用UCSF Chimera打开查看结果。Pymol可以直接载入PDBQT格式的分子。本教程使用Pymol 软件 (http://www.lfd.uci.edu/~gohlke/pythonlibs) 展示结果 (如图11所示)。结果显示MolAICal通过深度学习模型和分子对接程序获得了与现有配体相似的类似物。 图11. 绿色配体N3是原蛋白受体的抑制剂,黄色配体由深度学习模型和分子对接计算而得。
|