生物分子模拟论坛

 找回密码
 我想注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 379|回复: 5

[其他] 使用MolAICal计算分子合成可行性预测、类药五原则和PAINS的...

[复制链接]
发表于 2020-8-16 17:42:27 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,下载更多分子模拟资源。

您需要 登录 才可以下载或查看,没有帐号?我想注册

x
本帖最后由 MolAICal 于 2020-9-7 16:13 编辑

使用MolAICal计算分子合成可行性预测、类药五原则和PAINS的教程

更多教程(含英文教程)请见如下:
MolAICal官方主页:https://molaical.github.io
MolAICal 文章介绍:https://doi.org/10.1093/bib/bbaa161
MolAICal中文博客:https://molaical.github.io/cntutorial.html
MolAICal blogspothttps://qblab.blogspot.com

1.简介
在本教程中,我们将介绍药物合成可行性预测,Lipinski's rule of five(里宾斯基五规则)和PAINS的计算方法。药物可合成性(SA)可用于预测化合物的合成难度。里宾斯基五规则也被称为类药五原则(RO5),是一种用来估计类药性或评估一种化合物是否具有药理或生物活性的法则。PAINS全称是Pan Assay Interference Compounds,指对大多数测试有干扰的化合物,PAINS大致分为两类:对第一类来说,化合物在测试浓度下在溶液中形成胶体,蛋白被包裹在胶体中,底物因此无法接近酶的活性中心,因此这些化合物属于假阳性化合物;对于第二类来说,这些化合物的活性基团可以与蛋白受体形成共价作用,进而导致受体受到抑制,但这种抑制很难逆转,同时这些具有PAINS性质的配体可以与大多数靶点发生反应,缺乏特异性。如果药物相关文章要投稿到Journal of Medicinal Chemistry等杂志,它们可能要求PAINS的计算,此时,可以使用MolAICal来计算PAINS

2.材料和工具
2.1. 软件需求
MolAICal:https://molaical.github.io
2.2. 示例文件
所有需要的教程文件可以从以下链接下载
https://github.com/MolAICal/tutorials/tree/master/009-SA_Ro5_Pains

3.步骤
3.1. 可合成性(SA)预测计算
你可以通过分子的SMILES序列计算SA,使用如下命令:
[Bash shell] 纯文本查看 复制代码
#> molaical.exe -tool sa -i "FC(F)(F)c1cc(ccc1)N5CCN(CCc2nnc3[C@H]4CCC[C@H]4Cn23)CC5"
或者你可以在一个包含许多SMILES序列的文件中计算配体的SA
[Bash shell] 纯文本查看 复制代码
#> cd “009-SA_Ro5_Pains/SA”
#> molaical.exe -tool sa -i SmilTest.smi
注意:化合物SA的值越大,表明该化合物越易于合成。

3.2. 类药五原则计算
单个配体的RO5计算如下
[Bash shell] 纯文本查看 复制代码
#> cd “009-SA_Ro5_Pains/ro5”
#> molaical.exe -tool ruleoffive -f mol2 -n zinc_1879871.mol2

如果要计算多个配体的Lipinski'srule of five,可以按以下步骤进行:
1.Linux的控制台中使用命令 “ls > mol2List.dat”,或在WindowsDOS控制台中使用命令“dir /b > mol2List.dat”。打开生成的文件“mol2List.dat”并且删除所有无用的字符。确保文件“mol2List.dat” 只包含配体的名称。

2.执行如下命令:
[Bash shell] 纯文本查看 复制代码
#> molaical.exe -tool ruleoffive -f mol2list -i mol2List.dat -o result.dat
将会生成名为“result.dat”的文件,其中包含大量的RO5值。关于RO5的更多细节,请参阅MolAICal手册。

3.3. PAINS计算
具有SMILESmol2格式的单个配体可计算如下:
[Bash shell] 纯文本查看 复制代码
#> cd “009-SA_Ro5_Pains/pains”
#> molaical.exe -tool pains -f smi -n "c1ccccc1N=Nc1ccccc1"
#> molaical.exe -tool pains -f mol2 -n ZINC00154323.mol2

如果你想要计算多个配体的PAINS,可以执行以下步骤:
对于SMILES格式:
[Bash shell] 纯文本查看 复制代码
#> molaical.exe -tool pains -f smilist -i painsTest.txt -o smiResult.txt

对于Mol2格式:
[Bash shell] 纯文本查看 复制代码
#> cd “009-SA_Ro5_Pains/pains/mol”
1. Linux控制窗口使用命令“ls > mol2List.dat”,或者在WindowsDOS窗口使用命令“dir /b > mol2List.dat”。打开生成的文件“mol2List.dat”并且删除所有无用的字符。确保文件“mol2List.dat”中只包含配体的名称。

2. 执行如下命令:
[Bash shell] 纯文本查看 复制代码
#> molaical.exe -tool pains -f mol2list -i mol2List.dat -o mol2Result.txt
将会生成名为“mol2Result.txt”的文件,其中包括所有配体的PAINS信息。

注意:建议使用SMILES格式进行PAINS的计算。

评分

参与人数 1金币 +10 收起 理由
川大-灰太狼 + 10 赞一个!

查看全部评分

发表于 2020-9-24 09:40:34 | 显示全部楼层
您好,现在很多的预测逆合成路线的方法也比较成熟了,这种计算可合成性的功能是不是会有增强的计划
发表于 2020-9-25 20:51:33 | 显示全部楼层
请问计算完成后怎么把符合的挑选出来?要自己一个个挑选吗?那几万个分子耗时也太长了吧?
楼主有没有什么好的方法
 楼主| 发表于 2020-10-8 16:38:17 | 显示全部楼层
liushukai 发表于 2020-9-24 09:40
您好,现在很多的预测逆合成路线的方法也比较成熟了,这种计算可合成性的功能是不是会有增强的计划 ...

正在准备搞逆合成路线,超过4步难度就有点高了,在优化,谢谢建议。
 楼主| 发表于 2020-10-8 16:41:49 | 显示全部楼层
本帖最后由 MolAICal 于 2020-10-8 17:28 编辑
guan 发表于 2020-9-25 20:51
请问计算完成后怎么把符合的挑选出来?要自己一个个挑选吗?那几万个分子耗时也太长了吧?
楼主有没有什么 ...

使用linux脚本,或者excel: 比如排个序.......具体可以参考:
使用MolAICal进行配体相似性比较或搜索的操作教程
http://bioms.org/forum.php?mod=v ... 9230&extra=page%3D1


发表于 2020-10-9 09:27:01 | 显示全部楼层
MolAICal 发表于 2020-10-8 16:41
使用linux脚本,或者excel: 比如排个序.......具体可以参考:
使用MolAICal进行配体相似性比较或搜索的操作 ...

谢谢楼主
您需要登录后才可以回帖 登录 | 我想注册

本版积分规则

QQ|分迪科技|小黑屋|手机版|Archiver|生物分子模拟论坛 ( 蜀ICP备14009200号-3 )

GMT+8, 2020-10-23 19:24 , Processed in 0.089719 second(s), 21 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表