pesticide_ccnu 发表于 2014-6-11 17:16:15

那些年 我用过的格式转换工具

       在这个分子模拟工具大爆炸的社会 总免不了碰到格式转换的问题 管你是做筛选 做对接也好 搞显示也好 熟悉几款格式转换工具都是很有必要的。下面将我接触过的一些转换的工作工具和转换任务作简要介绍:

转换工具:
1.babel(open babel)
开源 快速 支持很多3D格式(mol2,pdb...) 很多2D格式(smile,smart...) 还可以为其他软件准备输入文件安装跟使用都非常简单 随便写个脚本就可以进行批量操作 我一般将它作为转换格式的首选。据说还能搞到界面,另外基于python的兄弟软件pybel也值得一试。一句话,搞模拟的必备软件之一。
http://openbabel.org/docs/dev/Commandline_tools/babel.html
2.chemaxon公司整合的第三方程序molconvert
跟群友交流时偶然发现 注册就可以免费下载 申请可获得licence 功能与babel有交集但并不完全重复。可以用来生成图片,这是它的亮点之一。
http://www.chemaxon.com/marvin/help/applications/molconvert.html
3.高版本的chemoffice
chemoffice功能是越来越强大啦,做一般的格式转换已经毫无压力了 ,但是效果吗,根据我的经验,还是没有专业的软件好用,批量也成问题。

4.商业软件 sybyl 与MOE
这两个可以界面批量操作大量分子 完成某些格式转换任务效果也很不错

5.bash python perl 脚本
没办法 总会遇到很多奇葩的任务 比如给pdb小分子进行重命名 防止进行动力学的时候报原子名重复的错误 分子碎片想把H原子变为标记原子明显上面提到的转换工具干不来这事 这个时候就只能求助于各种语言了 基本上只有想不到没有做不到哈哈
      
转换任务:
1.平面结构转换为3D结构
只有smile格式或者二维的cdx、sdf要做对接或者筛选怎么办?简单的说就是要把1D或者2D的文件转换成3D的,其实上面介绍的几种工具都可以完成任务,但是效果有一定差别。我遇到的问题是:如何将课题组的列在word里的新化合物转换为3D结果用于筛选?我们是这样做的:首先将cdx(图片无能为力)的结构图从论文里面copy到chemdraw里面,然后50个每页存成sdf文件,sdf用babel转成Mol2用sybyl构建三维结构并在立场下优化,但是此时发现有些分子结构不合理(键长键角的问题),于是又用的pybel在另外的立场上再进行优化,最后得到了比较靠谱的结构。

2.3D结构转换为2D或者图片
3D虽然好看起来比较麻烦 对于我们这些化学口的 还是偏好结构式 比如一个非常简单的任务 如何将一个pdb结构小分子转换成结构式 我比较偏好用babel转,可以转为ct格式用chemdraw打开,也可以转为smiles粘贴到chemdraw,当然如果有MOE,直接选中分子,然后到chemdraw页面paste,简直太非常方便。这里有个小问题 有些结构式或者图片 虽然说是二维的 但是其实看上去还是有三维特征 我的经验是 直接3D到2D 倾向于产生有空间结构的二维结构 先3D到1D(smiles等) 再转到2D就比较平面化。下面两幅图可以说明我这里的两种情况:(使用molconvert程序 一个是直接pdb到图片一个是pdb到smiles然后到图片)
   

就介绍到这里了 欢迎拍砖以及补充 另外小弟打算在对接板块开辟虚拟筛选的子板块 欢迎大家前来交流!

精灵@华中师大@Wuhan



tangshushu 发表于 2017-11-8 17:13:48

问下,这种格式来回转换会出错么?用DUD-E生成decoys,格式转来转去的,有些分子会说手性生成错误,failed due to unspecified stereochemistry with strict stereo enabled,然后应该从smi格式转成sdf的文件里就没有这个分子了了

Ryan 发表于 2017-1-18 11:07:03

北京-构效 发表于 2014-6-13 13:27
懒人一个,有没有选定一列直接保存为sdf的格式   呵呵
JChem for Excel可以,跟楼主推荐的molconvert是一家的。ISIS for excel也可以,不过太老了,就不推荐了

pesticide_ccnu 发表于 2014-6-11 17:17:45

:funk: 界面很不友好 大家将就看吧 :lol

川大-灰太狼 发表于 2014-6-11 17:40:30

已改格式!呵呵 可以看了。

北京-构效 发表于 2014-6-12 08:45:15

非常有用,多谢帅哥

北京-构效 发表于 2014-6-12 08:50:11

问一下,怎么把excel里面的一列结构批量保存为sdf格式呢?

pesticide_ccnu 发表于 2014-6-12 08:54:35

北京-构效 发表于 2014-6-12 08:50 static/image/common/back.gif
问一下,怎么把excel里面的一列结构批量保存为sdf格式呢?

这个 如果结构本身是cdx格式的(不是图片) 复制粘贴到chemdraw就可以另存了吧 如果是图片格式 估计要麻烦一点了

Ares 发表于 2014-6-12 11:07:22

有个问题,你在转换的时候是用什么方法将小分子编号,使得转换前后可以通过自己的编号迅速将2D和3D结构对应起来呢?

pesticide_ccnu 发表于 2014-6-12 14:14:26

Ares 发表于 2014-6-12 11:07 static/image/common/back.gif
有个问题,你在转换的时候是用什么方法将小分子编号,使得转换前后可以通过自己的编号迅速将2D和3D结构对应 ...

用的bash脚本 一般都可以指定输出文件名 你讲输出文件名跟输入文件名改成对应的就行了

北京-构效 发表于 2014-6-13 13:27:18

pesticide_ccnu 发表于 2014-6-12 08:54 static/image/common/back.gif
这个 如果结构本身是cdx格式的(不是图片) 复制粘贴到chemdraw就可以另存了吧 如果是图片格式 估计要麻 ...

懒人一个,有没有选定一列直接保存为sdf的格式   呵呵

墨竹晓风 发表于 2014-6-15 10:19:26

不错,很好的总结。想加分,可惜不在我的权限内。期待更详细的操作介绍。
页: [1] 2
查看完整版本: 那些年 我用过的格式转换工具