如何准备pdbq和pdbqs文件

如何准备pdbq和pdbqs文件,第1张

这里,mol2topdbqs是为受体转化为pdbqs文件。一般来说,mol2是比较通用的文件格式。不过,由于autodock需要考虑受体的溶剂化效应,所以在autodock中用于对接的小分子需要pdbq与pdbqs格式。在autodock中有个程序为mol2topdbqs,可以直接转化mol2文件为pdbqs文件。

在不同运行平台,由于awk的版本不同,运行略有不同。

比如,在sgi irix中,直接使用mol2topdbqs命令就可以。这个其实是由两个命令构成的:

%mol2topdbq macro.mol2 >macro.pdbq

%addsol macro.pdbq macro.pdbqs

但是在linux中,这个命令提示出错。不过,这个命令分解为两个命令就可以:

$mol2fftopdbq macro.mol2 >macro.pdbq

$addsol macro.pdbq macro.pdbqs

对于小分子配体文件,要用deftors命令。

用法

$deftors lig.mol2

会提示定义环,选1->c->c就可以了。

这是针对单个配体文件来说的,如果对于数据库中的多个小分子,就需要编写循环脚本批量 *** 作了。

nci-3d中有已经准备好的pdbq格式的小分子,可以直接用于autodock的对接。我想你可以参考他们的批量转化方法。

在autodock运行中,最占时间的是格点(grid)参数的计算。而每个小分子与受体作用的格点参数都是不同的。在JMC的两篇文章中(J Med Chem. 2005, 48: 2308-2318;J Med Chem. 2006, 49: 2417-2430),同一个课题组发表了两篇文章,主要是以P450酶为靶点,对autodock的源代码进行修改,使不同原子类型的格点参数计算一次完成,然后,不同的小分子可以随时调用计算好的格点参数用于对接。这样就解决了虚拟筛选中每个分子重复计算格点参数的速度问题。

在最近的一篇文章中(proteins,200665:549-554),一个韩国课题组发表文章,利用autodock进行虚拟筛选,文章没有对格点计算方法进行详述,不过据我推想,他们应该也采用了jmc两篇文章的方法。

jmc文章作者修改后的autodock源代码可以通过发邮件联系得到。同时,他们还通过修改源代码,实现了将水分子中氧上的氢键接受作用考虑在分子对接中(在原代码中,只能考虑水分子的氢键供体作用)。

上海药物所曾经在论坛中发过一段脚本,通过循环来利用autodock进行虚拟筛选。这个极有参考意义。不过脚本中需要对数据库中的每个小分子都计算格点能,这可能会使虚拟筛选时间大大延长。

Docking算法需要每个原子带有电荷并且需要标记原子的属性。这些信息通常未包含在PDB文件中。我们需要在对蛋白和小分子的PDB文件预处理,生成PDBQT文件同时包含以上信息和PDB文件中的原子坐标信息。进一步地对于“柔性配体docking”,我们还需要定义配体的柔性部分和刚性部分。所有这些都可以通过软件AutoDock Tools (adt)来完成。

=====准备受体蛋白=======

 

 

注:在windows下,我们可以手动选择,或者利用Excel的筛选功能。在Linux下,使用命令egrep "^(ATOM|TER)" 1hsg.pdb >1hsg_prot.pdb

 

2. 启动AutoDockTools

 

3. 依次点选File-ReadMolecule-1hsg_prot.pdb加载蛋白分子。

 

按住左键拖动旋转分子结构;点击中键滚动缩放;按住右键移动晶体位置。

 

4. 更改展示方式:依次点选Color-By Atom Type-All Geometries-OK。

 

5. 加氢:晶体结构中通常缺少氢原子的坐标 (因为氢原子电子少,且质子核对电子吸引能力弱,因此很难定位,具体见http://www.uh.edu/~chembi/ChemSocRev_Jones_critical.pdf)。但是在docking过程中,氢原子尤其是极性氢原子对计算静电作用是必须的。因此我们需要给蛋白加上氢原子,依次点选Edit-Hydrogen-Add-Polar only-OK。这时氢原子会以白色短线形式出现。

 

6. 存储对蛋白的每个原子所做的修改和原子类型判断:依次点选Grid-Macromolecule-Choose-1HSG_protein-Slect Molecule。ADT会d出一个信息框包含程序所做的处理,比如合并非极性氢原子,计算原子局部电荷和判断原子类型,并提示保存Save-1hsg_prot.pdbqt。打开文件,查看最后两列,分别为每个原子的电量和类型 。如下图所示分别是原始的pdb文件和新生成的pdbqt文件。

7. 在受体蛋白定义配体结合的3D搜索空间: 如果我们事先不知道结合位点,理论上可以定义一个长方体盒子包含整个蛋白或者随便一个特定区域 。

依次点选Grid-Grid box将会在蛋白上画出一个长方体,并且有一个d出框。在d出框中,拖拽刻度线查看长方体的变化,完成设置。

在这个例子中,我们知道结合位点,就选取以其为中心的一个小空间。设置Spacing (angstrom)为1埃 (这实际是一个换算系数, 相当于步长默认为0.375,是C-C单键长度的1/4,最大为1。spacing值与(各个维度上的点的数目+1)的乘机就是长方体Grid box的大小)。在我们调整的过程中,可以看到随着这个数值的变大,立方体也被放大了。另外我们设置x,y,z center为16,25,4,number of points in (x,y,z)-dimension为30,30,30(最大为126,必须为偶数,AutoDock会自动再每一维再加一个点)。记下我们设置的这些点,下面会用到。

在刻度转盘处点击右键会d出一个窗口,输入数字回车即可设置GRID的中心坐标和大小。较大的number of points in (xyz)-dimension和较小的Spacing会增加搜索的精度,同时需要花费更多的计算时间。

 

8. 设置受体的柔性残基:在ADT中依次点选Flexible Residues-Input-Choose Macromolecule-1hsg_protselect-select from string-Residue: ARG8-Add-Dismiss, 8号ARG氨基酸残基就被选中了。

 

再依次点选Flexible Residues-Choose Torsions in Currently Selected Residues将选择的残基标记为柔性残基并设置可扭转的数量。在分子显示窗口中分别点击两个残基上CA和CB原子之间的建,使之变为非扭转的(紫色显示),这样两个残基中的32个键中有6个是可扭转的。这里设置配体的柔性残基或者使CA-CB的键为刚性都是可选 *** 作。

Flexible Residues-Output-Save Flexible PDBQT保存柔性残基文件。Flexible Residues-Output-Save Rigid PDBQT保存柔性残基文件。

9. 关掉grid和删除protein:Grid Options-File-Close w/out savingEdit-Delete-Delete Molecule-1hsg_prot-Continue。

=====准备配体=====

蛋白结构类似,配体的结构也缺少氢原子,我们需要添加氢原子并且定义哪些键是可以旋转的以用于柔性docking。从PDB结构中提取配体的原子位置。indinavir的配体残基名字为MK1,以HETATM开头的行表示非核心多聚体的成分 (heteroatoms)。

Linux系统下,运行grep "^HETATM.*MK1" 1hsg.pdb >indinavir.pdb

Windows系统下,直接拷贝到文件indinavir.pdb

 

3. 将结构读入ADT;依次点选File-ReadMolecule-indinavir.pdbColor-By Atom Type-All Geometreies-OK。

 

4. 晶体结构中通常缺少氢原子 (因为氢原子电子少,且质子核对电子吸引能力弱,因此很难定位)。但是在docking过程中,氢原子,尤其是极性氢原子对计算静电作用是必须的。因此我们需要给配体加上氢原子,Edit-Hydrogen-Add-Polar only-OK(之所以选择Polar only是因为vina的官方视频里面是这么选择的)。这时氢原子会以白色短线形式出现。

5. 在ADT中定义此化合物为配体,以便ADT为其计算局部电荷(partialcharges)和设置可旋转配体键。依次点选Ligand-input-Choose-indinavir-Select Molecule for AutoDock4。这时会有一个d出框显示ADT所做的 *** 作,包括合并非极性氢(只在添加了的情况下)、计算电荷电量和设置旋转键。然后点选Ligand-Output-Save as PDBQT存储结果。

 

6. 查看ADT检测出的旋转键,依次点选Ligand-TorsionTree-Choose Torsions,可以看到Number of rotatable bonds=14/32。

====准备docking的配置文件====

docking配置文件包含了输入的受体(蛋白)、配体(化合物)和搜索参数的信息,为一个文本文件,名字任意,可以为conf.txt,内容如下

 

receptor = 1hsg_prot.pdbqt

ligand  = indinavir.pdbqt

num_modes = 50

out = dockingResult.pdbqt

log = docking.log

center_x = 16

center_y = 25

center_z = 4

size_x = 30

size_y = 30

size_z = 30

seed = 2009

 

receptor和ligand为输入文件的名字,与conf.txt在同一目录下out为输出文件的名字;log为输出日志文件的名字。centerhe和size定义搜索空间的位置和大小。num_modes设置最多显示的结合模型,鉴于只输出符合能量值要求的结果,最后输出的结合模型数量可能少于这一数值。seed设置随机数生成的种子,可以为任意整数。如果想重现之前的分析结果就需要使用相同的seed。

====Docking 小分子化合物indinavir到HIV-1蛋白酶======

使用AutoDockVina执行docking预测。

 

在windows命令行提示符或linux终端下运行命令 

vina--config conf.txt,大概需要几分钟时间。

 

2. 输出结果包含两个文件,构象文件dockingResult.pdbqt和日志文件docking.log。

dockingResult.pdbqt: 包含所有docking的模式,通常第一个为结合最好的构象,但如果前几个能量值相差不大时也有例外。

docking.log: 日志文件,包含结合能量值(第一列,越低越稳定,默认由低到高排序,所以第一个为最好的构象)、每个构象与第一个构象的距离、每个构象与第一个构象的差别。

====用PyMOL可视化docking结果====

 

打开PyMOL,依次点选File-Open文件类型选择All Files-选取结果dockingResult.pdbqt文件、原始蛋白和配体的pdb文件、原教程的pdbqt文件。

 

这个是原始的蛋白受体和配体信息:

受体蛋白信息:

配体信息:

预测的配体信息:

软件名称:手机图书生成器mBuilder 使用平台:Win9x/Me/NT/2000/XP/2003 下载网址1:http://www.newhua.com/soft/26744.htm 制作的手机图书格式(KJAVA图书)为JAR格式,可直接上传手机安装运行,本程序优化程序运行性能,并节约整体程序占用资源,可在阅读时进行搜索、书签建立,快速阅读,自动翻页,夜间模式与白天模式进行自由切换,自由调整字体大小等 *** 作。本制作工具制作的手机图书支持目前所有支持KJAVA程序的手机。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://www.outofmemory.cn/tougao/12111423.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-21
下一篇 2023-05-21

发表评论

登录后才能评论

评论列表(0条)

保存