所有提交的电子邮件系统将被重定向到在线稿件提交系统。请作者将文章直接提交给在线稿件提交系统各自期刊的。

利用AutoDock-Vina虚拟筛选靶蛋白CYP26A1的配体分子

Madhu Yadav1 *和Gurmit Singh2
  1. 研究学者,生物信息学。计算生物学系生物信息学1, Sam Higginbottom农业技术与科学研究所(德克萨斯大学),阿拉哈巴德211007。U.P.印度。
  2. 前校长兼教授。计算机科学与信息技术系。Sam Higginbottom农业技术与科学研究所,印度阿拉哈巴德211007
相关文章Pubmed谷歌学者

浏览更多相关文章国际科学、工程与技术创新研究杂志

摘要

利用计算机辅助对接筛选靶蛋白的配体分子是合理发现药物的关键步骤。基于这种情况,我们尝试开发一个可以在windows和linux两种平台下运行的虚拟筛选应用系统,命名为VSDK虚拟对接筛选。利用细胞色素P450 (CYP26A1)的预测模型对NCI多样性亚群iii配体数据库进行虚拟筛选,该数据库包含1597种化合物。根据对接能量得分,发现前4位配体ZINC03916235、ZINC01855333、ZINC03830627、ZINC01629596的能量得分最低,表明与CYP26A1活性位点的结合亲和力较高。这些配体可能作为CYP26A1的有效抑制剂

关键字

CYP26A1,虚拟筛选,NCI多样性子集,AutoDock_Vina,对接。

介绍

虚拟筛选起源于20世纪70年代,当时使用二维结构片段引入了复合数据库搜索[1,2]。随后,各种不同的方法被引入,该领域仍在迅速发展。在药物开发过程中,为特定分子靶点找到合适的先导化合物是至关重要的一步。传统上,大型化学文库的高通量筛选(HTS)一直是鉴定新型先导化合物的主要来源。近年来,人类基因组计划的快速发展提供了越来越多的潜在药物靶点进行筛选。
虚拟筛选是一种计算过滤器,用于减少要进行实验筛选的化学文库的大小,并提供了一个机会,大大减少与铅识别相关的时间和精力。其优点是具有提高命中率的集中子集和用于筛选和合成的优先级库。有两种基本的虚拟筛选方法:基于配体的方法[3]和基于受体的方法[4]。基于配体的方法旨在识别与可能与靶标相互作用的已知配体具有物理和化学相似性的分子(基于药效团,基于描述符)。这种类型的方法限制了命中的多样性,因为它们受到已知配体性质的影响。基于受体的虚拟筛选(蛋白质-配体对接,活性位点导向的药效团)利用目标蛋白质的3D结构知识,在化学数据库上施加基于结构的过滤器,以选择可能与蛋白质活性位点残基有利相互作用的候选化合物。这是一种更加开放的方法,允许鉴定结构新颖的配体,这些配体可能与已知配体具有相似的相互作用,或者可能与结合位点[5]的其他部分具有不同的相互作用。
筛选小分子药物的目的是为药物化学家提供新的有效化合物,这些化合物可以作为开发候选药物的起点。计算化学和小分子建模提供了常用的工具,通过选择或设计要测试的化合物来指导和提高实验室筛选的效率。

材料与方法

A.计算机环境:VSDK设计用于除Linux平台外的任何版本的MS windows上运行。用于虚拟筛选的高性能计算系统(IBM workstation×3400),双操作系统[windows, linux (ubuntu)], Java环境,高速互联网(宽带)连接,不间断和稳定的电源。
B.基于受体的虚拟筛选:分子识别[7]是药物作用的基本基础,药物分子通过与靶蛋白结合并形成稳定的蛋白质-配体复合物而表现出药理活性。基于受体的虚拟筛选(RBVS)旨在利用配体和靶蛋白之间的分子识别来选择与三维结构已知或推断的生物学相关靶标活性位点强烈结合的化学实体。这种方法使用对接和评分[8]对虚拟库中的候选库进行排序。对接算法[9]与预测配体构象和取向(或姿态)在受体的目标活性位点。评分方法评估目标与小分子之间的结合相互作用,旨在根据计算的结合相互作用预测化合物的生物活性。在RBVS中,人们从目标蛋白质的3D结构和配体的3D数据库开始,并使用虚拟过滤来对接和评分化合物,作为识别潜在的主要候选物以进行进一步分析和改进的手段。
C.算法细节及虚拟筛选执行:(A)小分子数据库制备:选择文库,剥离反离子,添加h原子,检查/修复价问题,在生理pH下进行质子化,计算2D性质,转换为3D,能量最小化小分子。(B)目标结构选择:x射线,核磁共振或同源模型,结构质量。(C)筛选库:Lipinski 's Rule of Five,药效团模型。(D)结合位点定义:配体结合位点、催化位点、蛋白-蛋白相互作用位点。(E)对接预测配体在结合位点的构象和取向。打分来评价靶与配体之间的相互作用能。目视检查选择与结合位点残基有良好相互作用的分子。(F)生物分析中虚拟命中的活性测试。(G)先导优化:利用药物化学、SAR、结构研究对具有生物活性的化合物进行进一步修饰,得到第二代化合物(图1)。
图像
D.用于虚拟筛选的数据库:对于小分子化合物数据库,希望虚拟库具有最大的结构多样性,从而最大限度地为目标大分子找到命中的机会。虚拟筛选中常用的一些小分子数据库是大型公共数据库,如ZINC(330万市售化合物);免费),可用化学品目录(ACD, 400万条目;非免费),美国国家癌症研究所化合物数据库(NCI,400,000个条目;免费)和MDDR (MDL药物数据报告,bbb147,000个条目)。其他可能的小分子收集包括CMC(综合药物化学,bbb8600个条目),CSD(剑桥结构数据库),Beilstein和SciFinder。大型制药公司拥有数百万种化合物的公司数据库。在这里,我们使用了NCI多样性子集iii数据库,其中包含1597个配体分子。
E.需要输入的文件和目录:AutoDock是使用最广泛的对接应用工具之一,它的使用需要一套准备步骤来进行一般筛选。在此过程中诱导的是可接受的配体和受体大分子的制备,图谱的计算,每个配体文件夹的创建等。AutoDock-Vina是一个用于分子对接和虚拟筛选的新程序。VSDK (Virtual Screening by Docking)只需要两个准备步骤:受体和配体的准备,以及指定网格中心、网格盒大小和对接运行号的配置文件。使用新受体的虚拟筛选可以简单地通过改变受体*来重复。PDBQT文件,并相应地修改配置文件。创建一个工作目录,其中将保存所有必要的文件。下载目标分子(*)。pdb格式),并使用AutoDock工具(ADT)确定网格中心。然后是*。大分子的PDB格式应转换为*。pdbqt格式。 For the ligands, we search and obtained the small molecules from molecular databases such as NCI diversity Subset-III, ZINC. Ligands must be in mol2 format. Finally, we create a conf.txt file which includes receptor in *.pdbqt format, a grid center with x,y,z coordinates in Angstrom, a grid box size in Ǻ, and a docking run number, usually 10 or more.
F.虚拟筛选:为了对靶蛋白Cytochrome P450 (CYP26A1)进行虚拟筛选,使用Q-siteFinder服务器(http://www.modelling.leeds.ac.uk/cgi-bin/qsitefinder/qsitefinder.cgi)预测模型结构中的活性位点,这是一种基于能量的预测蛋白质配体结合位点的方法。在Q-SiteFinder中,蛋白质表面涂有一层甲基(-CH3)探针,以计算蛋白质与探针之间的范德华相互作用能。保留具有良好相互作用能的探针,并根据簇中探针的数量对这些探针的簇进行排序。然后将最大或能量最有利的簇排在第一位,并将其视为潜在的配体结合位点。在所有10个预测结合位点中,选择第一个活性位点筛选一组配体数据库。利用蛋白配体对接方法,对从ZINC数据库中检索到的NCI多样性亚群iii分子进行了CYP26A1靶点的虚拟筛选。ZINC是一个免费的商业可用化合物数据库,用于虚拟筛选。锌含有超过2100万种可购买的化合物,可以随时停靠,3D格式。锌数据库由加州大学旧金山分校(UCSF)的Shoichet实验室提供(http://zinc.docking.org/)[10]。虚拟筛选使用Autodockvina软件包(http://vina.scripps.edu/)进行。 Before performing the screening process, a set of 1597 compounds (NCI Diversity subset-III) available in mol2 file format were converted into pdbqt file format using a small python script prepare_ligand4.py. The receptor molecule (target) was also converted into pdbqt format using prepare_receptor4.py script available in Autodock Tools package. Using this program the hydrogen and hydrophobic interactions between the ligand and amino acid residues within the active site of the CYP26A1 were analyzed.
利平斯基的“五法则”是一条经验法则,用于评估药物的相似性或确定具有某种药理或生物活性的化合物是否具有使其可能成为人类口服有效药物的特性。该规则描述了药物在人体内药代动力学的重要分子特性,包括它们的吸收、分布、代谢和排泄(“ADME”)。然而,该规则并不能预测化合物是否具有药理活性。该规则对于药物开发非常重要,在药物开发中,具有药理活性的先导结构逐步优化,以增加活性和选择性,以及Lipinski规则所描述的药物样性质。

结果与讨论

CYP26A1三维结构中的活性位点在X、Y、Z坐标分别定位为40.00Å、7.00Å和17.00 Å。在对CYP26A1作为药物靶点进行虚拟筛选之前,使用MGL工具包中的Python脚本制备受体。对接受体的网格大小在X、Y、Z坐标分别为30Å、30Å、30Å,保证了搜索空间足够大,配体可以在其中旋转。利用Autodock vina软件包,通过蛋白配体对接方法从NCI多样性亚群III中筛选了1597个分子。Autodock vina算法在受体活性部位搜索不同方向的配体。大多数的对接算法都涉及到搜索和评分两个部分。vina评分函数融合了基于知识的电位和经验评分函数,从受体-配体复合物的构象偏好和实验亲和测量中提取经验信息。在使用vina包执行虚拟筛选之后,使用ADT(自动停靠工具)中的Python脚本从日志文件中分析停靠结果。根据能量评分,选择NCI多样性亚群III分子中排名前10位的配体进行进一步分析表1。
图像
根据Lipnski法则对筛选到的配体进行进一步分析。利普斯基规则由一组参数及其阈值组成,根据这些参数确定化合物的药物可能性。配体制备的第二个重要阶段是歧义性的研究。歧义研究是为了检查结构确认中的歧义或怀疑。为了进行歧义研究,使用了Dundee PRODRG服务器。PRODRG (http://davapcl.bioch.dundee.ac.uk/prodrg/index.html)采用小分子的描述,并从中生成各种拓扑结构,以及各种格式的能量最小化坐标。模糊性给出了分子的净电荷、部分电荷数、键、键角的信息,在适当的二面体中提供了信息。筛选化合物的第三个也是最重要的阶段是毒性分析。ADME和毒性试验已成为新药开发中最重要的研究活动之一。ADME是用于吸收、分布、代谢和排泄的药代动力学和药理学的首字母缩略词,并描述药物化合物在生物体中的处置。 The four criteria all influence the drug levels and kinetics of drug exposure to the tissues and hence influence the performance and pharmacological activity of the compound as a drug. If the drug is not fulfilling any of these criteria it will lead to toxic. The tool used to analyze the ADME and Toxicity of the chemical is Moyle ADME Server (http://mobyle.rpbs.univ-parisdidcrot. fr/cgi-bin/portal.py?form=FAF-Drugs#forms::FAF-Drugs2). In the parameters, the rings number should be less than 4 as the number of rings increases the aromaticity and structure complexity which in turn affect the toxicity. It provides the information weather compound submitted is rejected or accepted based on which chemical is filtered as non toxic and accepted (Table 2).
图像
利平斯基的“五法则”是一条经验法则,用于评估药物的相似性或确定具有某种药理或生物活性的化合物是否具有使其可能成为人类口服有效药物的特性。该规则描述了药物在人体内药代动力学的重要分子特性,包括它们的吸收、分布、代谢和排泄(“ADME”)。该规则对于药物开发非常重要,在药物开发中,具有药理活性的先导结构逐步优化,以增加活性和选择性,以及Lipinski规则所描述的药物样性质。
鉴于当前评分功能的局限性,该领域最近的趋势是使用共识评分方案和目视检查来选择可能的候选人。共识评分结合了不同评分的信息来平衡单个评分的误差,减少了单个评分函数识别的假阳性数量,提高了识别真配体的几率。

结论

结合亲和力数据本身并不能决定药物的整体效力。效力是结合体和配体功效复杂相互作用的结果。配体功效是指配体与靶受体结合后产生生物反应的能力和这种反应的数量大小。这种反应可以是激动剂、拮抗剂,这取决于产生的生理反应。CYP26A1的预测模型用于NCI多样性亚群- III配体数据库的虚拟筛选,该数据库包含1597种化合物。结合对接能量得分和ADME性质,发现前4位配体ZINC03916235、ZINC01855333、ZINC03830627、ZINC01629596的能量得分较低,表明与CYP26A1活性位点的结合亲和力较高,符合lipinki法则5和ADME性质。因此,这些配体可能被证明是CYP26A1维甲酸代谢的有效抑制剂。然而,这些配体对人类CYP26A1的抑制活性还需要药理学研究来证实。

参考文献

  1. Blake, j.e., Famer, n.a.和Haines, r.c.“用于处理化学结构图的交互式计算机图形系统”。[J]化学信息与计算科学。第17卷,第223 - 228页(1977)。
  2. Dromey, R. G.,“一种灵活高效的大型数据库子结构搜索结构分子式”。化学信息学与计算机科学杂志。卷18,页163 - 168(1978)。
  3. “虚拟和高通量筛选的集成”。自然评论:药物发现。Vol . 1, pp.882-894(2002)。
  4. Fische, E. " einfinuss der Configuration auf die wirkung der Enzyme "。她的Dt化学变化。卷:27日pp.2985 - 2993(1894)。
  5. 穆格,我,还有我。“对接计分”。[j] .托勒纳尔,德温特,W.。Langenaeker和P. Bultinck(编辑),“计算药物化学和药物发现”。纽约:Marcel Dekker, pp. 405-436(2004)。
  6. 乔根森,W. L.《计算在药物发现中的许多作用》。科学。Vol.303, pp.1813-1818(2004)。
  7. Fische, E. " einfinuss der Configuration auf die wirkung der Enzyme "。化学,第1卷。27,页2985 - 2993(1894)。
  8. 王荣,陆艳,王思,“分子对接中11个评分函数的比较评价”。药物化学杂志。Vol.46(12), pp.2287-2303(2003)。
  9. Halperin, I., Ma, B., Wolfson, H.和Nussinov, R.“对接原则:搜索算法概述和评分函数指南”。蛋白质Vol.47(4), pp.409-443(2002)。
  10. Irwin JJ & Shoichet BK.《锌:用于虚拟筛选的商业可用化合物的免费数据库》。[J]。卷45(1),pp.177-182(2005)。
全球科技峰会