ISSN在线(2319 - 8753)打印(2347 - 6710)
萨米尔Chtita1,Majdouline Larif2,穆尼尔Ghamali1,Azeddine Adad1,Hmamouchi Rachid1穆罕默德。Bouachrine3和塔希尔·Lakhlifi4 *
|
相关文章Pubmed,谷歌学者 |
访问更多的相关文章国际创新研究期刊》的研究在科学、工程和技术
建立定量结构活性关系两种针对不同癌症细胞株的细胞毒性影响,一系列的十三个咪唑并[1,a]吡嗪衍生物分子被送至主成分分析(PCA)、多重回归分析(MRA)、部分最小二乘(PLS)回归,非线性回归(RNLM)和神经网络(NN)。我们因此提出一个定量模型,解释化合物的活动依赖于多元统计分析。密度泛函理论(DFT)和从头开始分子轨道计算进行了为了得到深入的结构、化学反应和财产信息研究的系列化合物。拓扑描述符(分子量、摩尔体积、分子量、摩尔折射率,等张比容、密度、折射率、表面张力和极化率)和电子描述符(总能量(E)、最高占据分子轨道能量(EHOMO),最低未占据分子轨道能量,LUMO (ELUMO)区别和HOMO能量(差距),总分子的偶极矩(我),绝对硬度(我¨),绝对电子消极(我£)和反应指数(我·))计算了ACD / ChemSketch和高斯03 w项目,分别。这项研究表明,血管摄影,请和MNLR也预测活动,但当与安的结果相比,我们意识到通过后一种更有效的预测应验了
关键字 |
构象,DFT,咪唑并[1,a]吡嗪,细胞系。 |
我的介绍。 |
化学品的使用在商业、医学和日常生活的其他方面被公认是一个相当积极的效益;然而有持续关注他们对人类健康和环境产生负面影响[1]。超过100000的化学物质在商业规模生产和使用,并介绍了大约2000个新的每年在市场上。这些物质有很少或没有副作用,但有些可能会有害于人类健康和自然环境[2]。这种二分法在社会问题引起了监管机构和化学行业感兴趣的潜在环境影响特定化学之前释放成一个生态系统。有限的可用性化学物质的风险评估,所需实验数据和知识的普遍缺乏现有的物质属性和活动,使得欧盟委员会采取“战略白皮书化学未来的社会政策”[3]。 |
定量组织性能/活动关系部分构象)方法是计算物理化学中最实用的工具。这些方法都是基于方差的公理化合物的物理化学性质和活动是由分子结构的差异决定的。因此,如果实验数据可用于只在一群一些化学物质,人能预测丢失的从分子描述符计算整个集团和合适的数学模型[4]。全球预测毒性的定量构效关系的目标使用许多工人利用各种各样的方法。这个目标是诱人的,但尚未达到令人满意。有很多原因没有成功[5]。可用毒性数据的缺乏已经明显阻碍进步。这种缺乏成功的被一个贫穷加剧在很多研究中升值的异构性不足,或化学多样性,在数据集。进一步,而一些分子性质(如疏水性)很好地描述,其他人,包括亲电反应、电离、参数化和氢键不佳。最后,有毒的作用机理还没有完全理解或误解,或者他们的相关性在毒性的造型是忽略了[6]。 |
发现治疗癌症的新药已获得大量的利益主要是由于普遍抵制传统单药化疗药物。耐多药耐药性[7]的特点不仅药物相似的结构和功能也抗力移转无关的药物如阿霉素、长春新碱、长春花碱、宝贵和放线菌素已被记录。因此,寻找新的抗癌药物与不同的化学结构需要一个小时。在此,我们报告的合成和评价一系列咪唑并[1,a]吡嗪作为强有力的抗癌药物。 |
(1 a)咪唑并吡嗪在药物发现领域尤其是获得关注的结构类似物嘌呤(8 - 10)(图1)。衍生品的咪唑并[1,a]吡嗪具有多种药理活性,如抗菌[11],抗炎症(12 - 14),子宫放松活动[15],antibronchospastic[16],抗溃疡的[17],心脏刺激[18],[19],抗抑郁药物降糖活性[20],[21]抗增殖活动,控制过敏反应[22],[23]平滑肌松弛剂性质和磷酸二酯酶抑制活性[24]。他们还可以抑制受体酪氨酸激酶EphB4最近[25]。 |
在这个工作我们试图建立一个定量结构活性关系两种针对不同癌症细胞系细胞毒性的影响,通过研究一系列13取代咪唑并[1,a]吡嗪(图2)[26]与替换在合成2,3,6-ring位置变化产生mono - di - tri-substituted咪唑并[1,a]吡嗪具有官能团如光环,羟甲基胺、烷基、芳基、heteroaryl等等…[27]。 |
我们因此提出一个定量模型,试图解释化合物的活动依赖于多元统计分析。主成分分析(PCA)曾对化合物进行分类根据其活动和给一个估计相关的描述符的值,这个分类管理。看不到多元线性回归(MLR)曾选择所使用的描述符作为输入参数的偏最小二乘回归(PLS),倍数非线性回归(MNLR)和人工神经网络(ANN)。这些方法(MRA,请和MNLR)也曾预测活动,但当与安的结果相比,我们意识到通过后一种更有效的预测应验了。 |
二世。材料和方法 |
答:实验数据 |
实验IC50(μM)对不同肿瘤细胞株的细胞毒性效应两个活动(mdamb - 231和SK-N-SH)咪唑并[1,a]吡嗪衍生品收集从最近的出版物[27]。观察结果转换成-对数尺度logIC50并包含在表1。 |
b .计算方法 |
一直尝试联系这些化合物的活性与各种理化参数。 |
DFT(密度泛函理论)方法被用于这项研究。这些方法已成为近年来非常受欢迎的,因为他们可以达到相似的精度的其他方法用更少的时间和更少的成本计算的观点。同意DFT结果,能量的基本状态polyelectronic系统通过总电子密度可以表示,事实上,使用电子密度而不是波函数计算DFT的能源构成的基本基础[28]用B3LYP功能[29]和我组(d)基础。B3LYP, DFT方法的一个版本,使用贝克的带三个参数的功能(B3)和包括一个混合的高频DFT交换条件与李的梯度修正相关功能,杨和帕尔(LYP)。所有物种在调查中确定的几何优化所有几何变量没有任何[30]对称约束。 |
分子的三维结构使用高斯视图生成3.0,然后,所有的计算都使用高斯03 w系列项目,执行13个化合物的几何优化是由B3LYP方法使用我(d)基础集。ChemSketch程序(演示版本10.0)[31]来计算其他的分子描述符 |
c .计算的分子描述符 |
计算描述符使用高斯03 w |
从DFT计算结果,得到了量子化学描述符为模型建立如下:总能量(ET()庞珍庞珍以前),最高占据分子轨道的能量(EHOMO (eV)),最低未占据分子轨道的能量(ELUMO (eV)), LUMO, HOMO能量之间的能量差(eV)(差距),整个分子的偶极矩(¯(德拜)),绝对硬度(¯¨),绝对电子消极(¯£)和反应性指数(¯·)[33]。一个¯¨,¯£和一个¯·由以下方程: |
计算描述符使用ACD / ChemSketch |
先进的化学发展的ACD / ChemSketch计划[31]是用来计算分子量(PM),摩尔体积(MV(立方厘米)),分子量(MW),摩尔折射率((立方厘米)先生),等张比容(Pc(立方厘米),密度(D(克/立方厘米),折射率(n),表面张力(一个¯§¯(达因/厘米)和极化率(¯¡e(立方厘米))[32]。 |
一个¯·分子量(MW):用于描述符系统,如交通研究中扩散的模式操作。定量构效关系研究是一个重要的变量有关的各种药物的交叉耐药性在耐多药细胞株。 |
摩尔体积(MV):添加剂的摩尔体积计算增量。添加剂得到了原子的增量计算的密度和使用数据库MW: |
d .统计分析 |
解释的结构-活性关系,这些16描述符计算13分子使用高斯03 w,高斯视图和ChemSketch软件。 |
我们所进行的研究包括: |
主成分分析(PCA)在一个软件叫XLSTAT可用 |
看不到多元线性回归(MLR) XLSTAT中可用的软件 |
偏最小二乘回归(PLS) XLSTAT中可用的软件。 |
非线性回归(RNLM)中可用XLSTAT软件。 |
神经网络(RN)中可用软件MATLAB版本9。 |
分子的结构基于咪唑并[1,a]吡嗪(1-13)统计方法研究了基于主成分分析(PCA)[34]使用软件XLSTAT版本演示2009 [35]。主成分分析是一种统计技术用于总结所有的信息编码结构的化合物。也非常有助于了解化合物的分布[36]。本质上这是一个描述性统计方法旨在在场,以图形形式,最大的信息包含在数据表1和表2所示。 |
看不到多元线性回归(MLR)分析模型的建模采用了后代选择和消除变量构造活动的关系。这是一个数学技术,最大限度地减少实际值和预测值之间的区别。它也曾选择所使用的描述符的输入参数部分最小二乘(PLS),和非线性回归倍数(MNLR)和人工神经网络(ANN)。 |
(高)、(PLS)和(MNLR)使用软件生成XLSTAT版本演示2009 [35],IC50活动预测细胞毒性的影响。方程的相关系数(R)、均方误差(MSE),渔民F统计量(F)和意义(F值)[35]。安是人工系统模拟人类大脑的功能。三个组件构成神经网络:处理元素或节点,节点之间连接的拓扑结构,学习新信息编码规则的网络。虽然有许多不同的ANN模型,定量构效关系是最常用的一种安在三层前馈网络[37]。在这种类型的网络,神经元排列成层(一个输入层、隐层和输出层)。每个神经元在任何层是完全连接成功的神经元层和不属于同一层神经元之间的连接。 |
根据采用的监督学习,网络被教导给他们输入模式和相应的目标输出的例子。通过一个迭代的过程,网络连接权值被修改,直到给期望的结果的训练集数据。反向传播算法用于最小化误差函数。该算法前面描述了一个简单的示例应用程序[38]和一个详细的算法[39]。 |
三世。结果与讨论 |
答:数据集进行分析 |
定量构效关系分析使用的IC50 mdamb - 231的13个化合物,和SK-N-SH细胞(实验值)作为[27]报道,16日化学描述符的值如表2所示。 |
原则(这两项研究)是第一次执行,主成分分析(PCA),这可以让我们消除高度相关的描述符(依赖),然后执行一个减少高钙的研究基于消除描述符(一个接一个地)异常,直到一个有效的模型(包括临界概率:假定值< 0.05为所有描述符和模型完成)。 |
b .主成分分析 |
十六岁的整体描述符(变量)编码13分子被送至主成分分析(PCA)。十二个主成分。前三个坐标轴F1、F2和F3的贡献分别为43.4%,32.6%和15.3%的总方差,总信息估计的百分比为91.3%,足以描述信息所代表的数据集。表3显示了描述符的贡献F1, F2和F3。描述符先生,MV, Pc,¯¡e, EHOMO,差距和¯一个¨¯F1的最重要贡献,n的描述符,一个¯§,ELUMO,一个¯£和¯F2·最重要的贡献,和描述符点,D,一个¯和日志(e)对F3最重要的贡献。 |
进行了主成分分析(PCA)来识别不同变量之间的联系。16个描述符之间的相关性作为相关矩阵如表4所示,在图3中描述了这些描述符相关。 |
在平面上投影的化合物一分之三轴的F1, F2和F3(图4),这些化合物分布在四个区域。区域1包含化合物有一个日志(- E)的值在4.296和4.368之间,地区2包含化合物有一个日志(E)的值在4.415和4.473之间,地区3包含化合物有一个日志(E)的值在4.929和4.935之间和地区4包含化合物有一个日志(E)的值在4.940和4.953之间。 |
c .多元线性回归儿童高 |
为了提出一个数学模型,定量地评价取代基的物理化学效应的两个活动的全部13个分子的集合,我们提交的数据矩阵构成明显的14个物理化学变量对应13分子,逐步多元回归分析。该方法使用系数R, R2, f值来选择最佳的回归性能。其中R是相关系数;R²确定系数;均方误差均方误差;F是费舍尔F统计量。 |
治疗与多元线性回归更为准确,因为它允许您为每个活动连接结构描述符13分子定量评估取代基的影响。选择的描述符是: |
点,n,一个¯和¯£mdamb - 231;一个¯§一¯SK-N-SH和n |
看不到定量构效关系模型的建立使用多元线性回归(MLR)方法是由以下方程: |
费舍尔的方差齐性检验。考虑到相对应的概率SK-N-SH F值低于0.05,这意味着我们会以低于0.28%的风险假设零假设是错误的。因此,我们可以很有信心地认为模型的确带来大量的信息。mdamb - 123, F值= 0.265)(F值超过0.05,模型并不重要。(表5和6) |
预测的价值活动(日志(mdamb - 231)和日志(SK-N-SH)计算从方程(1和2),并给出了观测值在表10。相关性的预测和观察如图5所示。 |
。 |
描述符提出了方程(1和2)高钙,因此,作为输入参数的偏最小二乘(PLS),和非线性回归倍数(MNLR)和人工神经网络(ANN)。 |
d .偏最小二乘请 |
偏最小二乘回归(PLS)是一种有效的基于协方差和最优的标准方法。建议在这种情况下,变量的数量很高,并且很可能解释变量是相关的。(http://www.xlstat.com/en/productssolutions/ pls.html)。我们提交的数据矩阵构成明显的高提出的描述符对应13分子,偏最小二乘(PLS)。该方法使用系数R, R2, f值来选择最佳的回归性能。定量构效关系模型的建立采用偏最小二乘(PLS)法是由以下方程: |
相关系数(R),确定系数(R²)的均方误差(MSE)和标准差(S)两种模式。(表7)。 |
预测的价值活动(日志(mdamb - 231)和日志(SK-N-SH))计算出方程(3和4),并给出了观测值在表10。相关性的预测和观察如图6所示。 |
尽管我们取得的好成绩通过多元线性回归和偏最小二乘(PLS),很可能发生任何非线性关系。XLSTAT软件执行的非线性回归和神经网络是合适的概念来完成这项任务。 |
大肠倍数非线性回归(MNLR) |
我们使用非线性回归模型的技术提高定量结构-活性关系评价取代基的影响。它考虑几个参数。这是最常见的多维数据研究工具。我们已经应用到数据矩阵构成明显的高对应13分子提出的描述符。系数R, R2和f值是用于选择最佳的回归性能。 |
预测活动的值计算出方程(5和6),并给出了观测值在表10。相关性的预测和观察如图7所示。 |
f .人工神经网络(ANN) |
神经网络(ANN)可以用于生成预测模型的定量结构活性关系(构象)之间的一组分子描述符从高钙和观察活动获得。 |
相关性系数和标准估计误差,获得神经网络(表9),显示所选择的描述符由高相关,模型提出了预测活动有关。 |
预测的价值活动,给出了观测值在表10。 |
获得的平方相关系数(R2)值证实神经网络的结果是最好的构建定量构效关系模型。 |
在本部分中,我们研究了最佳定量构效关系回归方程建立了线性在这项研究中。基于这个结果,比较机场核心计划的质量,高钙,请,MNLR和ANN模型表明,ANN模型有更好的预测能力,因为安方法给出更好的结果比高,请和MNLR。安能建立一个分子描述符和令人满意的关系研究化合物的活性。 |
活动使用ANN计算和预测的值给出了观测值在表10。相关性的预测和观察如图8所示。 |
四。结论 |
在这个工作我们已经调查了几个化合物的构象回归预测毒性基于咪唑并[1,a]吡嗪衍生品。 |
比较不同模型的关键统计R2像R或通过使用不同的统计工具和不同的描述符表10所示。 |
高质量的研究,请,RNLM和ANN模型表明: |
请方法给低系数的测定(R2),因此在预测的值没有效率的活动。 |
非线性回归和神经网络安结果比其他方法更好的预测能力。 |
使用ANN方法,我们建立了几个描述符和抑制值之间的关系(IC50)咪唑并[1,a]吡嗪对人类肿瘤细胞系(日志(mdamb - 231)和日志(SK-N-SH))在满意的礼仪。 |
最后,我们可以得出结论,研究了描述符,它足够丰富的化工、电子和拓扑信息编码结构特征可能与其他描述符用于定量构效关系模型预测的发展。 |
承认 |
我们感激“协会Marocaine des Chimistes Theoriciens”(AMCT)有关项目的相关帮助 |
引用 |
|