), fitting correlation coefficient (), and leave-one-out cross-validation () are used to value the reliability, stability, and predictive ability of models. The results show that and of 4 kinds of nonlinear models are more than 0.6 and is 0.213, 0.222, 0.189, and 0.218, respectively. Compared with the multiple linear regression (MLR) model (, RSD = 0.260), the correlation coefficient and the standard deviation are both better than MLR. The reliability, stability, robustness, and external predictive ability of models are good, particularly of the model of linear kernel function and eps-regression type. This model can predict the antimicrobial activity of the compounds with similar structure in the applicability domain. "> 基于支持向量机的羟基苯甲酸酯化合物的QSAR研究 - raybet雷竞app,雷竞技官网下载,雷电竞下载苹果

生物无机化学与应用

PDF
生物无机化学与应用/2017/文章

研究文章|开放获取

体积 2017 |文章的ID 4914272 | https://doi.org/10.1155/2017/4914272

文丽,李青,李伟,蔡乔,蔡永明 基于支持向量机的羟基苯甲酸酯化合物的QSAR研究",生物无机化学与应用 卷。2017 文章的ID4914272 10 页面 2017 https://doi.org/10.1155/2017/4914272

基于支持向量机的羟基苯甲酸酯化合物的QSAR研究

学术编辑器:Konstantinos Tsipis
收到了 2017年2月20日
接受 2017年5月10日
发表 2017年7月3日

摘要

羟基苯甲酸酯是一种防腐剂,广泛应用于食品、医药、化妆品等领域。探索这些化合物的分子结构与抗菌活性之间的关系,预测结构相似的化合物,基于支持向量机(support vector machine, SVM),采用R语言,建立了25种羟基苯甲酸酯的定量构效关系(QSAR)模型,其中包括量子化学参数和分子连通性指标。预测的外部标准差误差( )、拟合相关系数( ),以及遗漏一的交叉验证( )用来评价模型的可靠性、稳定性和预测能力。结果表明 4种非线性模型均大于0.6和 分别为0.213、0.222、0.189和0.218。与多元线性回归(MLR)模型比较( , RSD = 0.260),相关系数和标准差均优于MLR。模型具有良好的可靠性、稳定性、稳健性和外部预测能力,特别是线性核函数模型和eps回归模型。该模型可以在适用性范围内预测结构相似的化合物的抗菌活性。

1.介绍

1.1.概念框架

构象(12]用于研究分子结构与生物活性及理化特性之间的关系,揭示定量关系,预测未知化合物的活性,指导新材料的合成[3.- - - - - -5].QSAR被认为是一种很有前途的技术,目前被广泛应用,因为它弥补了实验数据的损失,降低了测试成本,实现了高通量预测和筛选[6].许多国际组织和监管机构都支持和推动QSAR的使用,认为QSAR可以作为动物实验的替代。加拿大卫生部、美国食品和药物管理局(FDA)、环境保护局(EPA)、欧洲联盟和经济合作与发展组织(OECD)应用QSAR确定潜在的健康危害、筛选和优先次序[7].QSAR经过近年来的发展,已成为药物化学、环境化学、生命科学、分析化学、计算机化学甚至农药等领域的前沿课题[8- - - - - -11].

羟基苯甲酸酯是一类重要的防腐剂,广泛应用于医药、食品、化妆品、农药等领域[12].目前,世界上大约有60种食品防腐剂[13].我国生产苯甲酸和山梨酸,但由于苯甲酸毒性大,山梨酸价格高,使用量少。羟基苯甲酸酯具有高效、低毒、相容性等优点;抗菌性能比苯甲酸和山梨酸强,因为它含有酚羟基[14].因此,研究和应用羟基苯甲酸酯的抗菌活性具有重要的意义。

1.2.支持向量机在QSAR中的研究现状

SVM是Cortes等人提出的基于统计学习理论的机器学习算法[15- - - - - -17].支持向量机具有解的唯一性、与输入空间的维数无关等良好的数学特性,可用于模式识别、回归分析和函数拟合等。支持向量机的最优解优于传统的学习方法。近年来,支持向量机被应用于该化合物的QSAR研究。侯等人[18]研究了PfDHODH抑制剂抗疟活性的QSAR,方法是基于255个PfDHODH抑制剂的数据集,使用多元线性回归(MLR)和支持向量机生成4个计算模型。沙玛等人[19]得到了SVM和MLR对HIV-1衣壳抑制剂活性研究的支持。支持向量机模型的预测效率更高。Khuntwal等人[20.]利用MLR和SVM对34个四氢苯并噻吩衍生物的数据集开发了QSAR模型。智明等[21],采用岭回归(ridge regression, RR)和支持向量机(SVM)建立苦味阈值(bitter tasting threshold, BTT)和细胞毒性T淋巴细胞(cytotoxic T lymphocyte, CTL)的QSAR模型,并预测独立检验数据。结果表明,拟合、LOOCV和外部预测精度均优于现有文献的报道结果。Zhang等[22],以苯类化合物为研究对象,结合分子结构的定量描述与MLR或非线性回归统计方法SVM相结合,成功构建苯类化合物的急性毒性QSAR模型和诱变QSAR模型。张小龙通过对线性和非线性QSAR模型的比较,发现非线性QSAR模型的稳定性和预测能力都优于多个线性QSAR模型。在文献中,关于羟基苯甲酸酯的QSAR的研究很少。Jiang et al. [23]采用多线性回归法建立了QSAR模型,可以很好地预测MIC和t0.5在原子序数范围内(MIC的酯链上1-4和1-3的C ).邱等[24],利用量子化学密度泛函理论(DFT) B3LYP方法优化了11种对羟基苯甲酸酯的分子结构,然后利用逐步多元线性回归选择描述符,生成结构特征与抑制活性关系的最佳预测模型。QSAR结果表明,最低的未占据分子轨道 偶极矩的增大μ是影响化合物抗真菌活性的主要独立因素。支持向量机在QSAR研究中显示出明显优势,但目前羟基苯甲酸酯类化合物的QSAR研究还局限于线性模型;目前尚无系统非线性QSAR分析的文献。

本文利用量子化学参数和分子连通性指标对羟基苯甲酸酯的抗菌活性进行了分析。在R软件中采用SVM算法建立了QSAR模型。我们得到了分子结构参数与抑菌活性之间的构效关系大肠杆菌在最稳定的构型下,为预测类似化合物的抗菌活性提供了依据。

2.方法

2.1.数据准备
2.1.1.羟基苯甲酸酯的基本信息

本文以25个羟基苯甲酸酯类化合物为研究对象,其中邻羟基苯甲酸酯10个,间羟基苯甲酸酯2个,对羟基苯甲酸酯13个。详情见表1


ID 复合 缩写

1 甲基O-羟基苯酯酯 M-o-HB
2 邻羟基苯甲酸乙酯 E-o-HB
3. 邻羟基苯甲酸丙酯 P-o-HB
4 邻羟基苯甲酸异丙酯 IP-o-HB
5 丁基O-羟基苯甲酸酯 B-o-HB
6 异丁基O-羟基苯甲酸酯 IB-O-HB
7 邻羟基苯甲酸异戊酯 IA-o-HB
8 邻羟基苯甲酸辛酯 O-o-HB
9 邻羟基苯甲酸苄酯 Be-o-HB
10 苯基邻羟基苯甲酸酯 Ph-o-HB
11 间羟基苯甲酸甲酯 M-m-HB
12 间羟基苯甲酸乙酯 E-m-HB
13 对羟基苯甲酸甲酯 M-p-HB
14 对羟基苯甲酸乙酯 E-P-HB
15 对羟基苯甲酸丙酯 P-p-HB
16 对羟基苯甲酸异丙酯 IP-p-HB
17 对羟基苯甲酸丁酯 B-p-HB
18 对羟基苯甲酸异丁酯 IB-p-HB
19 对羟基苯甲酸戊酯 A-p-HB
20. 对羟基苯甲酸异戊酯 IA-p-HB
21 对羟基苯甲酸庚酯 H-p-HB
22 苯甲酸对羟基辛酯 O-p-HB
23 对羟基苯甲酸异辛酯 IO-p-HB
24 壬基对羟基苯甲酸酯 N-p-HB
25 苯甲酸苄酯 Be-p-HB

2.1.2.终值

抗菌半衰期( ) (h)在最低抑制浓度条件下25个羟基苯甲酸酯从文献中收集[23)的对数形式(lgt1/2)以表达其抗菌活性。结果如表所示2


ID lgt1/2

1 66.0 1.819
2 74.0 1.869
3. 138.0 2.139
4 115.0 2.060
5 17.0 1.230
6 15.0 1.176
7 20.5 1.312
8 66.0 1.819
9 42.0 1.623
10 12.0 1.079
11 43.0 1.633
12 56.0 1.748
13 76.0 1.880
14 94.0 1.973
15 176.0 2.245
16 156.0 2.193
17 61.5 1.789
18 29.0 1.462
19 34.5 1.537
20. 28.0 1.447
21 28.0 1.447
22 39.8 1.599
23 31.0 1.491
24 36.8 1.565
25 29.0 1.462

2.2.分子描述符的计算与选择

量子化学参数[25]及分子连通性指数[26]能很好地解释化合物的抗菌活性,且它们之间具有良好的相关性;因此,本文选择具有明确物理意义的词作为描述符。

2.2.1。量子化学参数

本文采用最新的Gaussian 09软件计算量子化学参数[27是美国高斯公司的半经验计算和从头计算的量子化学软件。高斯09在计算中可以通过View Gauss 5软件直接进行分子结构的计算并创建分子结构的输入文件。在计算过程中,高斯09软件直接调用输入文件,自动转换为冗余内部坐标的形式。计算结果由文本输出。每次计算前都要为系统建立合适的化学模型(计算方法),使计算成本和精度达到平衡[2728].本文的方法是B3LYP / 6-31G DFT /(D)。由于所有分子配置都是最佳配置,并且几何优化是收敛的,并且由于频率分析没有虚拟频率,因此,所有数据都是真实可靠的。从输出文件中找出有用的量子化学参数。值如表所示3.


ID 一个零点
(Hartree) (焦每摩尔) (e V) (e V) (e V)

1 −535.4 390.3 −0.2384 −0.06313 0.17524 2.736. 0.964 105.3
2.560 0.000
2 −574.7 464.7 −0.2370 −0.06142 0.17557 3.026 −1.464 117.8
−2.648 0.000
3. −614.0 539.2 −0.2367 -0.06093. 0.17573 3.155 −1.440 130.0
2.808 0.000
4 −614.0 537.7 −0.2359 −0.05991 0.17596 3.091 1.167 130.7
−2.862 0.000
5 −653.3 614.2 −0.2364 -0.06066. 0.17576 3.182 −2.906 142.3
1.294 0.000
6 −653.3 613.0 −0.2368 −0.06100 0.17578 3.169 2.434 142.2
−1.990 −0.393
7 -692.6 688.3 −0.2363 -0.06060 0.17574 3.165 2.334 154.6
2.136 0.047
8 −810.6 912.9 −0.2362 −0.06035 0.17580 3.276 −2.377 191.1
2.254 0.000
9 −766.4 603.6 −0.2381 −0.05969 0.17842 1.302 −0.182 165.9
−1.093 0.755
10 −727.1 526.4 −0.2421 −0.06882 0.17325 0.922 0.755 165.9
0.529 0.000
11 −574.7 461.5 -0.2408 −0.05736 0.18346 3.350 3.297 94.45
0.594 0.000
12 −535.4 387.3 -0.2419 −0.05896 0.18293 3.284 3.053 84.22
−1.208 0.0006
13 −535.4 387.8 -0.2450 −0.05006 0.19497 1.278 −1.247 106.0
0.280 0.000
14 −574.7 462.1 −0.2439 −0.04860 0.19528 1.194 −0.169 118.4
−1.182 0.000
15 −614.0 537.0 −0.2436 −0.04820 0.19540 1.201 0.235 130.6
−1.178 0.000
16 −614.0 535.2 −0.2433 −0.04748 0.19577 1.054 0.319 131.3
1.004 0.000
17 −653.3 611.3 −0.2434 −0.04798 0.19545 1.122 −0.995 142.9
−0.519 0.000
18 −653.3 610.6 −0.2439 −0.04838 0.19550 1.288 −1.012 142.8
−0.785 −0.131
19 -692.6 686.3 −0.2433 −0.04789 0.19544 1.1777 −0.8744 155.2
0.7889 0.0000
20. -692.6 685.6 −0.2434 −0.04795 0.19547 1.086 −0.912 155.2
−0.589 0.023
21 −771.3 836.0 −0.2433 −0.04777 0.19550 1.169 −0.179 179.6
−1.155 0.000
22 −810.6 911.2 −0.2432 −0.04772 0.19552 1.089 −1.058 191.7
−0.258 0.000
23 −810.6 910.2 −0.2433 −0.04780 0.19550 1.201 1.113 191.7
0.414 −0.179
24 −849.9 984.9 −0.2432 −0.04770 0.19553 1.169 −0.522 203.9
1.046 0.000
25 −776.4 601.9 −0.2442 −0.04966 0.19452 1.260 −0.697 174.3
−0.916 −0.512

2.2.2.分子连通性指数

分子连通性指标是根据分子结构计算出的常数,主要反映分子中原子数、价键和支链信息等。每个订单索引都有不同的含义。许多研究表明 可以表征大量的信息,这对于解释结构对生物活性的影响具有重要意义[2930.].因此,本研究选取了8个分子连通性指标,包括 , .结果如表所示4


ID

1 6.073 3.117 2.009 1.226 0.608 0.259 0.190 0.235
2 6.780 3.705 2.238 1.316 0.706 0.311 0.190 0.223
3. 7.487 4.205 2.653 1.478 0.770 0.381 0.190 0.223
4 7.650 4.100 2.971 1.436 0.775 0.349 0.426 0.389
5 8.194 4.705 3.007 1.772 0.885 0.426 0.190 0.223
6 8.358 4.561 3.509 1.588 0.818 0.421 0.599 0.629
7 9.065 5.061 3.836 1.969 0.963 0.415 0.599 0.512
8 11.020 6.705 4.421 2.772 1.623 0.904 0.190 0.223
9 9.167 5.262 3.290 2.157 1.187 0.607 0.308 0.407
10 8.460 4.824 3.014 1.898 1.008 0.425 0.258 0.327
11 6.073 3.111 2.042 1.087 0.647 0.255 0.213 0.321
12 6.780 3.699 2.271 1.177 0.780 0.320 0.213 0.309
13 6.073 3.111 2.038 0.904 0.412 0.173 0.213 0.292
14 6.780 3.699 2.267 0.994 0.508 0.237 0.213 0.280
15 7.487 4.199 2.683 1.155 0.572 0.305 0.213 0.280
16 7.650 4.094 3.001 1.114 0.576 0.281 0.449 0.392
17 8.194 4.699 3.036 1.449 0.686 0.350 0.213 0.280
18 8.358 4.555 3.539 1.266 0.620 0.353 0.622 0.446
19 8.902 5.199 3.390 1.699 0.894 0.431 0.213 0.280
20. 9.065 5.055 3.865 1.646 0.765 0.384 0.622 0.568
21 10.310 6.199 4.097 2.199 1.248 0.703 0.213 0.280
22 11.020 6.699 4.451 2.449 1.425 0.828 0.213 0.280
23 11.180 6.555 4.637 2.173 1.374 0.792 0.622 0.568
24 11.730 7.199 4.804 2.699 1.601 0.953 0.213 0.280
25 9.1670 5.256 3.609 1.792 0.823 0.467 0.331 0.464

2.3.建立的模型
2.3.1。分区的数据集

数据集的合理划分是QSAR领域的一个热点研究课题。有多种方法。本文采用随机抽样(RS) [31]将原始数据划分为训练集(22种)和测试集(邻羟基苯甲酸酯、间羟基苯甲酸酯和对羟基苯甲酸酯3种)。训练集用于建立支持向量机的非线性模型,测试集用于测试模型的外部预测能力。

2.3.2。建模方法

通过R软件程序,利用22个化合物的训练集,根据所选择的描述符,采用SVM算法建立非线性模型。首先对数据进行标准化处理,然后分别建立径向型、线性型、eps-回归型和nu-回归型4种核模型。

2.4.模型验证

模型验证在QSAR研究中非常重要,它包括两个方面:内部验证检验模型的拟合能力和稳健性,外部验证检验模型的预测能力。内部验证和外部验证同样重要[32].

2.4.1。内部验证

估计模型的稳定性、稳健性和内部预测能力的方法有很多,如拟合相关系数、交叉验证、随机模型检验、Y随机和各种残差(如均方根误差、标准残差等)[33].本文拟合相关系数( )在训练数据集的实验和预测值之间,并留下一次交叉验证( )来检验模型的可靠性、稳健性、稳定性以及模型是否过拟合。

2.4.2。外部验证

QSAR模型的一个非常重要的目的是预测新化合物甚至非合成化合物的相关活性数据,以指导有理想活性化合物的设计和合成,或筛选化合物。这就要求模型具有良好的预测能力和泛化能力;然而,交叉验证只能解释模型的内部预测能力,良好的内部预测能力并不意味着良好的外部预测能力[34- - - - - -36];也就是说,良好的交叉验证 是高外部预测能力的必要但不充分条件[35].评价模型外部预测能力的唯一方法是用新的化合物(即不涉及描述符选择和模型建立过程的外部测试集)对模型进行检验。评价模型的外部预测能力参数包括 、外部 , .在本文中,利用测试集来预测相应的lgt1/2对模型的外部预测能力进行了评价

2.5.关键描述符的提取

采用主成分分析方法提取羟基苯甲酸酯抗菌半衰期的最关键分子描述符。

3.结果

3.1.内部预测和散点图

基于选择的描述子,利用训练集建立了4个非线性支持向量机模型。lgt的实验值和内部预测结果1/2见表5和散点图1


ID lgt1/2 径向+ eps-reg 径向+ nu-reg 线性+ eps-reg 线性+ nu-reg

1 1.819 1.779216 1.781302 1.812285 1.951165
2 1.869 1.827756 1.798580 1.835602 1.744102
3. 2.139 1.713926 1.707563 1.769820 1.770619
4 2.060 1.772371 1.768500 1.792442 1.770267
5 1.230 1.599024 1.587027 1.580694 1.487888
6 1.176 1.363148 1.374539 1.355817 1.313377
7 1.312 1.373201 1.398522 1.345323 1.450414
9 1.623 1.585821 1.578657 1.629972 1.523181
10 1.079 1.494724 1.494087 1.112267 1.219324
12 1.748 1.775344 1.796207 1.781397 1.889308.
13 1.880 1.858219 1.863383 1.913434 2.022421
14 1.973 1.927762 1.934197 2.059377 2.163645
15 2.245 1.916552 1.925729 2.008084 2.130922
16 2.193 1.831546 1.848498 1.922720 2.069817
17 1.789 1.803731 1.811289 1.822127 1.903807
18 1.462 1.606335 1.624347 1.576873 1.609259
20. 1.447 1.525688 1.545616 1.413420 1.445952
21 1.447 1.554127 1.544298 1.663491 1.646921
22 1.599 1.571473 1.551537 1.576665 1.501430
23 1.491 1.524709 1.527338 1.452021 1.384236
24 1.565 1.590526 1.575234 1.531546 1.459150
25 1.462 1.534525 1.549003 1.428528 1.357148

请注意.Radial + eps-reg、Radial + nu-reg、linear + eps-reg、linear + nu-reg分别表示核函数为径向和线性,类型为eps-回归和nu-回归的4个SVM模型。
3.2.内部验证参数

见表6


参数 径向+ eps-reg 径向+ nu-reg 线性+ eps-reg 线性+ nu-reg

0.614 0.613 0.756 0.740
0.611 0.608 0.747 0.731

请注意.Radial + eps-reg、Radial + nu-reg、linear + eps-reg、linear + nu-reg分别表示核函数为径向和线性,类型为eps-回归和nu-回归的4个SVM模型。
3.3.外部验证结果

lgt1/24个SVM模型分别对测试集进行预测,结果如表所示7 模型的残差,实验值与LGT预测结果之间的残差1/2显示在表中8.4种支持向量机模型对25种lgt化合物的实验值和预测结果的散点图1/2如图所示2


ID 8 11 19

复合 O-o-HB M-m-HB A-p-HB
lgt1/2 1.819000 1.633000 1.537000
径向+ eps-reg 1.501886 1.762810 1.675167
径向+ nu-reg 1.496267 1.776929. 1.691083
线性+ eps-reg 1.559133 1.670244 1.732065
线性+ nu-reg 1.535459 1.711716 1.772964


ID 8 11 19

径向+ eps-reg 0.317114 −0.129810 −0.138167 0.213
径向+ nu-reg 0.322733 −0.143929 -0.154083. 0.222
线性+ eps-reg 0.259867 −0.037244 −0.195065 0.189
线性+ nu-reg 0.283541 −0.078716 −0.235964 0.218

3.4.主成分分析结果

见表1011

4.讨论和结论

防腐剂分子的自由度和速度决定了反应性中心原子与微生物分子活性基团或原子之间的有效碰撞。因此,防腐剂的抗菌性能本质上是由防腐剂和微生物的电子行为决定的,即防腐剂的量子生化表征。因此,从量子化学的角度研究化合物的结构与性质的关系,可以从本质上解释防腐剂的有效抗菌基团[37].Jiang et al. [23]使用多个线性回归来建立25种羟基苯甲酸酯的线性模型。参数如表所示9.结果表明了 为0.421,但当C原子数小于4时,方程具有良好的线性关系。当酯基C原子数超过4个时,影响因素变得更加复杂,不能用简单的线性关系来描述,可能是非线性或多样化的关系。因此我们使用R语言编写程序,通过支持向量机算法建立了25个羟基苯甲酸酯的4种非线性模型并预测lgt1/2.训练集的预测结果如表所示5.实验和预测lgt的散点图1/2用R软件绘制。数字1结果表明,预测值与实验值吻合较好,线性度明显。根据文献,如果 大于0.6 [3538), 大于0.5表示模型良好,大于0.9表示模型良好[39].Tropsha等人[6] 推荐 大于0.6。表格6显示两个 大于0.6和 两个具有线性核函数的模型的值接近0.75,因此我们可能认为这4个模型的稳定性、鲁棒性和内部预测能力都更好,模型没有过拟合,因为 大于 不超过25%通过RS提取,25个羟基苯甲酸酯中对位、邻位、异位化合物组成外部测试集对模型进行测试,预测结果如表所示7.Table中的参数8表明LGT的残差值1/2测试集的范围为−0.037244~0.322733和 分别为0.213、0.222、0.189和0.218。结果表明,4种模型之间具有较高的外部预测能力;其中,线性核函数模型和eps回归模型优于其他3种模型。4种支持向量机模型对25种lgt化合物的实验值和预测结果的散点图1/2如图所示2.结果表明,4种支持向量机模型的整体预测效果较好,特别是模型预测值与实验值之间的线性关系最好,其中核函数为线性,类型为eps-回归。


方法 标准偏差

高钙 25 0.649 0.421 0.311 0.260
高钙 8 ( < 4) 0.969 0.938 0.856 0.076


广告样稿。 广告样稿。 Comp。3

标准偏差 188.7974802 38.08956667 4.3318149940
比例的方差 0.9602859 0.03908591 0.0005055312
累计比例 0.9602859 0.99937176 0.9998772898


广告样稿。 广告样稿。 Comp。3

0.467 0.838 0.277
一个零点 −0.871 0.491
−0.152
−0.152 −0.238 0.944

在表10,主成分分析表明,第一主成分的方差占比达到96.03%;因此,只取第一个主成分。表格11显示第一个主成分包括 (总能量)、ZPE(零点振动能)和 (极化率)。我们考虑到 一个零点, 是影响羟基苯甲酸酯抗菌半衰期的关键因素。 是在外加电场作用下,以分子变形张量为特征的一种结构参数。这是最重要的性质 和分子的体积有关吗 包含关于分子相互作用的信息,这些信息能够描述分子作为电子受体的特性。因为 和ZPE为负,表示 ZPE越大,羟基苯甲酸酯的抗菌半衰期越短,E则相反,系数为正。

综上所述,由量子化学参数和分子连通性指标得到的QSAR非线性模型能够较好地预测羟基苯甲酸酯的抗菌活性。支持向量机算法的引入,解决了公式权重较大时QSAR相关性差、分子描述符之间非线性关系复杂的问题,为预测结构相似化合物的抗菌活性提供了依据。

因此,本文的主要结论如下:(1)采用支持向量机方法建立了25羟基苯甲酸酯类4种非线性模型,通过内外验证,4种模型的稳定性、鲁棒性和内外预测能力均较好;该模型是可行的,可以在适用性领域预测新的化合物。(2)线性核函数模型和eps-回归模型最大 ,最低 , LGT预测值与实验值之间的最优线性关系1/2在4种支持向量机模型中,该模型是最优模型。(3)支持向量机算法是解决QSAR建模中分子描述符之间多重共线性和复杂非线性关系问题的一种很好的方法。(4)E、ZPE和p是影响羟基苯甲酸酯抗菌半衰期的关键因素。

利益冲突

作者确认本文的内容没有利益冲突。

致谢

本研究得到了广东省自然科学基金资助项目(批准号:20081010901)的资助。国家自然科学基金资助项目(no. 2014A030313585);广东省科技新药研发重点项目(批准号:81473588,2014);2013 a022100041)。

参考

  1. P. R. Duchowicz, E. A. Castro, F. M. Fernández,“QSAR-QSPR研究中寻找最优描述符集的替代算法”,在数学和计算机化学中的通信,第55卷,第55期1,页179 - 192,2006。视图:谷歌学者|MathSciNet
  2. G. Mu,H·刘,Y. Wen和F. Luan,“定量结构 - 性质关系研究,用于预测常用羰基化合物的羰基特征红外吸收的预测”振动光谱,第55卷,第55期1, pp. 49-57, 2011。视图:出版商的网站|谷歌学者
  3. H. Zhu, I. Rusyn, A. Richard,和A. Tropsha,“使用细胞活力测定数据提高了动物致癌性的传统定量结构-活性关系模型的预测准确性,”环境健康展望,第116卷,第116期4, pp. 506 - 513,2008。视图:出版商的网站|谷歌学者
  4. J. C. Drosos, M. Viola-Rhenals,和R. Vivas-Reyes,“多环芳烃气相色谱保留指数的定量结构-保留关系”,色谱学报A号,第1217卷。26, pp. 4411-4421, 2010。视图:出版商的网站|谷歌学者
  5. A. A. D’archivio, M. A. Maggi, P. Mazzeo,和F. Ruggieri,“基于WHIM和GETAWAY分子描述符的反相高效液相色谱中农药的定量结构-保留关系”,分析Chimica学报号,第628卷2,页162-172,2008。视图:出版商的网站|谷歌学者
  6. A. Tropsha,“QSAR模型开发、验证和开发的最佳实践”,分子信息学,第29卷,第2期6-7,第476-488页,2010。视图:出版商的网站|谷歌学者
  7. T. Steger-Hartmann和S. Boyer,调节性毒理学的计算机预测模型, vol. 1,施普林格,柏林,德国,2014。
  8. V. Ruusmann,S. Sild和U. Maran,“QSAR Databank - 一种数字组织的方法和QSAR模型信息的归档”,“Cheminformatics杂志,第6卷,第2期1, pp. 1 - 17, 2014。视图:出版商的网站|谷歌学者
  9. T. W.Schultz,M.T. D. D. Cronin,J. D. Walker和A. O. Aptula,“毒理学的定量结构 - 活性关系(QSARS):历史观点”,分子结构杂志:THEOCHEM年第622卷1-2页,2003。视图:出版商的网站|谷歌学者
  10. Xu M., B. Ma, H. Chen, T. Hayat, Y. He, and J. Xu, " Quantitative structure-activity relationship (QSAR) models for polycyclic aromatic hydrocarbons (PAHs) dissipation in rhizolsphere based on molecular structure and effect size, "环境污染第158卷第1期8, pp. 2773-2777, 2010。视图:出版商的网站|谷歌学者
  11. “苯甲酸的毒性和定量构效关系Pseudokirchneriella subcapitata”,危险材料杂志,第165卷,第165号1-3,第156-161页,2009。视图:出版商的网站|谷歌学者
  12. C. Charnock和T. Finsrud,“结合对羟基苯甲酸酯(苯甲酸酯)以提高抗菌活性,”临床药学与治疗学杂志,第32卷,第2期6,页567-572,2007。视图:出版商的网站|谷歌学者
  13. a . L. Hoyt, D. Bushman, N. Lewis,和R. Faber,“开发一种改进的防腐剂功效测试方法,作为在可变测试条件下评估液体家庭护理产品中的防腐剂系统的预测工具,”AOAC国际期刊第95卷第1期1, pp. 203-205, 2012。视图:出版商的网站|谷歌学者
  14. r. mathammal,K. sangeetha,M. sangeetha,R. Mekala和S. Gadheeja,“分子结构,振动,紫外线,NMR,Homo-Lumo,MEP,NLO,NBO分析3,5 DI叔丁基4羟基苯甲酸,”分子结构杂志,第1120卷,第1-14页,2016。视图:出版商的网站|谷歌学者
  15. C. Cortes和V. Vapnik,《支持向量网络》,机器学习,第20卷,第2期。3,页273-297,1995。视图:出版商的网站|谷歌学者
  16. “统计学习理论中支持向量机的新解释”,科学中国。数学,第53卷,第53期1,页151-164,2010。视图:出版商的网站|谷歌学者|MathSciNet
  17. “基于直觉模糊数和核函数的支持向量机,”软计算,第十七卷,第二期4,第635-641页,2013。视图:出版商的网站|谷歌学者
  18. “恶性疟原虫二氢叶酸脱氢酶(PfDHODH)抑制剂抗疟活性的QSAR研究”,环境研究中的SAR和QSAR第27卷第2期2, pp. 101-124, 2016。视图:出版商的网站|谷歌学者
  19. N. Sharma, K. R. Ethiraj, M. Yadav等人,“识别LOGP值和电负性作为构建HIV-1衣壳抑制剂抑制活性模型的结构视角——支持向量机和MLR辅助QSAR研究,”药物化学当前主题,第12卷,第2期16,第1763-1774页,2012。视图:出版商的网站|谷歌学者
  20. K. Khuntwal, M. Yadav, A. Nayarisseri, S. Joshi, D. Sharma, and S. Suhane,“使用支持向量机和MLR辅助QSAR研究模拟四氢苯并噻吩对丙型肝炎病毒NS5B聚合酶抑制的van der Waal体积和原子质量的证明作用,”目前的生物信息学,第8卷,第2期4, pp. 465-471, 2013。视图:出版商的网站|谷歌学者
  21. 吴志明,“基于岭回归和支持向量机的高维数据特征选择及其在多肽QSAR建模中的应用”,物理化学杂志, vol. 03, pp. 498-507, 2013。视图:谷歌学者
  22. 张学林,周志贤,刘艳华等,“用线性和非线性回归方法预测芳香胺的急性毒性,”结构化学学报第33卷第3期2, pp. 244-252, 2014。视图:谷歌学者
  23. c c。江,R.-J。周,D.-J。Wang et al.,“对羟基苯甲酸酯抗菌活性的QSAR研究”,现代食品科技,第30卷,第2期6, pp. 98-102, 2014。视图:谷歌学者
  24. “对羟基苯甲酸酯类抗菌活性的QSAR研究”现代食品科技,第30卷,第2期6, pp. 98-102, 2014。视图:谷歌学者
  25. A. Y. Musa, W. Ahmoda, A. A. Al-Amiery, A. A. H. Kadhum, A. B. Mohamad,《化合物抑制效应的量子化学计算》,结构化学杂志第54卷第5期2, pp. 301-308, 2013。视图:出版商的网站|谷歌学者
  26. A. Mozrzymas,“利用分子连接指数研究阳离子gemini表面活性剂临界胶束浓度的间隔基团效应”,组合化学与高通量筛选第19卷第2期6、pp. 481-488, 2016。视图:出版商的网站|谷歌学者
  27. A.弗里施,M. J.弗里施,F. R.克莱门特等,高斯09用户参考,高斯公司出版社,2011。
  28. 使用PGI编译器移植到64位MAC操作系统的高斯09软件电脑工作站,第23卷,第2期。第6条,2010年第17条。视图:谷歌学者
  29. M. Atabati和R. Emamalizadeh,“分子连通性指数中的氢扰动及其在QSPR研究中的应用”,溶液化学杂志号,第41卷。第11页,1922-1936,2012。视图:出版商的网站|谷歌学者
  30. A. Mozrzymas,“利用分子连通性指数对阳离子gemini表面活性剂临界胶束浓度建模”,溶液化学杂志,第42卷,第2期11, pp. 2187-2199, 2013。视图:出版商的网站|谷歌学者
  31. A. Yasri和D. Hartsough,《变量选择和QSAR模型构建的最佳程序》,化学信息与计算机科学学报,第41卷,第1218-1227页,2001。视图:谷歌学者
  32. P. Gramatica和A. Sangion,“qsar模型的统计验证参数的历史考察:关于度量和术语的澄清”化学信息与建模杂志第56期6, pp. 1127-1131, 2016。视图:出版商的网站|谷歌学者
  33. E. M. de Haas, T. Eikelboom和T. Bouwman,“ECOSAR™中性有机鱼类长期QSARs的内部和外部验证,”环境研究中的SAR和QSAR第22卷第2期5-6, pp. 545-559, 2011。视图:出版商的网站|谷歌学者
  34. P. Gramatica,“QSAR模型验证的原则:内部和外部”,QSAR与组合科学,卷。26,不。5,pp。694-701,2007。视图:出版商的网站|谷歌学者
  35. G.亚历山大和T.亚历山大,“小心q2!””,分子图形与建模学报,第20卷,第2期。4,第269-276页,2002。视图:出版商的网站|谷歌学者
  36. J. Polanski, R. Gieleciak,和A. Bak,“分子设计中的概率问题:3D-QSAR方案的预测和建模能力,”组合化学与高通量筛选,第7卷,第5期8,页793-807,2004。视图:出版商的网站|谷歌学者
  37. B. Kocjan和J. Sliwiok,“维生素D的亲水性的色谱和光谱比较2和D3.”,平面色谱杂志。现代薄层色谱,第7卷,第5期4,第327-328页,1994。视图:谷歌学者
  38. A. Tropsha, P. Gramatica, and V. K. Gombar,“认真的重要性:验证是成功应用和解释QSPR模型的绝对必要。”QSAR与组合科学第22卷第2期1,第69-77页,2003。视图:出版商的网站|谷歌学者
  39. L. Eriksson, J. Jaworska, A. P. Worth, M. T. D. Cronin, R. M. McDowell, P. Gramatica,“基于分类和回归的QSARs的可靠性和不确定性评估方法及适用性评估”,环境健康展望号,第111卷10,第1361-1375页,2003。视图:出版商的网站|谷歌学者

版权所有©2017李文等。这是一篇发布在知识共享署名许可协议,允许在任何媒介上不受限制地使用、传播和复制,但必须正确引用原作。


更多相关文章

PDF 下载引用 引用
下载其他格式更多的
订单打印副本订单
的观点1393
下载629
引文

相关文章

年度文章奖:由主编评选的2020年杰出研究贡献。阅读获奖文章