Main Article Content
QSPR study of the water solubility of a diverse set of agrochemicals: hybrid (GA/ MLR) approach
Abstract
A quantitative structure- property relationship (QSPR) was performed for the prediction of the aqueous solubility of pesticides belonging to four chemical classes: acid, urea, triazine, and carbamate. The entire set of 77 pesticides was divided into a training set of 58 pesticides and a test set of 19 pesticides according to the Snee technique. A six descriptor model, with squared correlation coefficient (R2) of 0.8895 and standard error of estimation (s) of 0.52 log unit, was developed by applying multiple linear regression analysis using the ordinary least square regression method and genetic algorithm- variable subset selection. The reliability of the proposed model was further illustrated using various evaluation techniques: leave- one- out cross- validation, bootstrap, randomization tests, and validation through the test set.
Key Words: pesticides- aqueous solubility- QSPR- molecular descriptors- multiple linear regression.
Etude QSPR de la solubilité aqueuse d'un ensemble de divers produits
agrochimiques: approche hybride (AG/RLM)
Une relation quantitative structure-propriété (QSPR) a été réalisée pour la prédiction de la solubilité aqueuse des
pesticides appartenant aux quatre classes chimiques: acide, urée, triazine, et carbamate. L'ensemble des 77
pesticides a été divisé en un ensemble de calibrage de 58 pesticides et un ensemble de test de 19 pesticides selon
la technique de Snee. Un modèle de six descripteurs, avec un coefficient de corrélation (R2) de 0,8895 et une
erreur standard d'estimation (s) de 0,52, a été développé en appliquant une analyse de régression linéaire multiple
en utilisant la méthode de régression des moindres carrés ordinaires et les algorithme-génétiques pour la
sélection des sous-ensembles de variables. La fiabilité du modèle proposé a été en outre illustrée en utilisant
diverses techniques d'évaluation: validation croisée par leave- one- out, bootstrap, tests de randomisation, et la
validation par l'ensemble de test.
Mots clés: pesticides- solubilité aqueuse- QSPR- descripteurs moléculaires- régression linéaire multiple.