info:eu-repo/semantics/article
Comparison of the performance of an artificial neural network and multiple linear regression in the prediction of the biological activity of cocaine analogues from molecular descriptors
Comparación del desempeño de una red neural artificial y regresión lineal múltiple en la predicción de la actividad biológica de análogos de la cocaína a partir de descriptores moleculares
Registro en:
10.54139/revinguc.v29i3.285
Autor
Puerta, Luis
Labrador, Henry
Arnías, Mario
Institución
Resumen
The objective of this investigation was to compare the performance of artificial neural networks against multiple linear regression in predicting the biological activity of cocaine analogues from molecular descriptors. For this purpose, a set of 14 molecular descriptors grouped into quantum chemical descriptors and descriptors of the three-dimensional structure of the molecule were selected and their values were calculated theoretically for 65 cocaine analogue structures, followed by the construction of the artificial neural networks model and multiple linear regression for the prediction of biological activity expressed as affinity (IC50). It was found that the artificial neural networks had an R2 of 0,8651 while the linear multiple regression had an R2 value of 0,039, showing that artificial neural networks perform better than linear multiple regression in the prediction of the biological activity of cocaine analogues from the selected molecular descriptors, and that the effect of these descriptors on the biological activity is non-linear in nature. El objetivo de la presente investigación, fue comparar el desempeño de las redes neurales artificiales con la regresión lineal múltiple en la predicción de la actividad biológica de los análogos de la cocaína a partir de descriptores moleculares. Para esto, se seleccionó un conjunto de 14 descriptores moleculares agrupados en descriptores químicos cuánticos y descriptores de la estructura tridimensional de la molécula y se calcularon sus valores de forma teórica, para 65 estructuras análogas de la cocaína, realizándose luego la construcción del modelo de redes neurales artificiales y regresión lineal múltiple, para la predicción de la actividad biológica expresada como afinidad (IC50). Se encontró que las redes neurales artificiales presentaron un R2 de 0,8651, mientras que la regresión múltiple lineal presentó un valor de R2 de 0,039, lo que indica que las redes neurales artificiales tienen un mejor desempeño que la regresión múltiple lineal en la predicción de la actividad biológica de los análogos de la cocaína a partir de los descriptores moleculares seleccionados, y que el efecto de los descriptores sobre la actividad biológica es de naturaleza no lineal.