Redes neurais artificiais com componentes principais para a construção de modelos de predição em dados de espectroscopia NIR

Ferreira, Roberta de Amorim

Artificial neural networks with principal components for constructing prediction models in NIR spectroscopy data

dc.contributor	Peternelli, Luiz Alexandre
dc.contributor	http://lattes.cnpq.br/6364173429092431
dc.creator	Ferreira, Roberta de Amorim
dc.date	2022-09-29T13:52:37Z
dc.date	2022-09-29T13:52:37Z
dc.date	2022-07-06
dc.date.accessioned	2023-09-27T22:00:53Z
dc.date.available	2023-09-27T22:00:53Z
dc.identifier	FERREIRA, Roberta de Amorim. Redes neurais artificiais com componentes principais para a construção de modelos de predição em dados de espectroscopia NIR. 2022. 72 f. Tese (Doutorado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa. 2022.
dc.identifier	https://locus.ufv.br//handle/123456789/30009
dc.identifier	https://doi.org/10.47328/ufvbbt.2022.557
dc.identifier.uri	https://repositorioslatinoamericanos.uchile.cl/handle/2250/8969471
dc.description	A espectroscopia no infravermelho próximo (NIR), associada a métodos estatísticos multivariados, vem sendo utilizada para a predição de indivíduos com maior produtividade. O método Partial Least Squares (PLS) é comumente empregado para ajuste de modelos de dados NIR. Entretanto, este método considera que a relação espectro/propriedade seja linear, o que não é sempre garantido em dados dessa natureza e o que pode, consequentemente, influenciar na acurácia do modelo. Alternativamente, a rede neural artificial (ANN) associada à análise de componentes principais (PCA), denominada PCA-ANN, possui a vantagem de ser eficiente em lidar com dados não lineares, incompletos e com ruídos, captando assim algumas complexidades presentes nos mesmos. Além disso, tal abordagem permite o não uso de pré- tratamentos, o que pode aumentar a capacidade preditiva dos modelos, além de diminuir o custo e o tempo das análises, quando comparada ao PLS associado aos pré-tratamentos usuais. O objetivo deste estudo foi construir e validar modelos de predição e processos de classificação, além de verificar se existe diferença significativa entre o método PLS, associado à matriz de espectros pré-tratados, e o método PCA-ANN, aplicado aos dados brutos. Para tanto, tais métodos foram aplicados a oito conjuntos de dados NIR, na forma bruta (sem pré- tratamentos) e com pré-tratamentos. A avaliação da capacidade preditiva dos modelos obtidos ocorreu por meio da correlação entre os valores preditos e os valores originais, e da raiz quadrada do erro quadrático médio de predição. Já a avaliação dos processos de classificação ocorreu através da taxa de erro aparente (TEA) e da taxa de verdadeiros positivos (TVP). Os resultados alcançados indicam que, na maioria dos conjuntos de dados analisados, o método PCA-ANN não difere estatisticamente do PLS para a predição dos modelos e para os processos de classificação, por meio da aplicação dos testes t e de Wilcoxon (valor-p > 0,01). O PCA- ANN deve ser escolhido para a realização de futuras análises, pois apresenta tempo computacional inferior àquele referente ao PLS. Palavras-chave: PLS. PCA-ANN. Pré-tratamentos. Quimiometria. Predição.
dc.description	Near infrared (NIR) spectroscopy, associated with multivariate statistical methods, has been used to predict individuals with higher productivity. The Partial Least Squares (PLS) method is commonly used to fit NIR data models. However, this method considers that the spectrum/property relationship is linear, which is not always guaranteed in data of this nature and can, consequently, influence the accuracy of the model. Alternatively, the artificial neural network (ANN) associated with principal component analysis (PCA), called PCA-ANN, has the advantage of efficiently dealing with non-linear, incomplete, and noisy data. PCA-ANN can, thus, capture some of the complexities of this kind of data. Also, the PCA-ANN approach allows for the non-use of pretreatments, in addition to reducing the cost and time of the analysis compared to the PLS associated with the usual pretreatments. The objective of this study was to build and validate prediction models and classification processes under PLS and PCA-ANN approaches, besides considering pre-treated and untrated sprectra. These methods were applied to eight NIR datasets, in raw form (without pretreatments) and with pretreatments. The model's predictive capacity was evaluated through the correlation between the predicted values and the original values, and the square root of the mean squared error of prediction. The evaluation of the classification processes was carried out through the apparent error rate (AER) and the true positive rate (TPR). In most of the analyzed datasets, the PCA-ANN method does not differ statistically from the PLS for the prediction and classification purposes through the application of t and Wilcoxon tests (p-value > 0.01). PCA-ANN should be chosen for future analysis as it has a shorter computational time than PLS. Keywords: PLS. PCA-ANN. Pre-treatments. Chemometrics. Prediction.
dc.format	application/pdf
dc.language	por
dc.publisher	Universidade Federal de Viçosa
dc.publisher	Estatística Aplicada e Biometria
dc.rights	Acesso Aberto
dc.subject	Análise de regressão
dc.subject	Análise de componentes principais
dc.subject	Redes neurais (Computação)
dc.subject	Quimiometria
dc.subject	Predição
dc.subject	Espectroscopia de infravermelho
dc.subject	Estatística Aplicada e Biometria
dc.title	Redes neurais artificiais com componentes principais para a construção de modelos de predição em dados de espectroscopia NIR
dc.title	Artificial neural networks with principal components for constructing prediction models in NIR spectroscopy data
dc.type	Tese

Este ítem pertenece a la siguiente institución

Universidade Federal de Viçosa (Brasil)