Artificial neural networks with principal components for constructing prediction models in NIR spectroscopy data

dc.contributorPeternelli, Luiz Alexandre
dc.contributorhttp://lattes.cnpq.br/6364173429092431
dc.creatorFerreira, Roberta de Amorim
dc.date2022-09-29T13:52:37Z
dc.date2022-09-29T13:52:37Z
dc.date2022-07-06
dc.date.accessioned2023-09-27T22:00:53Z
dc.date.available2023-09-27T22:00:53Z
dc.identifierFERREIRA, Roberta de Amorim. Redes neurais artificiais com componentes principais para a construção de modelos de predição em dados de espectroscopia NIR. 2022. 72 f. Tese (Doutorado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa. 2022.
dc.identifierhttps://locus.ufv.br//handle/123456789/30009
dc.identifierhttps://doi.org/10.47328/ufvbbt.2022.557
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/8969471
dc.descriptionA espectroscopia no infravermelho próximo (NIR), associada a métodos estatísticos multivariados, vem sendo utilizada para a predição de indivíduos com maior produtividade. O método Partial Least Squares (PLS) é comumente empregado para ajuste de modelos de dados NIR. Entretanto, este método considera que a relação espectro/propriedade seja linear, o que não é sempre garantido em dados dessa natureza e o que pode, consequentemente, influenciar na acurácia do modelo. Alternativamente, a rede neural artificial (ANN) associada à análise de componentes principais (PCA), denominada PCA-ANN, possui a vantagem de ser eficiente em lidar com dados não lineares, incompletos e com ruídos, captando assim algumas complexidades presentes nos mesmos. Além disso, tal abordagem permite o não uso de pré- tratamentos, o que pode aumentar a capacidade preditiva dos modelos, além de diminuir o custo e o tempo das análises, quando comparada ao PLS associado aos pré-tratamentos usuais. O objetivo deste estudo foi construir e validar modelos de predição e processos de classificação, além de verificar se existe diferença significativa entre o método PLS, associado à matriz de espectros pré-tratados, e o método PCA-ANN, aplicado aos dados brutos. Para tanto, tais métodos foram aplicados a oito conjuntos de dados NIR, na forma bruta (sem pré- tratamentos) e com pré-tratamentos. A avaliação da capacidade preditiva dos modelos obtidos ocorreu por meio da correlação entre os valores preditos e os valores originais, e da raiz quadrada do erro quadrático médio de predição. Já a avaliação dos processos de classificação ocorreu através da taxa de erro aparente (TEA) e da taxa de verdadeiros positivos (TVP). Os resultados alcançados indicam que, na maioria dos conjuntos de dados analisados, o método PCA-ANN não difere estatisticamente do PLS para a predição dos modelos e para os processos de classificação, por meio da aplicação dos testes t e de Wilcoxon (valor-p > 0,01). O PCA- ANN deve ser escolhido para a realização de futuras análises, pois apresenta tempo computacional inferior àquele referente ao PLS. Palavras-chave: PLS. PCA-ANN. Pré-tratamentos. Quimiometria. Predição.
dc.descriptionNear infrared (NIR) spectroscopy, associated with multivariate statistical methods, has been used to predict individuals with higher productivity. The Partial Least Squares (PLS) method is commonly used to fit NIR data models. However, this method considers that the spectrum/property relationship is linear, which is not always guaranteed in data of this nature and can, consequently, influence the accuracy of the model. Alternatively, the artificial neural network (ANN) associated with principal component analysis (PCA), called PCA-ANN, has the advantage of efficiently dealing with non-linear, incomplete, and noisy data. PCA-ANN can, thus, capture some of the complexities of this kind of data. Also, the PCA-ANN approach allows for the non-use of pretreatments, in addition to reducing the cost and time of the analysis compared to the PLS associated with the usual pretreatments. The objective of this study was to build and validate prediction models and classification processes under PLS and PCA-ANN approaches, besides considering pre-treated and untrated sprectra. These methods were applied to eight NIR datasets, in raw form (without pretreatments) and with pretreatments. The model's predictive capacity was evaluated through the correlation between the predicted values and the original values, and the square root of the mean squared error of prediction. The evaluation of the classification processes was carried out through the apparent error rate (AER) and the true positive rate (TPR). In most of the analyzed datasets, the PCA-ANN method does not differ statistically from the PLS for the prediction and classification purposes through the application of t and Wilcoxon tests (p-value > 0.01). PCA-ANN should be chosen for future analysis as it has a shorter computational time than PLS. Keywords: PLS. PCA-ANN. Pre-treatments. Chemometrics. Prediction.
dc.formatapplication/pdf
dc.languagepor
dc.publisherUniversidade Federal de Viçosa
dc.publisherEstatística Aplicada e Biometria
dc.rightsAcesso Aberto
dc.subjectAnálise de regressão
dc.subjectAnálise de componentes principais
dc.subjectRedes neurais (Computação)
dc.subjectQuimiometria
dc.subjectPredição
dc.subjectEspectroscopia de infravermelho
dc.subjectEstatística Aplicada e Biometria
dc.titleRedes neurais artificiais com componentes principais para a construção de modelos de predição em dados de espectroscopia NIR
dc.titleArtificial neural networks with principal components for constructing prediction models in NIR spectroscopy data
dc.typeTese


Este ítem pertenece a la siguiente institución