Trabalho de Conclusão de Curso
Aplicação de metodologias estatísticas e machine learning para validação de analisadores contínuos para indústria de celulose
Registro en:
GOMES, Larissa Vieira. Aplicação de metodologias estatísticas e machine learning para validação de analisadores contínuos para indústria de celulose . 93 p. 2021. Trabalho de Conclusão de Curso (Graduação em Engenharia Química ) – Universidade Federal do Pampa, Campus Bagé, Bagé, 2021.
Autor
Gomes , Larissa Vieira
Institución
Resumen
Computational devices are more and more becoming the everyday tools that
scientists and engineers turn to for efficiently and quickly handling large data sets.
The quality of the data points allows for rapid decision making along the processes of
industries. For example, in the paper milling and manufacturing process there is a
high risk of variance and error in the quality assurance process, which typically
occurs in laboratories and are performed by technicians. However, with the use of
sensors and measuring devices these errors can be greatly reduced to produce
greater returns on processes, cost reduction, resource allocation, and the statistical
confidence and quality of data. The goal of this project is to validate the use of
measuring devices on a network by using statistical modeling and machine learning,
such as linear regression, decision trees, and random forest, to obtain the higher
quality laboratory measurements and data points along the manufacturing process.
The implementation of statistical methodologies was executed using the Python
language for both statistical tools and construction of the virtual analyzer through
Machine Learning. The statistical results were satisfactory, with some spurious
errors. The soft sensor, on the other hand, presented poorly representative prediction
results with an R² of 62,3% after optimization, requiring a greater amount of data for
statistically satisfactory results. Ferramentas computacionais são cada vez mais comuns no cotidiano de cientistas e
engenheiros, uma vez que permitem a análise sistemática de grandes quantidades
de dados de forma rápida. A qualidade dos dados interfere drasticamente na tomada
de decisões, se tornando essencial para uma boa gestão industrial. Na indústria de
papel e celulose, a coleta de dados pode ser fator de risco ao trabalhador ao realizar
medições durante atividades, como a colheita florestal, o cozimento da madeira e
secagem da polpa. Ainda, os dados obtidos em laboratório estão sujeitos a
variações e erros. Isto posto, a utilização de sensores e medidores automáticos além
de agregarem mais segurança ao processo produtivo, reduzem custos e aumentam
a produtividade, confiabilidade e qualidade dos dados. O objetivo desse trabalho é
validar instrumentos de medição on-line utilizando metodologias estatísticas e um
modelo de Machine Learning (Regressão Linear, Árvores de decisão, Florestas
Aleatórias) para obtenção das medições laboratoriais através dos dados dos
instrumentos. A implementação das metodologias estatísticas foi realizada por meio
da linguagem Python para a análise de dados e construção do analisador virtual
através de Machine Learning. Os resultados estatísticos se mostraram satisfatórios,
com alguns erros espúrios. Já o analisador virtual construído, apresentou resultados
de predição pouco representativos, com R² de 62,3% após otimização, necessitando
maior quantidade de dados para resultados estatisticamente satisfatórios.