Trabajo de grado - Pregrado
Reconocimiento de estrellas con línea Halpha en emisión por medio de técnicas de aprendizaje automático supervisado
Fecha
2020Registro en:
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
Autor
Sanabria García, Rafael David
Institución
Resumen
La exuberante cantidad de datos astronómicos que se recopilan año tras año hace que sea necesario el uso de métodos eficientes para analizarlos y clasificarlos. En este contexto, la inteligencia artificial surge como una de las alternativas para resolver este problema debido a su capacidad para clasificar objetos a partir de patrones. Este trabajo propone una metodología para extraer las características que describen un espectro estelar para ser utilizadas posteriormente en la construcción de un algoritmo de clasificación. Básicamente se realiza una lectura de los espectros, se extraen las características que los representan, se construye el modelo de clasificación y, finalmente, se aplica el modelo a una nueva muestra sin clasificación previa. Específicamente, se entrena un clasificador basado en bosques aleatorios binarios que es capaz de reconocer si un espectro tiene la línea Halpha en emisión. Las bases de datos HBC y BeSOS se utilizan para entrenar los bosques aleatorios y su rendimiento se evalúa con la base de datos LAMOST. Al usar el clasificador en una muestra de 2986 espectros se encontraron 152 espectros con línea de emisión Halpha con una precisión del 99% The exuberant amount of astronomical data that is collected year after year makes it necessary to use efficient methods to analyze and classify it. In this context, artificial intelligence emerges as one of the alternatives to solve this problem due to its ability to classify objects based on patterns. This work proposes a methodology to extract the characteristics that describe a stellar spectrum to be used later in the construction of a classification algorithm. Basically, a reading of the spectra is carried out, the features that represent them are extracted, the classification model is built and, finally, the model is applied to a new sample without previous classification. Specifically, a binary random forest-based classifier is trained that is capable of recognizing whether a spectrum has the line Halpha in emission. The HBC and BeSOS databases are used to train the random forests and their performance is evaluated with the LAMOST database. Using the classifier on a sample of 2986 spectra, 152 spectra with emission line Halpha were found with an accuracy of 99%