Tesis
Improving astronomical time-series classification via data augmentation with generative adversarial networks
Autor
García Jara, Germán Eduardo
Institución
Resumen
Debido a los últimos avances de la tecnología, telescopios que cubren amplias zonas del cielo producirán millones de alertas astronómicas por noche que deberán ser clasificadas de forma rápida y automática. Actualmente, la clasificación consiste en algoritmos supervisados de aprendizaje automático cuyo rendimiento está limitado por la cantidad de anotaciones existentes de objetos astronómicos y sus distribuciones de clases altamente desequilibradas.
En esta tesis, proponemos una metodología de aumento de datos basada en Redes Generativas Adversarias (GAN, por sus siglas en inglés) para generar una variedad de curvas de luz sintéticas a partir de estrellas variables.
Nuestras novedosas contribuciones, que consisten en una técnica de remuestreo y una métrica de evaluación, nos permiten evaluar la calidad de los modelos generativos en conjuntos de datos desequilibrados e identificar casos de sobreajuste de GAN que la distancia de Fréchet no revela. El modelo propuesto es evaluado en dos conjuntos de datos tomados de los surveys de Catalina y Zwicky Transient Facility. Las métricas de accuracy de clasificación de estrellas variables mejoran significativamente cuando los clasificadores se entrenan con datos sintéticos y reales con respecto al caso de usar solo datos reales.