bachelorThesis
Machine learning automatizado con aplicaciones a modelos predictivos reducidos
Fecha
2020-12Autor
Cerino, Franco
Institución
Resumen
La detección directa de ondas gravitacionales a través de interferómetros, generadas por la coalescencia de un sistema binario, es uno de los descubrimientos más relevantes de la ciencia en los últimos años. Esto genera la necesidad de obtener expresiones de ondas gravitacionales de forma rápida y precisa para diferentes aplicaciones. Se pueden obtener simulaciones a través de relatividad numérica, pero la obtención de una simulación implica la utilización de supercomputadoras, demandando desde semanas hasta meses de tiempo de cómputo por simulación, lo cual implica que generar un conjunto amplio de soluciones en tiempo real es inviable a través de un enfoque directo. Para reducir este costo computacional se ha desarrollado un método predictivo sustituto para computar expresiones de ondas gravitacionales de forma precisa y rápida, aplicando teoría de aproximaciones cuasi-óptima para construir modelos reducidos para sistemas parametrizados, usando sólo un número relativamente chico de simulaciones con supercomputadoras como espacio de entrenamiento. A través de él se pueden construir soluciones correspondientes a un espacio de parámetros definido, dado por las masas y spines de los agujeros negros, en el orden de un milisegundo en una computadora personal, resultando en un factor de aceleración de al menos 11 órdenes de magnitud, sin pérdida de precisión, respecto de simulaciones por supercomputadoras. Para obtener el modelo predictivo se deben realizar regresiones sobre el espacio de parámetros en cuestión, donde la incerteza de éstas es el factor que más contribuye al error de las predicciones. En este trabajo se construyó una familia de modelos sustitutos para la colisión de dos agujeros negros y se realizó un estudio comparativo del poder predictivo conseguido a través de una gran (alrededor de 100) variedad de modelos provenientes del ámbito de Machine Learning y de métodos clásicos de aproximación, realizando regresiones globales y locales. Para posibilitar la aplicación de un amplio espectro de modelos de Machine Learning de diferente naturaleza, se utilizó la plataforma de Machine Learning Automatizado DataRobot. The direct detection of gravitational waves through interferometers, generated by the coalescence of a binary system, is one of the most relevant discoveries in science in recent years. This generates the need to obtain gravitational wave expressions quickly and accurately for different applications. Simulations can be obtained through numerical relativity, but obtaining a simulation implies the use of supercomputers, demanding from weeks to months of computing time per simulation, which implies that generating a wide set of solutions in real time is not feasible through a direct approach. To reduce this computational cost, a surrogate predictive method has been developed to compute gravitational wave expressions accurately and quickly, applying quasi-optimal approximation theory to build reduced models for parameterized systems, using only a relatively small number of simulations with supercomputers as training space. Through it, solutions can be constructed corresponding to a defined parameter space, given by the masses and spins of the black holes, in the order of one millisecond in a personal computer, resulting in an acceleration factor of at least 11 orders of magnitude, without loss of precision, with respect to simulations by supercomputers. To obtain the predictive model, regressions must be performed on the parameter space used, where the uncertainty of these is the factor that most contributes to the error of the predictions. In this work, a family of substitute models for the collision of two black holes was built and a comparative study of the predictive power achieved through a great (around 100) variety of models from the field of Machine Learning and classical methods was carried out, performing global and local regressions. To allow the application of a wide spectrum of Machine Learning models of different nature, the Automated Machine Learning platform DataRobot was used.