Tesis
Caracterización Estadística de Poblaciones Múltiples en Regiones de Formación Estelar
Autor
Torres González, Leslie Marie
Pericchi Guerra, Luis R. (Consejero)
Institución
Resumen
En el medio interestelar existen regiones densas compuestas en su mayoría de
hidrógeno molecular llamadas nubes moleculares, dentro de estas nubes también hay
regiones de mayor densidad llamadas clump. Los clumps evolucionan hasta eventualmente
formar una estrella. Entre la etapa de clump y estrella ocurren una serie de
etapas sobre las cuales hay muy poca información.
En este trabajo se realizó un estudio estadístico de las distribuciones de masas
de los clumps para entender cuál distribución explica mejor el comportamiento
estadístico observado en los datos crudos. También se estudió los posibles efectos de
contaminación por la diferencia de orígenes de los distintos clumps. Se estudiaron tres
regiones en las longitudes galácticas l = 30 grados , l = 59 grados y l = 305 grados identificadas como L 30, L 59 y L 305 respectivamente según su coordenada.
Se realizó un primer análisis exploratorio en lo datos utilizando gráficos de
caja, cuantil-cuantil normal, histogramas y gráficos de densidad para estudiar la distribución de las masas y si estas seguían una distribución normal además de ser
homogéneas. Luego se hizo un segundo análisis exploratorio en el que se aplicó una
transformación logarítmica a los datos para obtener simetría y hacer gráficos similares
a los del primer análisis exploratorio. También se usaron gráficos de criterio de informaci
ón bayesiano, gráficos de clasificación de poblaciones y gráficos de densidad del programa mclust para extraer las poblaciones que se encontraban mezcladas en los
conjuntos de datos. Luego se estudiaron las distribuciones log normal, la función de
potencia (power law) y la general extreme value (GEV) a trav es de gráficos cuantilcuantil
para determinar cuál de las distribuciones caracterizaba mejor las diferentes
poblaciones de clumps.
El análisis estadístico indica que hay evidencia de datos contaminados por
diferentes poblaciones en L 30 y L 59, es difícil determinar si la contaminación por
error sistemático de la distancia, por los diferentes estados de evolución o ambos. Sin
embargo, la contaminación desaparece en L 305 lo que hizo que la distribución log
normal mostrara un buen ajuste. No obstante, la GEV fue la que mejor ajustó a L
305, porque ajustó los valores extremos en las colas mejor que la Log Normal. En
el caso de L 30 y L 59 la distribución Log Normal tuvo un comportamiento muy
parecido entre sus diferentes poblaciones, pero las distribuciones power law y GEV
se comportaron diferentes en cada una de las poblaciones.