Tesis
Construcción automática de un modelo de predicción a partir del análisis de datos desbalanceados
Autor
GERMAN CUAYA SIMBRO
Institución
Resumen
Esta investigación se orienta al procesamiento y análisis de datos con características
particulares como son, datos temporales, incertidumbre en los
datos, bases de datos con clases binarias, datos con clases desbalanceadas,
datos con un evento de interés en la clase minoritaria, datos no estacionarios.
Las propiedades anteriores son propias de colecciones de datos del dominio
biomédico, industrial, económico, por mencionar algunos ejemplos.
Así, la tesis contribuye en tres áreas principales. En primer lugar, en la construcción
de un método de selección de variables que favorece la identificación
de la clase minoritaria en bases de datos con clases desbalanceadas.
Segundo, la representación y construcción de un modelo dinámico
probabilista, en la forma de una Red Bayesiana Dinámica no estacionaria
que permite pronosticar la ocurrencia de un evento de la clase mayoritaria
y minoritaria, favoreciendo a la clase minoritaria, y tercero la aplicación del
método propuesto para la construcción de un modelo de la marcha para
pronóstico de caídas en adultos mayores.
Los resultados obtenidos muestran que el algoritmo de selección de variables
propuesto ayuda a seleccionar mejor las variables relevantes para identificar
un evento en la clase minoritaria en bases de datos con clases binarias, tanto
balanceadas como desbalanceadas, que algoritmos tradicionales de selección
de variables.
Por otro lado, el modelo propuesto basado en una red Bayesiana dinámica
no estacionaria obtiene un mejor desempeño para el pronóstico de la clase
minoritaria en datos estacionarios con clases balanceadas y desbalanceadas y
datos no estacionarios con clases balanceadas y desbalanceadas, que modelos
construidos con técnicas convencionales como las Redes Bayesianas Dinámicas.
Además, se tiene evidencia de que los modelos construidos utilizando
selección de variables tienen un mejor desempeño que los modelos construidos
usando todas las variables del conjunto de datos.
El interés en el análisis de este tipo de datos surgió del estudio de la degradación
de la marcha. Los modelos propuestos en esta tesis proporcionan
información adicional a los expertos en el análisis clínico de la marcha, con
quienes se interactuó directamente, dado que no conocen con precisión cuáles
son las variables más relevantes que reflejen la degradación patológica de la
marcha, ni la manera en que los cambios en las variables de la marcha son
desencadenados en personas con alto riesgo de sufrir caídas.
Materias
Ítems relacionados
Mostrando ítems relacionados por Título, autor o materia.
-
Compendio de innovaciones socioambientales en la frontera sur de México
Adriana Quiroga -
Caminar el cafetal: perspectivas socioambientales del café y su gente
Eduardo Bello Baltazar; Lorena Soto_Pinto; Graciela Huerta_Palacios; Jaime Gomez -
Material de empaque para biofiltración con base en poliuretano modificado con almidón, metodos para la manufactura del mismo y sistema de biofiltración
OLGA BRIGIDA GUTIERREZ ACOSTA; VLADIMIR ALONSO ESCOBAR BARRIOS; SONIA LORENA ARRIAGA GARCIA