info:eu-repo/semantics/conferenceObject
Modelo basado en aprendizaje de máquina estadístico para la determinación de factores que influyen en el rendimiento de sistemas de gestión de bases de datos relacionales
Fecha
2021Registro en:
Ponce-Vergara, J. L. (2021). Modelo basado en aprendizaje de máquina estadístico para la determinación de factores que influyen en el rendimiento de sistemas de gestión de bases de datos relacionales. En Universidad de Lima (Ed.), Construyendo un mundo inteligente para la sostenibilidad. Actas del III Congreso Internacional de Ingeniería de Sistemas (pp. 59-75), Lima, 17 y 20 de noviembre del 2020. Universidad de Lima, Fondo Editorial.
Autor
Ponce Vergara, José Luis
Institución
Resumen
Los procesos de negocios que soportan sus operaciones con aplicaciones que interactúan con sistemas de gestión de bases de datos relacionales (RDBMS) pueden incrementar
su productividad a través de la identificación de los factores que afectan el rendimiento de las
ejecuciones de las sentencias SQL que conforman su carga de trabajo, especialmente las cargas
generadas por aplicaciones implementadas en ambientes de producción, que son recurrentes
en el tiempo. El artículo propone un modelo de identificación de factores que afectan el rendi miento de las ejecuciones de las sentencias SQL que se procesan en un RDBMS, valiéndose de
algoritmos de aprendizaje de máquina estadístico (análisis de componentes principales y análi sis de correlación canónica) que explotan la información de los planes, estadísticas y métricas
generadas durante el ciclo de vida de las ejecuciones de las sentencias SQL. Business processes supporting their operations with applications that interact
with relational database management systems (RDBMS) may increase their productivity
through the identification of factors that affect the performance of SQL statement execu tions of any given workload, especially workloads generated by applications implemented
in production environments which recur over time. This paper proposes a model to identify
factors that affect the performance of SQL statement executions processed in RDBMS, using
statistical machine learning algorithms (principal component analysis and canonical correla tion analysis) that exploit the information of the plans, statistics and metrics generated during
the life cycle of SQL statement executions.