info:eu-repo/semantics/doctoralThesis
Temporal outlier detection using dynamic Bayesian networks and probabilistic association rules
Detección de valores atípicos temporales usando redes bayesianas dinámicas y reglas de asociación probabilísticas
Autor
Quispe Vargas, Walter
Resumen
Esta tesis trata el problema de descubrir valores atípicos temporales interesantes
en un conjunto de datos. Presentamos reglas de asociación probabilísticas como
medidas para descubrir valores atípicos temporales interesantes basados en el
conocimiento del dominio que ha sido aprendido y representado por una Red
Bayesiana Dinámica. Las redes Bayesianas dinámicas capturan el conocimiento
previo en una relación causal entre variables aleatorias. Las dos reglas de
asociación probabilística definidas como: i) soporte bajo & confianza alta y ii)
soporte alto & confianza baja, fueron usadas para identificar escenarios donde las
discrepancias entre las probabilidades previas y condicionales son significativas.
Nuestro enfoque novedoso une ambos métodos y nos permite descubrir valores
atípicos temporales interesantes y proporcionan una contextualización en forma
de sub-espacios relacionales, bajo la metodología propuesta llamada “Patrones
Atípicos Temporales en un Dominio Específico”. La evaluación de la
metodología propuesta fue realiza en datos temporales simulados y reales, en
escenarios no supervisados y supervisados. Los resultados experimentales en
datos temporales muestran que nuestro enfoque puede detectar valores atípicos
temporales genuinos y proporcionar sub-espacios relacionales para explicar las
causas probables de los valores atípicos temporales reportados con buenas
medidas de eficiencia. This thesis deals with the problem of discovering these interesting temporal outliers in datasets. We present probabilistic association rules as measures to discover interesting temporal outliers based on domain knowledge that has been learned and represented by a Dynamic Bayesian Network. Dynamic Bayesian networks are models to represent complex stochastic processes, to establish probabilistic dependencies in the feature space over time, and to capture the background knowledge in a causal relationship between features. The two probabilistic association rules: i) low support & high confidence, and ii) high support & low confidence, were used to identify scenarios where the discrepancies between prior and conditional probabilities are significant. Our novel approach coalesces both methods. It allows us to discover interesting temporal outliers and provide contextualization in the form of relational subspaces, under the proposed methodology called “Domain Specific Temporal Anomalous Patterns.” The evaluation of the proposed methodology was done on synthetic and real temporal datasets on the unsupervised and supervised scenario. The experimental results on temporal datasets show that our approach can detect genuine temporal outliers and provide relational subspaces to explain the probable causes of the reported outliers, with reasonable efficiency measures.