Trabajo de grado - Pregrado
On the performance of Kernel Density Estimation using Density Matrices
Fecha
2021-07-30Registro en:
Universidad Nacional de Colombia
Repositorio Institucional Universidad Nacional de Colombia
Autor
Osorio Ramírez, Juan Felipe
Institución
Resumen
Density estimation methods can be used to solve a variety of statistical and machine learning challenges. They can be used to tackle a variety of problems, including anomaly detection, generative models, semi-supervised learning, compression, and text-to-speech. A popular technique to find density estimates for new samples in a non parametric set up is Kernel Density Estimation, a method which suffers from costly evaluations especially for large data sets and higher dimensions. In this thesis we want to compare the performance of the novel method Kernel Density Estimation using Density Matrices introduced by González et al. [9] against other state-of-the-art fast procedures for estimating the probability density function in different sets of complex synthetic scenarios. Our experimental results show that this novel method is a competitive strategy to calculate density estimates among its competitors and also show advantages when performing on large data sets and high dimensions. Los métodos de estimación de densidad se pueden aplicar a diferentes problemas en estadística y aprendizaje automático. Se pueden utilizar para resolver tareas como detección
de anomalías, modelos generativos, aprendizaje semi-supervisado, compresión, conversión de
texto a voz, entre otras. Una técnica popular para encontrar estimaciones de densidad de
nuevas muestras en una configuración no paramétrica se realiza a través de Estimación Kernel
de Densidad, un método que adolece de evaluaciones costosas, especialmente para conjuntos
de datos grandes y dimensiones altas. En esta tesis queremos comparar el rendimiento del
método novedoso Estimación Kernel de Densidad usando Matrices de Densidad introducido
por González et al. [9] con otros procedimientos rápidos estado-del-arte para estimar la
función de densidad de probabilidad en diferentes conjuntos de escenarios sintéticos complejos. Nuestros resultados experimentales muestran que este novedoso método es una estrategia
competitiva de calcular estimaciones de densidad entre sus competidores y también muestra
ventajas cuando se trabaja con grandes conjuntos de datos y altas dimensiones. El software
utilizado para probar el método propuesto está disponible en línea. (Texto tomado de la fuente)