Trabajo de grado - Doctorado
A contribution to the estimation of kinematic quantities from linear motion blurred images
Autor
Cortés-Osorio, Jimy Alexander
Institución
Resumen
This thesis introduces a new approach for estimating kinematic quantities, namely the angle the relative speed, and the acceleration from an actual single motion blur image using the Discrete Cosine Transform (DCT). Motion blur is a common phenomenon present in images. It is produced by the relative movement between the camera and the objects in the scene during camera sensor exposure to light. It usually happens to image recording systems mounted in vehicles, hand-held cameras, drones, satellites, and mobile robots. Our software-based technique focuses on cases where the camera moves at a constant linear velocity while the background remains unchanged. Syntactic and actual image were used to carry out the experiments. The Mean Absolute Error (MAE) of DCT Radon method for direction estimation was 4.66 degrees. Additionally, the Mean Relative Error for speed estimation of the DCT Peudo Cepstrum was 5.15% . Our alternative DCT frequency analysis proposals were more accurate than all competitors evaluated for velocity measurement. Also, we proposed an alternative approach to estimate relative acceleration from an actual uniformly accelerated motion blur image using homomorphic mapping to extract the characteristic Point Spread Function of a degraded image to train a machine learning regression model. Ensembles of Trees, Gaussian Processes (GPR), Linear, Support Vector Machine (SVM), Tree Regression and 19 variants were evaluated to predict the acceleration. The bests RMSE result was 0.2547m/s2 using GPR (Matern 5/2) with a prediction Speed of 530 observation per second. Finally, the proposed methods are valid alternatives for the estimation of the velocity and the acceleration from a single linear motion blur image. (Texto tomado de la fuente) Esta tesis presenta un nuevo enfoque para estimar cantidades cinemáticas, a saber, el ángulo de la velocidad relativa y la aceleración de una imagen de desenfoque de movimiento único real usando la Transformación discreta de coseno (DCT). El desenfoque de movimiento es un fenómeno común presente en las imágenes. Se produce por el movimiento relativo entre la cámara y los objetos en la escena durante la exposición del sensor de la cámara a la luz. Suele ocurrir con los sistemas de grabación de imágenes montados en vehículos, cámaras de mano, drones, satélites y robots móviles. La presente técnica basada en software se enfoca en casos donde la cámara se mueve a una velocidad lineal constante mientras el fondo permanece sin cambios. Para los experimentos de estimación de velocidad se usaron imágenes sintéticas y reales. El error absoluto medio (MAE) del método DCT Radon para la estimación de dirección fue de 4.66 grados. Además, el error relativo medio para la estimación de la velocidad del DCT Pseudo Cepstrum fue del 5.15%. Las propuestas alternativas de análisis de frecuencia DCT fueron más precisas que todos los competidores evaluados para la medición de velocidad. Adicionalmente, se propuso un enfoque alternativo para estimar la aceleración relativa a partir de una imagen de desenfoque de movimiento acelerado uniformemente real usando mapeo homomórfico para extraer la función de dispersión de puntos característica de una imagen degradada para luego entrenar un modelo de regresión de aprendizaje automático. Se tomaron un total de 125 imágenes de desenfoque de movimiento uniformemente acelerado en un entorno controlado con luz y distancia a 5 aceleraciones diferentes en un rango entre0.64m/s2 y2.4m/s2. Se evaluaron Conjuntos de árboles, procesos gaussianos (GPR), Regresión Lineal, Máquinas de Vectores de Soporte (SVM) y 19 variantes de regresión para predecir la aceleración. El mejor resultado RMSE fue de 0.2553m/s2 usando regresión GPR con una velocidad de predicción de 530 observaciones por segundo. Finalmente, se concluye que los métodos propuestos son alternativas válidas para la estimación de la velocidad y la aceleración de una sola imagen con desenfoque de movimiento lineal invariante.