Trabajo de grado - Maestría
Automatic retinopathy detection using Deep learning and medical findings
Fecha
2021Registro en:
Universidad Nacional de Colombia
Repositorio Institucional Universidad Nacional de Colombia
Autor
de la Pava Rodriguez, Melissa
Institución
Resumen
Diabetic retinopathy (DR) is the result of a complication of diabetes affecting the retina. It can cause blindness if left undiagnosed and untreated. The ophthalmologist performs the diagnosis by screening each patient and detecting in ocular imaging the lesions caused by DR, namely, microaneurisms, hemorrhages, cotton wool spots, venous beading and neovascularization. However, the analysis of ocular findings is cumbersome, time-consuming, and demanding. Due to the insufficient amount of trained specialists to diagnose the illness, and the actual growing population with DR, it is important to develop a method to assist the DR diagnosis. This thesis presents two approaches for the automatic classification of DR using eye fundus images. The first one utilizes convolutional neural networks, transfer learning and shallow machine learning classifiers to identify the main ocular lesions related to DR and then use them to diagnose the illness. The second one is a multitask model which predicts simultaneously ocular lesions and DR. These approaches follow a similar workflow to that of clinicians, providing information that can be interpreted clinically to support the prediction. To achieve this goal a subset of the kaggle EyePACS and the Messidor-2 datasets, are labeled with ocular lesions by a certified opthalmologist. The kaggle EyePACS subset is used as training set and the Messidor-2 dataset is used as test set for both, the lesions and DR classification models. The results indicate that both methods achieve results comparable with state-of-the-art performances. The best results are obtained using the first approach with a multi layer perceptron as classifier for the automatic detection of DR, however, the multitask approach lead to similar results and has a simpler architecture. La retinopatía diabética (RD) es el resultado de una complicacion de la diabetes que afecta la retina. Puede causar ceguera si no se diagnostica ni se trata. El diagnóstico de esta enfermedad se hace mediante el escaneo de cada paciente y el análisis de imágenes oculares para detectar lesiones causadas por la RD, como microaneurismas, hemorragias, manchas algodonosas, arrosamiento venoso y neovascularización. Sin embargo, el análisis de las lesiones oculares es engorroso, lento y exigente. Debido a la cantidad insuficiente de especialistas capacitados para diagnosticar la enfermedad y al crecimiento actual de la población con RD, es importante desarrollar un método para ayudar en el diagnóstico de esta enfermedad. Esta tesis presenta dos enfoques para la clasificación automática de la RD utilizando imágenes de fondo de ojo. El primero utiliza redes neuronales convolucionales, transferencia de aprendizaje y clasificadores clásicos de aprendizaje de máquina para identificar las principales lesiones oculares relacionadas con la RD y luego usarlas para diagnosticar la enfermedad. El segundo es un modelo multitarea que predice simultáneamente lesiones oculares y RD. Estos enfoques siguen un flujo de trabajo similar al de los médicos, proporcionando información que puede interpretarse clínicamente para respaldar la predicción. Para lograr este objetivo, un subconjunto de las bases de datos kaggle EyePACS y Messidor-2 fueron etiquetados con lesiones oculares por un oftalmólogo certificado. El subconjunto de kaggle EyePACS se utiliza como conjunto de entrenamiento y el de Messidor-2 se utiliza como conjunto de prueba tanto para los modelos de detección de lesiones, como para los de clasificación de RD. Los resultados indican que ambos enfoques logran desempeños comparables con los métodos del estado del arte. Los mejores resultados se obtienen utilizando el primer enfoque con un perceptrón multicapa como clasificador para la detección automática de RD, sin embargo, el enfoque multitarea conduce a resultados similares y tiene una arquitectura más simple. (Texto tomado de la fuente).