bachelorThesis
Generación de imágenes sintéticas utilizando una GAN para incrementar el rendimiento de una Red neuronal convolucional en la detección de COVID19.
Fecha
2022Autor
Carpio Vela, Wilson Israel
Tejada Ladines, Cindy Johanna
Institución
Resumen
En la actualidad las radiografias toracicas son usadas como alternativa para la deteccion temprana
de COVID 19, debido a que otros métodos de diagnostico requiere de tiempo y recursos. La
medicina ha optado por utilizar herramientas con inteligencia artificial que ayuden a clasificar
pacientes en sintomaticos y asintomaticos. Las redes neuronales convolucionales (CNN), son las
mas adecuadas para la correcta clasificacion de datos estructurados en un formato de matriz, como
es el caso de lasimágenes, Sin embargo, es necesario el uso de gran cantidad de datos para su
entrenamiento; ¿Cómo se pueden obtener estos datos en gran cantidad?, Se tiene como objetivo
implementar una red generativa adversa (GAN), que cree imagenes de radiografias de torax con
COVID 19 para ser utilizadas como datos de entrenamiento en una CNN, logrando incrementar su
rendimiento…Al obtener las imágenes sinteticas, se evaluo modelos de CNN, las cuales fueron
implementadas en el entorno Google Colab, usando lenguaje de programacion python y las
librerias de machine learning como Keras y Pytroch, que recibieron como datos de entrenamiento
imágenes de un dataset publico y datos generados por la GAN, Obteniendo como resultado un
aumento en la presicion y sensibilidad de la Red con el conjunto de entrenamiento de imágenes
generadas por la GAN. Chest X-rays are often used as an alternative methodology for early detection of COVID 19, this
is because other methods of diagnosis require a certain amount of time and resources. Doctors
have sought out help in Artificial Intelligence based software with the purpose of classifying
patients in symptomatic and asymptomatic. Convolutional Neural Networks (CNN) have proven
to be the best option when it comes to classifying data that is structured in an array format, such
XXVII
as images. However, for CNNs to correctly be trained they often require a large amount of data.
¿How could one acquire this large of a dataset? The goal is to implement a Generative Adversarial
Network (GAN) that will create fake COVID 19 chest X-rays images which will be used as
training data for a CNN, increasing its performance…Once the synthetic images have been
generated, different types of CNN architectures where tested, using first a public image dataset
and then a dataset that was generated by the GAN. The results were an increase in precision and
sensitivity of the CNN model that was trained with the synthetic images generated by the GAN.
All of this was done through the Google Colab platform, with the help of the Python programming
language and machine learning libraries such as Keras and Pytroch.