info:eu-repo/semantics/masterThesis
Extracción de características en imágenes de células de médula ósea para la clasificación de leucemias agudas
Autor
BLANCA AURORA MORALES GONZALEZ
Resumen
In this work, we present the development of a methodology that allows classifying acute
leukemias from the extracted characteristics of bone marrow cells images using
computer vision and data mining tools. We first created an images database from bone
marrow smears elaborated at the chemistry laboratory of the IMSS San José Specialties
Hospital located in Puebla City, México. Then, the smears were digitized using a Carl
Seizz optical microscope with a digital camera connected to a frame grabber. Before the
pre-processing phase, we used computer vision techniques to filter the images and to
extract significant characteristics to build a database containing the characteristics of the
regions of interest to feed the data mining/machine learning algorithms for the
discovery of patterns that best describe the two leukemia types: linfoblastic and
mieloblastic. Finally, we evaluated the classification results using the 10 fold crossvalidation
technique, which provides us with the accuracy for the classification of new
samples.
The objective of this work was the elaboration of a methodology which can be used to
create a medical diagnosis support tool for classifying acute leukemias. The most
efficient algorithms used for this work were: “Logistic Regression” and
“MultilayerPerceptron” (1 layer with 4 neurons or 2 layers with 6 neurons for layer)
which have a predictive accuracy of 89.80% and 91.79% respectively.
In this research, we carried out tests with two types of images databases: the first one is
a balanced database (there is the same number of samples of linfoblastic acute leukemia
and mieloblastic acute leukemia), while the second database is unbalanced, taking into
account the leukemia types proportion that exists in the real world (80% of LLA vs.
20% of LMA).
Two algorithms were developed: one, to describe the methodology proposed in this
research for classifying acute leukemias, and the other, to filter the images and extract
regions of interest.
There is still future work to carry out to improve classification accuracy, such as:
classification of leukemias subtypes, testing other texture and geometric characteristics,
as well as testing other data mining techniques. The achieved results were good
according to the domain experts, considering that there is not much research to classify
leukemia from a morphological point of view using computational methods. En este trabajo se presenta el desarrollo de una metodología que permite clasificar
leucemias agudas a partir de características extraídas en imágenes de células de médula
ósea utilizando herramientas de las áreas de Visión por Computadora y Minería de
Datos. En este proceso, lo primero que se realiza es la creación de la base de datos de
imágenes, estas imágenes se obtuvieron a partir de frotis de sangre de médula ósea
elaborados en el laboratorio de química del Hospital de Especialidades del IMSS en San
José, Puebla. Posteriormente se procede a su digitalización, empleando para ello un
microscopio óptico Carl Seizz, el cual tiene incorporada una cámara digital, a través de
la cual se conecta a una tarjeta digitalizadora para poder obtener las imágenes
digitalizadas. Después en la fase del pre-procesamiento se utilizan técnicas de visión por
computadora para el filtrado de las imágenes y la extracción de características
significativas, para que posteriormente la base de datos de características de las regiones
de interés alimente a los algoritmos de minería de datos y/o aprendizaje computacional
para el descubrimiento de patrones que describen a los dos tipos de leucemia:
linfoblásticas y mieloblásticas. Por último, se evalúan los resultados con la técnica de
validación cruzada con 10 pasos (10 fold cross-validation), la cual nos proporciona el
porcentaje de confiabilidad en las clasificaciones de las nuevas imágenes.
El objetivo de esta investigación es la elaboración de una metodología que sirva para la
creación de una herramienta de apoyo al diagnóstico médico en la clasificación de
leucemias agudas. Los algoritmos utilizados y con los cuales se obtuvieron mejores
resultados son: “Logistic” y “Redes Neuronales Multicapa” (1 capa con 4 neuronas o 2
capas con 6 neuronas por capa) con un 89.80% y 91.79% respectivamente.
En esta investigación las pruebas se realizaron con 2 tipos de base de datos de
imágenes: la primera es una base de datos balanceada (igual número de muestras del
tipo de leucemia linfoblástica aguda (LLA) y leucemia mieloblástica aguda (LMA)) y la
segunda es una base de datos desbalanceada tomando en cuenta la proporción que existe
en el mundo real (80% de LLA Vs. 20% LMA).
Se desarrollaron dos algoritmos: uno que describe la metodología propuesta en esta
investigación para la clasificación de las leucemias, y el otro para el filtrado de las
imágenes y la extracción de características de las mismas.
Materias
Ítems relacionados
Mostrando ítems relacionados por Título, autor o materia.
-
Compendio de innovaciones socioambientales en la frontera sur de México
Adriana Quiroga -
Caminar el cafetal: perspectivas socioambientales del café y su gente
Eduardo Bello Baltazar; Lorena Soto_Pinto; Graciela Huerta_Palacios; Jaime Gomez -
Cambio social y agrícola en territorios campesinos. Respuestas locales al régimen neoliberal en la frontera sur de México
Luis Enrique García Barrios; Eduardo Bello Baltazar; Manuel Roberto Parra Vázquez