Trabajo de grado - Maestría
Quantification of glands in gastric cancer
Autor
Alfonso Niño, Sunny Catalina
Institución
Resumen
Automatic detection and quantification of glands in gastric cancer may contribute to objectively measure the lesion severity, to develop strategies for early diagnosis, and most importantly to improve the patient categorization; however, gland quantification is a highly subjective task, prone to error due to the high biopsy traffic and the experience of each expert. The present master’s dissertation is composed by three chapters that carry to an objective identification of glands. In the first chapter of this document we present a new approach for segmentation of glandular nuclei
based on nuclear local and contextual (neighborhood) information “NLCI”. A Gradient-BoostedRegression-Tree classifier is trained to distinguish between glandular nuclei and non glandular nuclei. Validation was carried out using 45.702 annotated nuclei from 90 fields of view (patches)
extracted from whole slide images of patients diagnosed with gastric cancer. NLCI achieved an accuracy of 0.977 and an F-measure of 0.955, while R-CNN yielded corresponding accuracy and F-measures of 0.923 and 0.719, respectively. In second chapter we presents an entire framework
for automatic detection of glands in gastric cancer images. By selecting gland candidates from a binarized version of the hematoxylin channel. Next, the gland’s shape and nuclei are characterized using local features which feed a Random-Cross-validation method classifier trained previously
with images manually annotated by an expert. Validation was carried out using a data-set with 1.330 from seven fields of view extracted from patients diagnosed with gastric cancer whole slide images. Results showed an accuracy of 93 % using a linear classifier. Finally, in the third chapter
analyzing gland and their glandular nuclei most relevant features, since predict if a patient will survive more than a year after being diagnosed with gastric cancer. A feature selection based on mutual information: criteria of max-dependency, max-relevance, and min-redundancy “mRMR” approach selects those features that correlated better with patient survival. A data set with 668 Fields of View (FoV), 2.076 glandular structures from 14 whole slide images were extracted from patient diagnosed with gastric cancer. Results showed an accuracy of 78.57 % using a QDA Linear
& Quadratic Discriminant Analysis was training with Leave-one-out e.g training with thirteen cases and leaving a separate case to validate. La detección y cuantificación automática de las glándulas en el cáncer gástrico puede contribuir a medir objetivamente la gravedad de la lesión, desarrollar estrategias para el diagnóstico precoz y lo que es más importante, mejorar la categorización del paciente; sin embargo, su cuantificación es una tarea altamente subjetiva, propensa a errores debido al alto tráfico de biopsias y a la experiencia de cada experto. La presente disertación de maestría está compuesta por tres capítulos los cuales llevan a la cuantificación objetiva de glándulas. En el primer capítulo del documento se presenta un nuevo enfoque para la segmentación de los núcleos glandulares en base a la información nuclear local y contextual (vecindario). Se entrenó un Gradient-Boosted-Regression-Tree para distinguir entre núcleos glandulares y núcleos no glandulares. La validación se llevó con 45.702 núcleos anotados manualmente de 90 campos de visión (parches) extraídos de imágenes de biopsias completas de pacientes diagnosticados con cáncer gástrico. NLCI logró una precisión de 0.977% y un F-Score de 0.955%, mientras que fast R-CNN arrojó una precisión de 0.923% y un F-Score y 0.719%. En el segundo capítulo se presenta un marco completo para detección automática de glándulas en imágenes de cáncer gástrico. Las glándulas candidatas se seleccionan de una versión binarizada del canal de hematoxilina. A continuación, la forma y los núcleos de las glándulas se caracterizan y se alimenta un clasificador Random Cross Validation, entrenado previamente con imágenes anotadas manualmente por un experto. La validación se realizó en un conjunto de datos con 1.330 parches extraídos de siete biopsias de pacientes diagnosticados con cáncer gástrico. Los resultados mostraron una precisión del 93% utilizando un clasificador lineal. Finalmente, el tercer capítulo analiza las características más relevantes de las glándulas y sus núcleos glandulares, para predecir la sobrevida a un año de un paciente diagnosticado con cáncer gástrico. Una selección de características basada en información mutua: criterios de dependencia máxima, máxima relevancia y mínima redundancia (mRMR) escogen las características correlacionadas con la supervivencia del paciente. Se extrajo un conjunto de datos con 668 campos de visión (FoV), 2.076 estructuras glandulares de 14 imágenes completas de pacientes diagnosticados con cáncer gástrico. Los resultados mostraron una precisión del 76.3% usando un Análisis Discriminante Lineal y Cuadrático (QDA) y un esquema de evaluación entrenando con trece casos y dejando un caso aparte para validar.