Trabajo de grado - Maestría
Predicting patient outcome in lung cancer by a cluster analysis of lymphocyte population
Fecha
2019-01-01Autor
Barrera Monje, Cristian Raul
Institución
Resumen
A number of papers have established that a high density of tumor-infiltrating lymphocytes (TILs) is highly correlated with a better prognosis for many different cancer types. Recently, some studies have shown that the spatial interplay between different subtypes of TILs (e.g. CD3, CD4, CD8) is more prognostic of disease outcome compared to just metrics related to TIL density. A challenge with TIL subtyping is that it relies on quantitative immunofluoresence or immunohistochemistry, complex, expensive, and tissue-destructive techniques. In this thesis, we present a new approach to identify TIL sub-groups and quantify the interplay between these sub-populations to analyze the association of these interplay features with recurrence in early stage lung cancer. The approach comprises a Dirichlet Process Gaussian Mixture Model that clusters lymphocytes on H and E images according to the set of 186 features. The approach was evaluated on a cohort of 178 early stage non-small cell lung cancer patients, 100 were used for model training and 78 for independent validation. Recurrence information was extracted from the patient medical records, where 5 years survival is the established range for remained recurrence-free. A Linear Discriminant Analysis classifier was trained in conjunction with clustered lymphocytes to predict the likelihood of recurrence in the test set. The features yielded an AUC=0.84 compared to an approach involving just TIL density alone (AUC=0.58). In addition, a Kaplan-Meier analysis showed that those features were able to statistically distinguish early recurrence from late recurrence (p = 4 ∗ 10 −5 with cutoff alpha of 0.05). Resumen: Varios artículos han establecido que una alta densidad de linfocitos infiltrantes de tumor (TILs, por sus siglas en inglés), está altamente correlacionada con un mejor pronóstico en diferentes tipos de cáncer. Recientemente, algunos estudios han demostrado que la interacción espacial entre los diferentes subtipos de TILs (por ejemplo, CD3, CD4, CD8) resulta más informativa respecto al desenlace de la enfermedad en comparación con las métricas relacionadas con la densidad de TILs. Un desafío con la subtipificación de TILs es que ésta requiere inmunofluorescencia cuantitativa o inmunohistoquímica, técnicas complejas, costosas y destructivas de tejido. En esta tesis, presentamos un nuevo enfoque para identificar subgrupos de TILs y cuantificar la interacción entre dichos subtipos y mostrar la asociación de estas características de interacción con la recurrencia en pacientes con cáncer de pulmón en etapa temprana. El enfoque comprende un Modelo de Mezcla de Gaussianas junto con un proceso Dirichlet que agrupa linfocitos de acuerdo a un vector de 186 características, en imágenes H and E. El abordaje se evaluó en una cohorte de 178 pacientes con cáncer de pulmón de células no pequeñas en etapa inicial, 100 muestras se utilizaron para el entrenamiento del modelo propuesto y 78 para la validación independiente. La información de recurrencia del cáncer es obtenida en la historia clínica de los pacientes, donde la tasa de supervivencia a 5 años es el rango establecido sin recurrencia. estipula según ciertos criterios de recurrencia clínicamente definidos. Se entren´o un clasificador de análisis discriminante lineal (LDA, por sus siglas en inglés), junto con los linfocitos clusterizados para predecir la probabilidad de recurrencia en el conjunto de prueba. Las características arrojaron un AUC = 0,84 en comparación con un enfoque que tiene en cuenta únicamente la densidad de los TILs (AUC = 0,58). Además, un análisis de Kaplan-Meier mostró que las características podían distinguir estadísticamente entre la recurrencia temprana y recurrencia tardía (p = 4 ∗ 10−5 con un alfa de corte de 0.05).