masterThesis
Clasificación robusta de muestras de cáncer de mamas
Fecha
2018Autor
Vargas Martínez, Alejandro
Institución
Resumen
Distintos autores han expresado la importancia de conocer el efecto de la expresión génica de tejido normal en una muestra de cáncer de mama cuando se es analizada usando distintos clasificadores moleculares, debido a que se considera que está causando un grado de error al asignar una etiqueta a una muestra y, por lo tanto, la posibilidad de brindar una terapia inadecuada. El objetivo principal de este estudio fue el de evaluar el efecto de la expresión génica del tejido normal en magnitud y dirección sobre el diagnóstico de clases tumorales utilizando el clasificador molecular PAM50 como referencia. Para medir el efecto, se desarrolló una metodología estadística que estima el valor de proporción tumoral utilizando dos matrices de expresión génica de entrenamiento provenientes de muestras de pacientes con tumor y muestras de pacientes normales. La metodología propuesta fue evaluada utilizando las expresiones génicas de las muestras de pacientes sanos y las expresiones génicas de las muestras de los pacientes clasificados como “Normal-Like” de la base de entrenamiento. La función permitió estimar el valor de proporción de expresión tumoral presente en la muestra para luego aplicar la corrección de la expresión génica y generar una reclasificación utilizando PAM50. La cantidad de proporción de tejido normal presente en las muestras de cáncer de mama para cada una de las muestras de las cinco bases de datos públicas tuvo un impacto importante en la reasignación de la etiqueta luego de la corrección. Hubo cambios en muestras que pasaron de tener un diagnóstico favorable a uno menos favorable y viceversa. Sin embargo, factores como las expresiones génicas utilizadas para el entrenamiento del algoritmo que provienen de material biológico no puro y la misma heterogeneidad de la enfermedad, no permitieron tener una estimación más insesgada del vector de medias y de la matriz de varianza y covarianza de cada clase tumoral para una mejor estimación del valor de proporción tumoral mediante la metodología propuesta.