Trabajo de grado - Maestría
Análisis de modelos de difusión por imágenes de resonancia magnética nuclear con machine learning
Fecha
2022-05Registro en:
Universidad Nacional de Colombia
Repositorio Institucional Universidad Nacional de Colombia
Autor
Prieto González, Leonar Steven
Institución
Resumen
En este trabajo se presenta la caracterización de las curvas de atenuación por difusión vóxel a vóxel de 4 conjuntos de imágenes (uno de próstata, dos de cerebro humano y uno de cerebro ex vivo de una neoplasia benigna). Esta caracterización incluye la determinación de los valores de difusión (D), pseudo-difusión (D∗), perfusión (f) y curtosis (K) usando los métodos de ADC (mono-exponencial) e IVIM (bi-exponencial) con y sin curtosis. Estos valores son utilizados como referencia para entrenar y probar la validez de varios algoritmos de machine learning (ML) que permiten disminuir el tiempo en la caracterización de la atenuación. Para decidir si en un vóxel existe difusión se implementan algoritmos de clasificación (Extra-Tree Classifier (ETC), Regresión logística (LR), C-Support vector (SVC), Extra-Gradient Boost (XGB) y perceptron multicapa (MLP)), evaluados mediante la precisión y el test AUC. Mientras que para estimar los parámetros característicos se implementan métodos de regresión (Regresión lineal (LinR), regr. polinómica (Poly), XGB, Ridge, Lasso, Random Forest (RF), ElasticNet y support-vector machine (SVM)) que son evaluados mediante diferentes métricas de regresión, particularmente, la raíz del error cuadrático medio de la validación cruzada (RMSE CV). El objetivo de este trabajo es aplicar estas herramientas de ML para el análisis de difusión por imágenes de resonancia magnética. Se obtuvieron como mejores clasificadores el ETC y el MLP con una precisión del 94.1 % y 91.7 % respectivamente. Para la estimación de parámetros el mejor algoritmo fue RF; D posee un RMSECV del 8.39 %, D∗ del 3.57 %, f con 4.52 % y K con 3.53 %. Aunque estos resultados pueden ser considerados satisfactorios, es posible que otros algoritmos que no se tuvieron en cuenta en este trabajo puedan reportar un mejor desempeño. El tiempo promedio que los algoritmos de ML tardan en caracterizar 100.000 vóxeles es 18, 998 ± 0, 135 s mientras que mediante métodos convencionales es de 4408 ± 351 s. In this work we present the characterization of the voxel-by-voxel diffusion attenuation curves of 4 sets of images (one from the prostate, two from the human brain and one from the ex vivo brain of a mini pig). This characterization includes the determination of the values of diffusion (D), pseudo-diffusion (D∗), perfusion (f), and kurtosis (K); using ADC (mono-exponential) and IVIM (bi-exponential) considering kurtosis when convenient. These values are used as a reference to train and test the validity of several machine learning (ML) algorithms that allow to reduce the CPU time to characterize the attenuation curves. To decide if there is diffusion in a voxel, classification algorithms are implemented; (Extra-Tree Classifier (ETC), Logistic Regression (LR), C-Support Vector (SVC), Extra-Gradient Boost (XGB) and Multilayer Perceptron (MLP)), were evaluated by precision and the AUC tests. On the other hand, regression methods; (Linear Regres sion (LinR), Polynomial Regr. (Poly), XGB, Ridge, Lasso, Random Forest (RF), Elastic Net and Support-Vector Machines (SVM)) are implemented to estimate the characteristic parameters and are evaluated using different regression metrics, particularly, root mean square error of cross-validation (RMSECV). The main objective of this work is to apply the se ML tools for diffusion analysis in magnetic resonance images. The ETC and the MLP showed the best classifiers with accuracies of 94.1 % and 91.7 %, respectively. For parame ters estimation, the best algorithm was RF; D has an RMSECV of 8.39 %, D∗ of 3.57 %, f of 4.52 % and K of 3.53 %. Although these results can be considered satisfactory, it is possi ble that other algorithms that were not taken into account in this work may report better performance.The average time that ML algorithms take to characterize 100.000 voxels is 18,998 ± 0,135 s while using conventional methods it is 4408 ± 351 s.