bachelorThesis
Detección de entidades nombradas en textos de reportes de imágenes médicas
Fecha
2021Autor
Francesca, Lucas Agustín de
Institución
Resumen
En este trabajo se abordó el problema de reconocimiento de entidades nombradas sobre texto de reportes de imágenes médicas, empleando distintas alternativas a la solución del problema. La primera de ellas es un clasificador basado en máquinas de vectores de soporte con ventana deslizante. Luego aplicamos distintas alternativas sobre arquitecturas de redes neuronales, donde la principal componente de las mismas es una capa recurrente bidireccional. Analizamos el impacto de las distintas configuraciones y llegamos a la conclusión que aquellos aprendedores que utilizan word embeddings (reducciones de dimensionalidad neuronales) a nivel palabra y carácter logran un mejor rendimiento. Además, la utilización de un campo aleatorio condicional (Conditional Random Field) como capa final de la arquitectura neuronal mejora el rendimiento en comparación con una capa densa con función de activación softmax. This work addresses the named entity recognition task on medical image report texts by applying two approaches. The first one is a support vector machine based on a sliding window. The second approach is based on neural network architectures, using a bidirectional recurrent layer as the main component, where we apply and compare different configurations. We analyzed different alternatives and came to the conclusion that those learners that use word and character level embeddings achieve better performance. Also, using a conditional random field as a final layer increases performance compared to a dense layer with softmax as activation function.