Tesis
Um modelo baseado em algoritmo genético para seleção de características e classificação de padrões em imagens médicas
Fecha
2020-07-08Registro en:
33004153073P2
Autor
Neves, Leandro Alves [UNESP]
Universidade Estadual Paulista (Unesp)
Institución
Resumen
A análise de imagens histológicas é baseada na avaliação visual dos tecidos por especialistas, utilizando um microscópio óptico. Essa tarefa pode ser demorada e desafiadora, principalmente devido à complexidade das estruturas e doenças sob investigação. Estes fatos motivaram o desenvolvimento de métodos computacionais para apoiar especialistas em pesquisas e tomadas de decisões. Apesar das diferentes estratégias computacionais disponíveis na literatura, as soluções baseadas em programação genética não foram totalmente exploradas para fornecer a melhor combinação de recursos, algoritmos de seleção e classificadores. Uma abordagem baseada em algoritmo genético, capaz de avaliar um número significativo de características, métodos de seleção e classificadores, é descrita para fornecer uma combinação aceitável para o diagnóstico e reconhecimento de padrões de linfomas não-Hodgkin e câncer colorretal. A estrutura cromossômica foi representada por quatro genes. A avaliação e seleção dos indivíduos, bem como os processos de cruzamento e mutação, foram definidos para distinguir os grupos investigados, com o maior valor da AUC e o menor número de características. Os testes foram realizados considerando 1.512 características de imagens histológicas, diferentes tamanhos de população, taxas de mutação e número de iteracções. Uma população inicial, de 50 indivíduos e 50 iterações, forneceu o melhor resultado para o câncer colorretal. Para os linfomas não-Hodgkin, a população inicial foi composta de 500 indivíduos e também foram necessárias 50 iterações para fornecer melhor resultado. Os valores da AUC foram de 0,984 e 0,947 para o câncer colorretal e os linfomas não-Hodgkin, respectivamente. A metodologia proposta, com informações detalhadas sobre os métodos, características e melhores combinações, é uma contribuição relevante para a comunidade interessada no estudo do reconhecimento de padrões em imagens histológicas de linfomas e câncer colorretal. The analysis of histological images is based on visual assessment of tissues by specialists using an optical microscopy. This task can be time-consuming and challenging, mainly due to the complexity of the structures and diseases under investigation. These facts have motivated the development of computational methods to support specialists in research and decision-making. Despite the different computational strategies available in the literature, the solutions based on genetic programming have not been fully explored to provide the best combination of features, selection algorithms and classifiers. An approach based on genetic algorithm able to evaluate a significant number of features, selection methods and classifiers is described in order to provide an acceptable association for the diagnosis and pattern recognition of Non-Hodgkin lymphomas and colorectal cancer. The chromosomal structure was represented with four genes. The evaluation and selection of individuals, as well as the crossover and mutation processes were defined to distinguish the groups under investigation, with the highest AUC value and the smallest number of features. The tests were performed considering 1,512 features from histological images, different population sizes, mutation rate and number of iterations. An initial population of 50 individuals and 50 iterations provided the best result for colorectal cancer. For non-Hodgkin’s lymphomas, the initial population consisted of 500 individuals and 50 iterations was also necessary to provide the best result. The AUC values were 0.984 and 0.947 for the colorectal cancer and the Non-Hodgkin lymphomas, respectively. The proposed methodology with detailed information regarding the methods, features and best combinations are relevant contributions for the community interested into the study of pattern recognition of colorectal cancer and lymphomas.