Dissertação
Automatic diagnosis of rheumatic heart disease in echocardiographic exams
Fecha
2021-12-13Autor
João Francisco Barreto da Silva Martins
Institución
Resumen
Cardiopatia Reumática (CR) afeta aproximadamente 39 milhões de pessoas ao redor do mundo e é a doença cardíaca adquirida mais comum entre crianças e adolescentes. A doença é responsável por mais de 300.000 mortes anualmente e figura entre as principais causas de morte e invalidez em países de baixa e média renda mas pode ser evitada se detectada precocemente. Ecocardiogramas são o padrão ouro para o diagnóstico de CR, sendo uma ferramenta muito eficaz para sua identificação enquanto latente. Devido ao custo de equipamento e à escassez de mão de obra qualificada, a adoção em massa de programas de rastreamento para detecção precoce e prevenção da progressão da doença em áreas endêmicas ainda é severamente restrita. Avanços tecnológicos recentes diminuíram o custo de máquinas ecocardiográficas portáteis, porém a lacuna de mão de obra qualificada permanece e poderia ser preenchida através da implementação de aplicações para diagnóstico auxiliado por computador. Neste trabalho, abordamos os desafios do diagnóstico automático de CR em exames ecocardiográficos convencionais. Não há literatura prévia sobre o assunto, e hipotetizamos que os métodos desenvolvidos para tarefas relacionadas provavelmente não funcionariam tão bem devido à negligência de informações temporais. Para testar essa hipótese, comparamos o desempenho de uma rede neural convolucional (RNC) 3D com um modelo de tamanho semelhante da literatura ao prever a presença de CR em cada vídeo. Também propomos uma estratégia de agregação mais sofisticada para emitir o diagnóstico de um exame completo, que é supervisionada e baseado nos momentos da distribuição de confiança para as previsões de vídeo do classificador anterior. Experimentos mostram que o modelo com noção temporal e a estratégia de agregação supervisionada são significativamente melhores na tarefa de diagnóstico de CR. Finalmente, apresentamos uma rede neural convolucional de dois fluxos em uma configuração de aprendizado multitarefa que usa uma RNC 2D como extrator de características, mas que ainda assim é capaz de incorporar informações temporais na previsão por meio de mecanismos de atenção. Além disso, propomos uma estratégia de agregação não supervisionada que é centrada na detecção de vídeos fora da distribuição como instâncias ruidosas, eventualmente removendo-os do processo de diagnóstico final. Ao levar em conta rótulos de anormalidades funcionais do coração como tarefas auxiliares durante o treino, nosso novo método não só é capaz de superar significativamente outros métodos tomados linhas de base com uma acurácia de 71,18% mas também é capaz de fornecer informações consistentes sobre seu processo de tomada de decisão em múltiplos níveis, principalmente como visualizações temporais (quadros relevantes no vídeo) e espaciais (estruturas relevantes em um quadro). Direções para a adoção dessa tecnologia no mundo real são discutidas.