Documento avaliado pelos pares
Aprendizado de contexto de imagens por meio de redes neurais convolucionais baseadas em grafos
Autor
LUIS GUSTAVO DE SOUZA; Universidade Tecnológica Federal do Paraná, Cornélio Procópio, Paraná, Brasil
Priscila Tiemi Maeda Saito; Universidade Tecnológica Federal do Paraná, Cornélio Procópio, Paraná, Brasil
Resumen
Entre as áreas da visão computacional, a compreensão de contexto de imagem, que se direciona ao reconhecimento de cenas pelos seus objetos, vem sendo observada em diferentes aplicações. Entretanto, ferramentas tradicionais da visão computacional, como as Redes Neurais Convolucionais (CNNs) e Multi-Layer Perceptrons (MLPs), por operarem no domínio euclidiano são incapazes de modelarem as relações entre os objetos da imagem, consequentemente, prejudicando o reconhecimento. Desta forma, este trabalho apresenta a proposta e o desenvolvimento de um modelo capaz de determinar o contexto de uma imagem pela análise do conteúdo dos objetos (características visuais) e as suas respectivas interações. Para isso, é construída uma representação em forma de grafo do conjunto de dados MIT64, e treinada uma estrutura de Rede Neural Convolucional baseada em Grafo (GCN) capaz de abstrair ambas informações (as interações e o conteúdo dos objetos). Pelos experimentos, a abordagem proposta apresenta, em relação às ferramentas tradicionais (MLP), uma melhora de 134% na assertividade do modelo. Assim, evidenciando a importância das interações entre os objetos em conjunto com as características visuais.