Aprendizado de contexto de imagens por meio de redes neurais convolucionais baseadas em grafos

LUIS GUSTAVO DE SOUZA; Universidade Tecnológica Federal do Paraná, Cornélio Procópio, Paraná, Brasil; Priscila Tiemi Maeda Saito; Universidade Tecnológica Federal do Paraná, Cornélio Procópio, Paraná, Brasil

Documento avaliado pelos pares

Registro en:

https://eventos.utfpr.edu.br//sicite/sicite2020/paper/view/7064

https://repositorioslatinoamericanos.uchile.cl/handle/2250/5308096

Autor

LUIS GUSTAVO DE SOUZA; Universidade Tecnológica Federal do Paraná, Cornélio Procópio, Paraná, Brasil

Priscila Tiemi Maeda Saito; Universidade Tecnológica Federal do Paraná, Cornélio Procópio, Paraná, Brasil

Institución

Universidade Tecnológica Federal do Paraná (Brasil)

Resumen

Entre as áreas da visão computacional, a compreensão de contexto de imagem, que se direciona ao reconhecimento de cenas pelos seus objetos, vem sendo observada em diferentes aplicações. Entretanto, ferramentas tradicionais da visão computacional, como as Redes Neurais Convolucionais (CNNs) e Multi-Layer Perceptrons (MLPs), por operarem no domínio euclidiano são incapazes de modelarem as relações entre os objetos da imagem, consequentemente, prejudicando o reconhecimento. Desta forma, este trabalho apresenta a proposta e o desenvolvimento de um modelo capaz de determinar o contexto de uma imagem pela análise do conteúdo dos objetos (características visuais) e as suas respectivas interações. Para isso, é construída uma representação em forma de grafo do conjunto de dados MIT64, e treinada uma estrutura de Rede Neural Convolucional baseada em Grafo (GCN) capaz de abstrair ambas informações (as interações e o conteúdo dos objetos). Pelos experimentos, a abordagem proposta apresenta, em relação às ferramentas tradicionais (MLP), uma melhora de 134% na assertividade do modelo. Assim, evidenciando a importância das interações entre os objetos em conjunto com as características visuais.

Materias

Aprendizado de Máquina e Visão Computacional

Inteligência artificial; Aprendizado do computador; Processamento de imagens digitais; Visão por computador; Teoria dos grafos

Mostrar el registro completo del ítem