Monografia
Extração de relações semânticas binárias a partir de dados não estruturados em português
Registro en:
Rodrigues, Ariel Ferreira. Extração de relações semânticas binárias a partir de dados não estruturados em português. São Cristóvão, SE, 2018. Monografia (Graduação em engenharia da Computação) – Curso de Engenharia de Computação, Departamento de Computação, Centro de Ciências Exatas e Tecnologia, Universidade Federal de Sergipe, 2018
Autor
Rodrigues, Ariel Ferreira
Institución
Resumen
O presente trabalho avalia o uso de redes neurais convolucionais para extração de relações semânticas binárias de textos em português do Brasil e português de Portugal. Também é avaliado neste trabalho a influência da quantia de dimensões dos vetores de palavras nas macro-métricas (precisão, cobertura e métrica F1) resultantes. Para isso, foram avaliados quatro algoritmos de word embeddings diferentes (Word2Vec, Wang2Vec, FastText, GloVe), tendo sido os três primerios treinados a partir das abordagens SkipGram e CBoW. Cada word embedding foi avaliado com os valores de dimensões 50, 300 e 1000. O conjunto de dados utilizado neste trabalho foi gerado utilizando supervisão distante e inclui mais de 90 mil relações semânticas e mais de 1 bilhão de tokens. Os experimentos realizados alcançaram precisão de 80% e cobertura de 72%, resultados superiores aos apresentados pelos autores do conjunto de dados adotado, também pôde-se perceber que a quantia de dimensões dos word embeddings não influencia de forma linear as macro-métricas resultantes, reforçando resultados já encontrados na literatura. São Cristóvão, SE