Monografia
Uso de entidades nomeadas para reconhecimento de marcas em descrições de produtos
Registro en:
Oliveira, Ian Luan Fontes de. Uso de entidades nomeadas para reconhecimento de marcas em descrições de produtos. São Cristóvão, 2022. Monografia (graduação em Ciência da Computação) – Departamento de Computação, Centro de Ciências Exatas e Tecnologia, Universidade Federal de Sergipe, São Cristóvão, SE, 2022
Autor
Oliveira, Ian Luan Fontes de
Institución
Resumen
Price comparators are softwares that provide information about products and prices, enabling searches and comparisons, in order to ease the decision of the best place to shop, acting as helpers in this process. One of those comparators is Ludiiprice, an application for mobile devices that allows search, comparison and monitoring of product prices, that has its database populated through users’ collaboration, in which the users provide the data from the invoices QR Code reading and through the description of products extracted from the internet. This paper’s goal is to train a named entity recognition model to extract the brands on the products’ description, with the goal of increasing the product identification confiability in LudiiPrice, improving the recommendation and comparison processes between products. To achieve this, we built a dataset of 16112 products, extracted from three different e-commerces. It was used to train and evaluate a machine learning model, designed to extract the brands of product descriptions, with which we obtained the f1-score of 91% for the recognition of the beginning of the brands, 77% for the middle of the brands and 82% for the end of the brands. Furthermore, we have developed a new product suggestion system that uses the named entities in addition to cosine similarity, obtaining a hit hate 94%, which is 17.1% higher than that of the previous system, which used only cosine similarity. Os comparadores de preço são softwares que fornecem informações sobre produtos e preços, possibilitando buscas e comparações, a fim de facilitar a decisão sobre o melhor local para realizar as compras, atuando como auxiliadores nesse processo. Um desses comparadores é o LudiiPrice, um aplicativo para dispositivos móveis que permite a busca, a comparação e o monitoramento de preços de produtos, cuja base de dados é populada através de colaboração, onde os usuários fornecem os dados a partir da leitura do QR Code das notas fiscais e através de descrições de produtos extraídos na internet. O objetivo deste trabalho é treinar um modelo de reconhecimento de entidades nomeadas para extrair as marcas em descrições de produtos, visando adicionar ao LudiiPrice uma maior confiabilidade na identificação dos produtos, melhorando os processos de recomendação e comparação deles. Para isso, foi criada uma base de dados contendo 16112 produtos, extraídos de três e-commerces diferentes. Ela foi utilizada para treinar e avaliar um modelo de aprendizado de máquina, desenvolvido para extrair as marcas de descrições de produtos, com o qual obtivemos a f1-score de 91% para o reconhecimento do início da marca, 77% para o do meio da marca e 82% para o do final da marca. Além disso, foi desenvolvido o novo sistema de sugestão de produtos que utiliza as entidades nomeadas além da similaridade por cosseno, obtendo uma taxa de acerto de 94%, 17.1% maior que a do sistema anterior, que utilizava apenas a similaridade por cosseno. São Cristóvão, SE