bachelorThesis
Sistema de recomendação baseado em análise de redes
Registro en:
SANTOS, Jonatas Rodolfo Pereira dos. Sistema de Recomendação Baseado em Análise de Redes. Orientador: Ivanovitch Medeiros Dantas da Silva. 2022. 45 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2022.
Autor
Santos, Jonatas Rodolfo Pereira dos
Resumen
Recommender systems are a subgroup of filtering and search algorithms sets, whose main
the objective is to find or predict a user’s preferences for a given object, such as forecasting
movie or tv show preferences for each user on an audio-visual media platform, for example.
This work proposes a system that recommends movies, or in other words, seeks to find what
the user’s most likely choices are. Films recommendation in this case, first of all, consists of
finding adequate modeling for this kind of dataset to establish appropriate distance metrics
and the interrelationship between their constituent entities, such as actors, directors, genre,
etc. To better support the characteristics of this problem, the data structure that stands
out as the first choice is the graph, and the most suitable subareas of computing for this are
data engineering and data science. With this initial guideline, a recommendation system
was implemented whose infrastructure uses data engineering technologies and architecture.
Tools such as Wandb, Mlflow, Hydra, and Python, were used to build replicable models
and version the artifacts necessary for the execution of the algorithms. Neo4j, a graph
database, stores the network that best represents the collected data and has the required
resources to create a complete recommendation system. Sistemas de Recomendação são um subgrupo de conjuntos de algoritmos de filtragem e
busca, cujo principal objetivo é encontrar ou predizer preferências de um usuário para
um determinado objeto, como predizer as preferências de filmes ou seriados para cada
usuário em uma plataforma de mídia audiovisual. Neste trabalho, propõe-se um sistema
que recomenda filmes ou, em outras palavras, tem o intuito encontrar quais são as escolhas
do usuário mais prováveis afim de prover-lhe uma experiência personalizada. Recomendar
filmes nesse caso, em primeiro lugar, consiste em encontrar uma modelagem adequada
para os filmes, de modo a possibilitar o estabelecimento de métricas de distância e o
inter-relacionamento entre suas entidades constituintes, como atores, diretores e gênero.
Para comportar melhor as características desse problema, a estrutura de dados que se
sobressai como primeira escolha é o grafo e as subáreas da computação mais adequadas a
engenharia e ciência de dados. Dispondo desse norte inicial, foi implementado um sistema
de recomendação, cuja infraestrutura se vale de tecnologias e arquitetura da engenharia
de dados, ou Machine Learning Operations (MLOps), como Weights & Biases (Wandb),
MLflow, Hydra e Python, usadas no sentido de construir modelos replicáveis e versionar
os artefatos necessários para a execução dos algoritmos e o Neo4j, um banco de dados
em grafos para armazenar a rede que melhor representa os dados coletados e dispõe dos
recursos necessários para alcançar um sistema de recomendação completo.