doctoralThesis
Soluções em personalização de conteúdo baseadas em classificadores simbólicos modais
Registro en:
Leite Dantas Bezerra, Byron; de Assis Tenório Carvalho, Francisco. Soluções em personalização de conteúdo baseadas em classificadores simbólicos modais. 2008. Tese (Doutorado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2008.
Autor
Leite Dantas Bezerra, Byron
Institución
Resumen
Engenhos de Personalização são ferramentas úteis para se encontrar informações do
interesse de uma pessoa de forma efetiva. Para isso, eles capturam informações sobre os
usuários de um sistema para aprender sobre suas preferências. De posse destas
informações, os Engenhos de Personalização adotam técnicas de filtragem de informação
baseadas normalmente em classificadores com aprendizagem supervisionada. As técnicas
mais comuns definem as correlações entre os usuários da comunidade e, a partir daí,
disparam um processo conhecido popularmente como boca-à-boca . Outra técnica realiza
uma filtragem com base no conteúdo descritivo dos itens no repositório como, o elenco e o
gênero de um filme. Finalmente, existem abordagens híbridas que procuram combinar
diferentes técnicas absorvendo o que há de melhor em cada uma.
No presente trabalho fazemos uma leitura crítica do estado da arte relacionado aos
Engenhos de Personalização e, a partir daí, apresentamos três novos métodos baseados
em conceitos e ferramentas do domínio de Análise de Dados Simbólicos, em que cada um
deles segue uma técnica diferente: o método Content Modal Based Filtering realiza filtragem
de informação baseada no conteúdo; o método Social Modal Collaborative Filtering realiza
filtragem colaborativa; e o método Hybrid Modal Based Filtering realiza filtragem híbrida.
Definimos um processo de avaliação de desempenho das tecnologias de personalização
e o aplicamos para efeito de comparação dos nossos métodos com abordagens clássicas.
Em nossas análises consideramos dimensões relevantes para sistemas reais, mas pouco
exploradas nos trabalhos atuais, como o impacto da quantidade de itens no perfil do usuário
(associado ao Problema do Novo Usuário) e o tamanho da comunidade de usuários
(associado ao Problema da Esparsidade). Nos experimentos realizados constatamos que
duas de nossas abordagens de filtragem alcançaram desempenho em um cenário com
pouca informação sobre o usuário e alta esparsidade pouco abaixo de 4% comparado ao
desempenho obtido no cenário ideal. Nestas condições um dos métodos mais populares, a
filtragem colaborativa com kNN, apresenta uma queda de desempenho de 18,5% Conselho Nacional de Desenvolvimento Científico e Tecnológico