dc.creator | Silva, Renato Moraes | |
dc.creator | Alberto, Túlio C. | |
dc.creator | Almeida, Tiago A. | |
dc.creator | Yamakami, Akebo | |
dc.date | 2017-09-30 | |
dc.date.accessioned | 2023-06-16T20:46:01Z | |
dc.date.available | 2023-06-16T20:46:01Z | |
dc.identifier | http://seer.unirio.br/isys/article/view/6383 | |
dc.identifier.uri | https://repositorioslatinoamericanos.uchile.cl/handle/2250/6686578 | |
dc.description | Muitos usuários do YouTube produzem conteúdo regularmente e fazem desta tarefa seu principal meio de vida. Contudo, esse sucesso vem despertando a atenção de usuários mal-intencionados, que propagam comentários indesejados para se autopromoverem ou para disseminar links maliciosos. Neste cenário, métodos tradicionais de categorização de texto podem sofrer limitações devido às características inerentes ao problema: (1) os comentários costumam ser curtos e mal redigidos e (2) o problema de classificação é naturalmente online. Este artigo avalia um método de classificação baseado no princípio da descrição mais simples e compara os resultados com os de métodos tradicionais de aprendizado online. Também é proposta uma técnica ensemble, que combina os métodos de classificação com diferentes técnicas de processamento de linguagem natural. Os experimentos foram cuidadosamente realizados e a análise estatística dos resultados indica que a técnica proposta obteve desempenho superior ao obtido quando apenas os comentários originais foram empregados. | pt-BR |
dc.format | application/pdf | |
dc.language | por | |
dc.publisher | Unirio | pt-BR |
dc.relation | http://seer.unirio.br/isys/article/view/6383/6156 | |
dc.rights | Copyright (c) 2017 Renato Moraes Silva, Túlio C. Alberto, Tiago A. Almeida, Akebo Yamakami | pt-BR |
dc.source | iSys - Brazilian Journal of Information Systems; Vol. 10 No. 3 (2017); 49-73 | en-US |
dc.source | iSys - Brazilian Journal of Information Systems; v. 10 n. 3 (2017); 49-73 | pt-BR |
dc.source | 1984-2902 | |
dc.subject | aprendizado de máquina | pt-BR |
dc.subject | categorização de texto | pt-BR |
dc.subject | princípio da descrição mais simples | pt-BR |
dc.subject | YouTube | pt-BR |
dc.title | MDLText e Indexação Semântica aplicados na Detecção de Spam nos Comentários do YouTube | pt-BR |
dc.type | info:eu-repo/semantics/article | |
dc.type | info:eu-repo/semantics/publishedVersion | |