MDLText aplicado na Filtragem Automática de SPIM e SMS Spam

dc.creatorSilva, Renato Moraes
dc.creatorAlmeida, Tiago A.
dc.creatorYamakami, Akebo
dc.date2018-05-21
dc.date.accessioned2023-06-16T20:46:01Z
dc.date.available2023-06-16T20:46:01Z
dc.identifierhttp://seer.unirio.br/isys/article/view/6362
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/6686577
dc.descriptionSpam filtering in online instant messages and SMS is a challenging problem nowadays. It is because the messages are often very short and rife with slangs, idioms, symbols, emoticons, and abbreviations which hamper predicting and knowledge discovering. In order to face this problem, we evaluated a simple, fast, scalable, multiclass, and online text classification method based on the minimum description length principle. We conducted experiments using a real and public dataset, which demonstrate that our method is effective on instant messaging and SMS spam filtering in both online and offline learning contexts.en-US
dc.descriptionA filtragem automática de spam em mensagens instantâneas e SMS é um problema desafiador, pois as mensagens são frequentemente curtas e repletas de ruídos, tais como gírias, expressões idiomáticas, símbolos, emoticons e abreviações, o que dificulta a extração de conhecimento e predição. Para enfrentar esse problema, neste artigo é avaliado um método de classificação de texto baseado no princípio da descrição mais simples, que é eficiente, rápido, escalável, multiclasse e possui aprendizado incremental. Experimentos realizados com uma base de dados real e pública, em cenários de aprendizado online e offline, indicam que o método proposto é promissor para a tarefa de detecção de spam em mensagens instantâneas e SMS.pt-BR
dc.formatapplication/pdf
dc.languagepor
dc.publisherUniriopt-BR
dc.relationhttp://seer.unirio.br/isys/article/view/6362/6233
dc.rightsCopyright (c) 2017 Renato Moraes Silva, Tiago A. Almeida, Akebo Yamakamipt-BR
dc.sourceiSys - Brazilian Journal of Information Systems; Vol. 11 No. 1 (2018); 103-132en-US
dc.sourceiSys - Brazilian Journal of Information Systems; v. 11 n. 1 (2018); 103-132pt-BR
dc.source1984-2902
dc.subjectOnline learningen-US
dc.subjectOccam's razoren-US
dc.subjectText categorizationen-US
dc.subjectMachine learningen-US
dc.subjectAprendizado onlinept-BR
dc.subjectNavalha de Occampt-BR
dc.subjectCategorização de textopt-BR
dc.subjectAprendizado de máquinapt-BR
dc.titleMDLText applied to automatic filtering of SPIM and SMS Spamen-US
dc.titleMDLText aplicado na Filtragem Automática de SPIM e SMS Spampt-BR
dc.typeinfo:eu-repo/semantics/article
dc.typeinfo:eu-repo/semantics/publishedVersion


Este ítem pertenece a la siguiente institución