Brasil
| Patentes
Method For Automatically Filtering Spam
Autor
De Almeida Tiago Agostinho [br]
Yamakami Akebo [br]
Institución
Resumen
Nos últimos anos, spams têm se tomado um importante problema com enorme impacto na sociedade. A filtragem automática de tais mensagens impõe um desafio especial em categorização de textos, no qual a caracterlstica mais mareante é que os filtros enfrentam um adversário ativo, que constantemente procura evadir as técnicas de filtragem. O objeto da presente invenção trata-se de um método de filtragem automática de spam baseado no princípio da descrição mais simples auxiliado por licores de confidência. O método MDL-CF possui várias características apropriadas: consome poucos recursos computacionais, é fácil de ser implementado, muito rápido na classificação de novas mensagens e seu treinamento e aprendizado são muito simples. É bastante eficaz e eficiente na tarefa de classificação de spams, superando os resultados obtidos por métodos consagrados e por outros filtras previamente publicados na literatura. Outro ponto interessante é que o método proposto pode ser estendido e aplicado na solução de problemas de diversas áreas que envolvam classificação e categorização de textos, tais como: web spamming, hing spamming, social network spamming, mobile spamming, além de qualquer outro tipo de spam disseminado por texto. In recent years, spam has become a major problem with a huge impact on society. Automatically filtering such messages poses a special challenge in terms of text categorization, in which the key characteristic is that the filters are fighting against an active opponent which is always attempting to evade filtering techniques. The present invention relates to a method for automatically filtering spam based on the principle of the simplest description supported by confidential elements. The MDL-CF method has a number of suitable characteristics: it consumes limitedly processing resources, it is easy to implement, very quiet to classify new messages and it is very easy to train and teach. It classifies spam effectively and efficiently, achieving better results than established methods and other filters previously published in the literature. Another interesting point is that the method proposed can be extended and applied to address problems in different areas involving text classification and categorization, such as: web spamming, blog spamming, social network spamming, mobile spamming, and any other type of text-based spam. WO2012071635 (A1) G06F21/00 G06N7/00 G06N99/00 H04L12/00
WO2011BR00427 G06F21/00 G06N7/00 G06N99/00 H04L12/00 US6161130 (A)