Modelos para detecção de fraudes utilizando técnicas de aprendizado de máquina

Pacheco Junior, João Carlos

dc.contributor	Chela, João Luiz
dc.contributor	Escolas::EESP
dc.contributor	Takada, Hellinton Hatsuo
dc.contributor	Rochman, Ricardo Ratner
dc.creator	Pacheco Junior, João Carlos
dc.date.accessioned	2019-03-12T14:23:31Z
dc.date.available	2019-03-12T14:23:31Z
dc.date.created	2019-03-12T14:23:31Z
dc.date.issued	2018-02-12
dc.identifier	http://hdl.handle.net/10438/27166
dc.description.abstract	Devido à massificação da concessão do crédito no Brasil, proporcionada principalmente pelo desenvolvimento tecnológico, o combate a fraudes tornou-se imprescindível no âmbito das instituições financeiras, pois mesmo com baixa ocorrência têm apresentado uma tendência de crescimento, provocando assim um impacto negativo nos resultados das organizações. Neste contexto, os investimentos em técnicas mais sofisticadas para detecção de fraudes ocorrem com maior frequência, sendo que em muitos casos são utilizados métodos que aplicam técnicas de Aprendizado de Máquina, visando obter previsões mais precisas e confiáveis no combate aos eventos de fraude. Diante do exposto, este trabalho possui como objetivo propor modelos que utilizem técnicas de Aprendizado de Máquina em um banco de dados real, visando comparar os resultados obtidos com os de modelos tradicionalmente utilizados que aplicam técnicas de Regressão Logística. Adicionalmente o desafio do trabalho foi propor um classificador de Random Forest capaz de identificar 3 eventos distintos, que podem constituir uma fraude, ao mesmo tempo. Os resultados evidenciaram a viabilidade de se utilizar um único modelo frente a técnicas atuais onde múltiplos modelos são utilizados, um para cada evento, com uma baixa perda de desempenho, que pode ser compensada pela redução de complexidade na implantação do modelo.
dc.description.abstract	Due to the massification of the credit concession in Brazil, mainly caused by recent technological development, fraud mitigation has become essential in financial institutions. Even with nowadays low occurrence rates, frauds have shown a significant increasing tendency for the future, causing, in this way, a negative impact on the organizations results. In this context, investments in more sophisticated techniques for detecting fraud has happen frequently, and in many cases, methods using Machine Learning techniques are been applied, in order to obtain more accurate and reliable predictions against fraud events. As a result of these context, this work aims to propose models and techniques that use Machine Learning in a real database, in order to compare the results obtained with traditional techniques that apply Logistic Regression techniques. Additionally, the challenge of this work was to propose a Random Forest classifier capable of identifying 3 distinct events at the same time, which may constitute a fraud. The results evidenced the viability of using a single model, as opposed to current techniques that employing multiple models, e.g. one model for each event, with a low loss of performance that can be compensated by the reduced complexity in the model implantation.
dc.language	por
dc.rights	openAccess
dc.subject	Machine learning
dc.subject	Fraud detection
dc.subject	Imbalanced datasets
dc.subject	Multi-output classifier
dc.subject	Aprendizado de máquina
dc.subject	Detecção de fraudes
dc.subject	Base de dados desbalanceada
dc.subject	Classificador de múltiplas saídas
dc.title	Modelos para detecção de fraudes utilizando técnicas de aprendizado de máquina
dc.type	Dissertation

Este ítem pertenece a la siguiente institución

Fundação Getulio Vargas (Brasil)