dc.contributorChela, João Luiz
dc.contributorEscolas::EESP
dc.contributorTakada, Hellinton Hatsuo
dc.contributorRochman, Ricardo Ratner
dc.creatorPacheco Junior, João Carlos
dc.date.accessioned2019-03-12T14:23:31Z
dc.date.available2019-03-12T14:23:31Z
dc.date.created2019-03-12T14:23:31Z
dc.date.issued2018-02-12
dc.identifierhttp://hdl.handle.net/10438/27166
dc.description.abstractDevido à massificação da concessão do crédito no Brasil, proporcionada principalmente pelo desenvolvimento tecnológico, o combate a fraudes tornou-se imprescindível no âmbito das instituições financeiras, pois mesmo com baixa ocorrência têm apresentado uma tendência de crescimento, provocando assim um impacto negativo nos resultados das organizações. Neste contexto, os investimentos em técnicas mais sofisticadas para detecção de fraudes ocorrem com maior frequência, sendo que em muitos casos são utilizados métodos que aplicam técnicas de Aprendizado de Máquina, visando obter previsões mais precisas e confiáveis no combate aos eventos de fraude. Diante do exposto, este trabalho possui como objetivo propor modelos que utilizem técnicas de Aprendizado de Máquina em um banco de dados real, visando comparar os resultados obtidos com os de modelos tradicionalmente utilizados que aplicam técnicas de Regressão Logística. Adicionalmente o desafio do trabalho foi propor um classificador de Random Forest capaz de identificar 3 eventos distintos, que podem constituir uma fraude, ao mesmo tempo. Os resultados evidenciaram a viabilidade de se utilizar um único modelo frente a técnicas atuais onde múltiplos modelos são utilizados, um para cada evento, com uma baixa perda de desempenho, que pode ser compensada pela redução de complexidade na implantação do modelo.
dc.description.abstractDue to the massification of the credit concession in Brazil, mainly caused by recent technological development, fraud mitigation has become essential in financial institutions. Even with nowadays low occurrence rates, frauds have shown a significant increasing tendency for the future, causing, in this way, a negative impact on the organizations results. In this context, investments in more sophisticated techniques for detecting fraud has happen frequently, and in many cases, methods using Machine Learning techniques are been applied, in order to obtain more accurate and reliable predictions against fraud events. As a result of these context, this work aims to propose models and techniques that use Machine Learning in a real database, in order to compare the results obtained with traditional techniques that apply Logistic Regression techniques. Additionally, the challenge of this work was to propose a Random Forest classifier capable of identifying 3 distinct events at the same time, which may constitute a fraud. The results evidenced the viability of using a single model, as opposed to current techniques that employing multiple models, e.g. one model for each event, with a low loss of performance that can be compensated by the reduced complexity in the model implantation.
dc.languagepor
dc.rightsopenAccess
dc.subjectMachine learning
dc.subjectFraud detection
dc.subjectImbalanced datasets
dc.subjectMulti-output classifier
dc.subjectAprendizado de máquina
dc.subjectDetecção de fraudes
dc.subjectBase de dados desbalanceada
dc.subjectClassificador de múltiplas saídas
dc.titleModelos para detecção de fraudes utilizando técnicas de aprendizado de máquina
dc.typeDissertation


Este ítem pertenece a la siguiente institución