dc.contributor | Albuquerque, Pedro Henrique Melo | |
dc.creator | Amorim, Fernanda Santos | |
dc.date.accessioned | 2022-01-11T21:20:51Z | |
dc.date.accessioned | 2022-10-04T14:28:53Z | |
dc.date.available | 2022-01-11T21:20:51Z | |
dc.date.available | 2022-10-04T14:28:53Z | |
dc.date.created | 2022-01-11T21:20:51Z | |
dc.date.issued | 2022-01-11 | |
dc.identifier | AMORIM, Fernanda Santos. Previsão de indícios de fraude em fundos de pensão utilizando modelos de aprendizado de máquina supervisionados e técnicas de balanceamento de dados. 2021. 95 f., il. Dissertação (Mestrado em Administração)—Universidade de Brasília, Brasília, 2021. | |
dc.identifier | https://repositorio.unb.br/handle/10482/42727 | |
dc.identifier.uri | http://repositorioslatinoamericanos.uchile.cl/handle/2250/3854938 | |
dc.description.abstract | Fraudes Financeiras têm se tornado alvo de diversos estudos, devido aos impactos
(principalmente econômicos), que estas podem causar a empresas, países e pessoas físicas.
Detecção de Fraudes é a área de estudos que procura identificar atividades fraudulentas. Estas
análises são feitas dentro de conjuntos de dados que são muito desbalanceados devido à baixa
ocorrência dos acontecimentos alvo, isto é, existem classes de dados que ocorrem com maior
frequência (classes majoritárias) que outras(classes minoritárias). Os dados que ocorrem com
menor frequência são conhecidos como eventos raros e podem ser observados em diversas
áreas de estudo como medicina (doenças raras), sistemas de rede (detecção de intrusos),
meteorologia (desastres naturais), finanças (fraudes, falência). O estudo proposto tem como
objetivo avaliar o desempenho de Modelos Supervisionados de Aprendizado de Máquina para
dados desbalanceados de Indício de Fraudes em Fundos de Pensão utilizado Técnicas de
Balanceamento de dados. Os dados utilizados foram cedidos pela Superintendência Nacional de
Previdência Complementar (PREVIC). Para Seleção de Variáveis, foi usado Análise de
Componentes Principais. Os modelos utilizados foram: Regressão Logística, Random Forest,
Máquina de Suporte Vetorial e Redes Neurais. As Técnicas de Balanceamento utilizadas foram
Random Undersampling, SMOTE e SMOTETomek.Com os testes realizados, este estudo
recomenda a utilização do Random Forest como Modelo de Aprendizado de Máquina, ajustando
o desbalanceamento da base com o SMOTE, por ter apresentado os melhores resultados de
acordo com as Métricas de Avaliação utilizadas | |
dc.language | Português | |
dc.rights | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. | |
dc.rights | Acesso Aberto | |
dc.title | Previsão de indícios de fraude em fundos de pensão utilizando modelos de aprendizado de máquina supervisionados e técnicas de balanceamento de dados | |
dc.type | Tesis | |