bachelorThesis
Um método de detecção de outliers para encontrar fraudes na cota para exercício da atividade parlamentar
An outlier detection method to search for fraud in the quota for parliamentary activity
Registro en:
2016023636
MAGALHÃES, Rayland Matos. Um método de detecção de outliers para encontrar fraudes na cota para exercício da atividade parlamentar. 2020. 44 f. TCC (Graduação) - Curso de Estatística, Departamento de Estatística, Universidade Federal do Rio Grande do Norte, Natal, 2020.
Autor
Magalhães, Rayland Matos
Resumen
This monograph aims to defend the opening of data as a way to fight corruption, create a shiny application that allows the monitoring of expenses of federal deputies with the Quota to Exercise Parliamentary Activity (CEAP, in Portuguese), develop an unsupervised outlier detection method based on the Kolmogorov-Smirnov test to apply it to the CEAP data set and, using the Monte Carlo method, evaluate the test performance by estimating the probabilities of type I and II errors. We were able to see how an international data opening treaty has been able to inhibit the action of malicious politicians by making their spending on CEAP accessible to any citizen. Simulation studies suggest that as the number of requests a deputy made in the same company increases, the probability the method will detect a small deviation in the distribution of expenses increases as well. When applying the tests to the expenses of a congressperson who was known to defraud CEAP, the method has signaled a set of suspicious companies and among them was the company in which the congressperson committed the fraud. Esta monografia tem como objetivos defender a abertura de dados como uma forma de se combater a corrupção, criar uma aplicação em shiny que permita monitorar gastos de deputados federais com a Cota para Exercício da Atividade Parlamentar (CEAP), desenvolver uma técnica de detecção de outliers não supervisionada baseada no teste de Kolmogorov-Smirnov para aplicá-la ao conjunto de dados da CEAP e, usando o método de Monte Carlo, avaliar o desempenho do teste estimando as probabilidades dos erros do tipo I e II. Pudemos ver como um tratado internacional de abertura de dados foi capaz de inibir a ação de políticos mal intencionados fazendo com que seus gastos com a CEAP fossem acessíveis por qualquer cidadão. Estudos de simulação sugerem que à medida que o número de pedidos que um deputado fez numa mesma empresa aumenta, maior é a probabilidade de que o método detecte um pequeno desvio na distribuição dos gastos. Ao aplicar os testes aos gastos de um deputado que sabidamente fraudava a CEAP, o método sinalizou um conjunto de empresas suspeitas e entre elas estava a empresa na qual o deputado cometia a fraude.