TC
Aplicação de otimização multi-objetivo em problemas de aprendizagem de máquinas para diminuição de discriminação
Fecha
2020-12Autor
Guardieiro, Vitória Aquino
Institución
Resumen
Um dos principais desafios ao criar um simulador do comportamento humano consiste em suprimir a perpetuação ao de vieses discriminatórios presentes na tomada de decisão humana. Diversas abordagens para lidar com tal problema já foram propostas na literatura de Inteligência Artificial. Tais propostas geralmente consistem na definição de métricas desenvolvidas para quantificar a discriminação decorrente de um modelo de inteligência artificial e na aplicação de tais métricas na geração do modelo de forma a limitar os efeitos discriminatórios gerados. Entretanto, a limitação da discriminação de um modelo faz com que o erro médio dele aumente, gerando um cenário de conflito entre essas métricas. Neste trabalho, propomos uma metodologia que utiliza de otimização multi-objetivo que simultaneamente otimiza o desempenho dos modelos e a qualidade da predição nos grupos sensíveis (que podem sofrer discriminação). Focando em problemas de classificação binária, buscamos encontrar o conjunto dos melhores modelos para tais métricas. Comparamos nossa abordagem com outras metodologias bem conhecidas da área, usando a Regressão Logística como referência de comparação. A metodologia proposta obteve resultados promissores, sendo capaz de diminuir a discriminação dos modelos de inteligência artificial conjuntamente com a manutenção do desempenho em acurácia. One of the main challenges when creating a simulator of human behavior is to suppress the perpetuation of discriminatory biases present in human decision making. Several approaches to deal with this problem have already been proposed in Artificial Intelligence literature. Such proposals generally consist of the definition of metrics developed to quantify the discrimination resulting from an artificial intelligence model and the application of such metrics in the generation of the model to limit the discriminatory effects generated. However, limiting the discrimination of a model causes the average error of
it to increase, generating a scenario of conflict between these metrics. In this project, we propose a methodology that uses multi-objective optimization that simultaneously
optimizes the performance of the models and the quality of the prediction in sensitive groups (which may suffer discrimination). Focusing on binary classification problems,
we seek to find the set of the best models for such metrics. We compared our approach with other well-known methodologies in the area, using Logistic Regression as a comparison reference. The proposed methodology obtained promising results, being able to reduce the discrimination of artificial intelligence models together with the maintenance of accurate performance.