dc.contributorBotia Valderrama, Javier Fernando
dc.creatorRosales Guerrero, Santiago Felipe
dc.creatorMartínez Rendón, María Isabel
dc.date2023-06-14T20:07:41Z
dc.date2023-06-14T20:07:41Z
dc.date2023
dc.date.accessioned2024-04-23T18:11:11Z
dc.date.available2024-04-23T18:11:11Z
dc.identifierhttps://hdl.handle.net/10495/35503
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/9230500
dc.descriptionRESUMEN : Uno de los objetivos de los bancos es ofrecer tarjetas de crédito a clientes que tengan un buen comportamiento de pago. Con esto en mente, el objetivo de este documento es indicar cómo a través de la información personal e historial de pagos, de los clientes existentes en el banco, se puede catalogar a un posible cliente como apto o no apto para la aprobación de un cupo de tarjeta de crédito. Además de la adecuación y limpieza de los datos, es necesario implementar metodologías para hacer un tratamiento al desbalance de las etiquetas de la base de datos, ya que por lo general los bancos tienen muchos clientes con buen comportamiento en sus pagos y muy pocos que incumplen. Luego, se realiza una competencia de modelos teniendo como línea base la regresión logística, los modelos implementados fueron: Máquina de Soporte Vectorial, Árboles de Decisión, AdaBoost y Árboles Aleatorios. El mejor resultado se obtuvo con el método de sobremuestreo SMOTENC y con el modelo Árboles Aleatorios con un Accuracy de 98.8%, Balance accuracy score de 81.2% y Log Loss de 0.035.
dc.descriptionABSTRACT : One of the objectives of banks is to offer credit cards to customers with good payment behavior. With this in mind, the objective of this document is to indicate how, through the personal information and payment history of the bank's existing customers, a potential customer can be categorized as eligible or ineligible for credit card quota approval. In addition to the adequacy and cleanliness of the data, it is necessary to implement methodologies to treat the imbalance of the database labels, since banks usually have many customers with good payment behavior and very few who default. Then, a model competition is carried out having logistic regression as a baseline, the models implemented were: Support Vector Machine, Decision Trees, AdaBoost and Random Forest. The best result was obtained with the SMOTENC oversampling method and with the Random Forest model with an Accuracy of 98.8%, Balance accuracy score of 81.2% and Log Loss of 0.035.
dc.format33
dc.formatapplication/pdf
dc.formatapplication/pdf
dc.languagespa
dc.publisherMedellín, Colombia
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightshttp://creativecommons.org/licenses/by-nc-sa/2.5/co/
dc.rightshttp://purl.org/coar/access_right/c_abf2
dc.rightshttps://creativecommons.org/licenses/by-nc-sa/4.0/
dc.subjectTarjetas de crédito
dc.subjectBancos
dc.subjectAprendizaje automático (inteligencia artificial)
dc.subjectComportamiento del consumidor
dc.subjectModelos de clasificación
dc.subjectDesbalance de datos
dc.titleAnalítica de datos para predicciones en aprobaciones de tarjetas de crédito
dc.typeinfo:eu-repo/semantics/other
dc.typeinfo:eu-repo/semantics/draft
dc.typehttp://purl.org/coar/resource_type/c_46ec
dc.typehttp://purl.org/redcol/resource_type/COther
dc.typeTesis/Trabajo de grado - Monografía - Especialización


Este ítem pertenece a la siguiente institución