Trabajo de grado - Maestría
Comparación entre árboles de regresión CART y regresión Lineal
Fecha
2013Autor
Díaz Sepúlveda, Juan Felipe
Institución
Resumen
Resumen: La Regresión lineal es el método más usado en estadística para predecir valores de variables continuas debido a su fácil interpretación, pero en muchas situaciones los supuestos para aplicar el modelo no se cumplen y algunos usuarios tienden a forzarlos llevando a conclusiones erróneas. Los árboles de regresión CART son una alternativa de regresión que no requiere supuestos sobre los datos a analizar y es un método de fácil interpretación de los resultados. En este trabajo se comparan a nivel predictivo la regresión lineal con CART mediante simulación. En general, se encontró que cuando se ajusta el modelo de regresión lineal correcto a los datos, el error de predicción de regresión lineal siempre es menor que el de CART. También se encontró que cuando se ajusta erróneamente un modelo de regresión lineal a los datos, el error de predicción de CART es menor que el de regresión lineal sólo cuando se tiene una cantidad de datos suficientemente grande Abstract Linear regression is the statistical method most used to predict values of continuous variables because of its easy interpretation, but in many situations to apply the model assumptions are not met and some users tend to force leading to erroneous conclusions. CART regression trees are an alternative regression requires no assumptions about the data to be analyzed and a method of easy interpretation of the results. In this paper we compare the predictive level from both CART and linear regression through simulation. In general, it was found that when adjusting the correct linear regression model to the data, the linear regression prediction error is always less than the CART prediction error. We also found that when adjusted erroneously linear regression model to the data, CART prediction error is smaller than the linear regression prediction error only when it has a sufficiently large amount of data