Design of a real estate price prediction model in the city of Barranquilla: a combined approach of regression and clustering techniques

dc.contributorPeñaBaena Niebles, Rita Patricia
dc.creatorSalguedo Carrillo, Diana Carolina
dc.creatorAponte Pereira, Angie
dc.creatorGarcía Varela, Humberto de Jesus
dc.date2023-05-31T21:36:05Z
dc.date2023-05-31T21:36:05Z
dc.date2023-05-30
dc.date.accessioned2023-08-25T15:53:26Z
dc.date.available2023-08-25T15:53:26Z
dc.identifierhttp://hdl.handle.net/10584/11536
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/8430224
dc.descriptionEl mercado de bienes raíces tiene una gran relevancia en la economía del país. Sin embargo, este sector se ve afectado por el constante desarrollo del mercado, su sensibilidad a las tendencias y diversos factores económicos, sociales o ambientales, que repercuten en el avalúo de las viviendas. Asimismo, la subjetividad de las partes involucradas al asignar un valor y la falta de rapidez en estos procesos generan desconfianza entre los integrantes del mercado, incertidumbre y, por ende, riesgos de inversión. Por ello, en este proyecto se busca diseñar un modelo de predicción de precios y una interfaz que facilite su replicabilidad, escalabilidad y uso a fin de satisfacer las necesidades de los actores de este sector en la ciudad de Barranquilla. Para esto, se implementó la metodología CRISD-DM, la cual establece un eje de acción para el correcto entendimiento del problema, la eficacia en el análisis y aplicación de los modelos. Además, para el desarrollo del trabajo se evaluaron distintas técnicas de regresión a un conjunto de configuraciones, para identificar la combinación que mejor se ajusta a los datos y genera el modelo más robusto. Dichas configuraciones fueron formadas mediante el ajuste de la variable de respuesta, tomándola como precio del área total o por metro cuadrado, la clasificación de los datos por tipo de vivienda y los clusters obtenidos, de acuerdo a esta clasificación, por medio del método de K-Prototypes. En cuanto a los algoritmos de regresión, se emplearon las técnicas de Redes Neuronales Artificiales, Support Vector Regresion, XGBoost y Random Forest. El modelo final fue elaborado escogiendo la mejor combinación para cada tipo de vivienda, es decir, un modelo ensamblado. Este obtuvo los mejores resultados en cuanto a desempeño, como un RMSE de aproximadamente 130 millones, siendo al menos 10% mejor que el método tradicional que obtuvo 144 millones. Finalmente, este modelo fue desplegado en formato de página web por medio de Flask y Python.
dc.descriptionThe real estate market has a great relevance in the country's economy. However, this sector is affected by the constant development of the market, its sensitivity to trends and various economic, social and environmental factors, among others, which end up having an impact on the appraisal of homes. Likewise, the subjectivity of the parties involved when assigning a price and the lack of speed in these processes generate distrust among market participants, uncertainty and thus investment risks. Therefore, this project aims to design a real estate price prediction model and an interface that facilitates its replicability, scalability and use in order to meet the needs of the stakeholders in this sector in the city of Barranquilla. To achieve this, the CRISD-DM methodology was implemented, which establishes a framework for the correct understanding of the problem, the efficiency in the analysis and application of the models. In addition, for the paper development, different regression techniques were evaluated to a set of different configurations to identify the combination that best fits the data and generates the most robust model. These configurations were formed by adjusting the response variable, taking it as the price per total area or per square meter, classifying the data by type of housing and the clusters obtained according to this classification by means of the K-Prototypes method. As for the regression algorithms, Artificial Neural Networks, Support Vector Regression, XGBoost and Random Forest techniques were used. The final model was elaborated by choosing the best combination for each type of housing, i.e., an ensemble model. It obtained the best results in terms of performance, such as a RMSE with a result of 130 million, being at least 10% better than the traditional method (144 million). Finally, this model was deployed in web page format by means of Flask and Python.
dc.formatapplication/pdf
dc.formatimage/png
dc.formatapplication/pdf
dc.formatimage/png
dc.languagespa
dc.publisherBarranquilla, Universidad del Norte, 2023
dc.rightsUniversidad del Norte
dc.rightsopenAccess
dc.subjectAvaluó de inmuebles
dc.subjectCRISP-DM
dc.subjectAlgoritmos de machine learning
dc.subjectClusterización
dc.subjectCRISP-DM
dc.subjectReal estate appraisal
dc.subjectMachine learning algorithm
dc.subjectClustering
dc.titleDiseño de un modelo de predicción de precios de bienes raíces en la ciudad de Barranquilla: un enfoque combinado de técnicas de regresión y clustering
dc.titleDesign of a real estate price prediction model in the city of Barranquilla: a combined approach of regression and clustering techniques
dc.typearticle


Este ítem pertenece a la siguiente institución