Trabajo de grado - Pregrado
Sistema de recomendación basado en variables edáficas para el cultivo de plátano en el departamento de Risaralda
Registro en:
Universidad Tecnológica de Pereira
Repositorio institucional Universidad Tecnológica de Pereira
Autor
Posada Muñoz , Karen
Institución
Resumen
El cultivo de plátano es uno de los pilares de la agricultura Colombiana, graciasa sus bajos costes y su alto valor nutrimental, por ello se ubica como un alimento básico dentro de la canasta familiar del país. Sin embargo, el cultivo de plátano se enfrenta a una serie de retos dentro de su cadena de producción, siendo la falta de integración del campo con las tecnologías y su ineficacia a la hora de escoger un suelo adecuado, algunos de los problemas mayoritarios a los cuales se enfrenta la agricultura, muestra de ello son los bajos rendimientos históricos que se han presentado (Ministerio de agricultura y desarrollo rural, 2020; Sylvio Belalcázar Carvajal, 2012). No obstante, estas problemáticas no son exclusivas del territorio Colombiano, casos similares se han presentado con diversos cultivos en diferentesterritorios, siendo la tecnología una de las principales herramientas a la hora de mejorar el ejercicio agrícola en sus diferentes procesos. Por lo tanto, se propone el desarrollo de un sistema de recomendación basado en el contenido, el cual usa técnicas de Machine Learning con el fin de recomendar los suelos más adecuados para el cultivo de plátano en Risaralda de acuerdo a sus características edáficas Plantain cultivation is one of the pillars of Colombian agriculture, due to its low costs and its high nutritional value, making it a staple food in the country's family food basket. However, plantain cultivation faces a series of challenges within its production chain, being the lack of integration of the agriculture with technologies and its inefficiency when choosing a suitable soil, some of the main problems that Plantain crop faces, shows of this are the low historical yields that have been presented (Ministry of agriculture and rural development, 2020; Sylvio Belalcázar Carvajal, 2012). However, these problems are not exclusive to the Colombian territory; similar cases have occurred with various crops in different territories, with technology being one of the main tools when it comes to improving the agricultural exercise in its different processes. Therefore, the development of a content-based recommendation system is proposed, which uses Machine Learning techniques in order to recommend the most suitable soils for plantain cultivation in Risaralda according to its edaphic characteristics. Pregrado Ingeniero(a) de Sistemas y Computación Índice general
Resumen III
Lista de Figuras IV
Lista de Tablas V
1 Introducción 1
2 Planteamiento del Problema 3
3 Justificación del Problema 5
4 Objetivos 7
4.1. Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
4.2. Objetivos específicos . . . . . . . . . . . . . . . . . . . . . . . . . . 7
5 Marco de Antecedentes 8
6 Marco Teórico 13
6.1. Sistemas de Recomendación . . . . . . . . . . . . . . . . . . . . . . 13
6.1.1. Calificaciones Explícitas e Implícitas . . . . . . . . . . . . . 16
6.2. Tipos de Sistemas de Recomendación . . . . . . . . . . . . . . . . . 18
6.2.1. Filtrado Colaborativo . . . . . . . . . . . . . . . . . . . . . 19
6.2.2. Filtrado Basado en el Contenido . . . . . . . . . . . . . . . . 23
6.2.3. Filtrado Híbrido . . . . . . . . . . . . . . . . . . . . . . . . . 28
7 Marco conceptual 30
7.1. Clima . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
7.2. Suelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
i
7.2.1. Factores físicos . . . . . . . . . . . . . . . . . . . . . . . . . 31
7.2.2. Factores químicos . . . . . . . . . . . . . . . . . . . . . . . . 31
8 Metodología 33
8.1. Obtención de la información . . . . . . . . . . . . . . . . . . . . . . 33
8.2. Preprocesamiento de Datos . . . . . . . . . . . . . . . . . . . . . . . 33
8.3. Construcción del Modelo para el Agrupamiento de Cultivos(Items) . 34
8.3.1. Sintonización del Modelo de Agrupamiento . . . . . . . . . . 34
8.3.2. Tipos de Algoritmo de Agrupamiento . . . . . . . . . . . . . 34
8.3.3. Métricas de Evaluación del Modelo de Agrupamiento . . . . 34
8.4. Construcción del Modelo para el Sistema de Recomendación . . . . 35
8.4.1. Calculo de Similitudes . . . . . . . . . . . . . . . . . . . . . 35
8.4.2. Generación de Top-k Cultivos Recomendados . . . . . . . . 35
8.4.3. Métricas de Evaluación del Sistema de Recomendación . . . 36
8.5. Arquitectura del Sistema de Recomendación (Instanciación tecnológica) 36
9 Cronograma 37
10 Desarrollo del proyecto 38
10.1. Cultivo de plátano en el departamento de Risaralda . . . . . . . . . 38
10.2. Tecnologías para la implementación del sistema de recomendación . 38
10.3. Características relevantes del cultivo de plátano . . . . . . . . . . . 39
10.4. Conjunto de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
10.5. pre-procesamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
10.6. Modelos de clasificación y regresión . . . . . . . . . . . . . . . . . . 41
10.6.1. Sintonización de hiperparametros . . . . . . . . . . . . . . . 41
10.6.2. Calculo de similitudes . . . . . . . . . . . . . . . . . . . . . 41
10.7. Arquitectura del sistema de recomendación . . . . . . . . . . . . . . 42
10.8. Evaluando el sistema de recomendación . . . . . . . . . . . . . . . . 42
11 Conclusiones 47
Bibliografía 48