Tesis
Modelización Estadística y Clasificación de las Fincas en la Producción de Leche Fresca en Puerto Rico
Autor
Sánchez Alemán, Raúl Omar
Pericchi Guerra, Luis R. (Consejero)
Institución
Resumen
La industria lechera en Puerto Rico es la industria agropecuaria más importante del
país. Entender mejor el comportamiento de la industria ayuda a facilitar el desarrollo
continuo, eficiente y ordenado en las operaciones. Contar con un modelo adecuado
permitiría proyectar mejor la producción y comenzar a reducir la variabilidad en la calidad. Se modelizó la producción total de leche fresca entre los años de 2009 al
2012 utilizando tanto el lenguaje estadístico R como Bayesian Analysis of Time Series
(BATS) y se obtuvo que el mejor modelo de entre los estudiados era uno con tendencia
lineal y tres harmónicos que obtuvo el MSE, MAE y Theil's U. Para clasificar las fincas
se utilizó el método de análisis de conglomerados muy usado en los procesos de Data
Mining. Para esto utilizamos el algoritmo de k-means clustering. Se escogieron tres
métodos distintos para escoger el valor óptimo de k; BIC, Gap Statistic y Predicition
Strength, donde el último brindó k óptimo en k = 5. Ya clasificadas se escogió una
finca al azar de cada cluster y se obtuvo que el mejor modelo para cualquier cluster
es el de tendencia lineal y tres harmónicos.