masterThesis
Clasificaci?n autom?tica de Heliconias a partir de im?genes RGB
Maestr?a en Ingenier?a de Control
Autor
Gonz?lez Santos, Christian Sa?l
Institución
Resumen
Colombia es el pa?s con el mayor n?mero de especies vegetales en el mundo. Dentro de
ellas, las heliconias desempe?an un importante papel ecol?gico dentro de los ecosistemas,
pues son componentes frecuentes del interior y l?mites de los bosques, as? como de
ambientes abiertos como potreros, bordes de carretera y orillas de r?os. En algunos
ecosistemas act?an como pioneras en el proceso de regeneraci?n natural de la vegetaci?n
y restauraci?n del suelo degradado. Adem?s, mantienen importantes relaciones
coevolutivas con otras especies animales y vegetales, constituy?ndose en un elemento
importante dentro del complejo armaz?n de la vida en el tr?pico.
La clasificaci?n de especies de plantas es crucial para la protecci?n y conservaci?n de la
biodiversidad. La clasificaci?n manual requiere mucho tiempo, es costosa y se necesitan
expertos que a menudo tienen disponibilidad limitada. Para hacer frente a estos problemas,
en este trabajo se utilizaron tres m?todos de clasificaci?n de im?genes SVM (M?quina de
Vector de Soporte), ANN (Redes neuronales), KNN (Vecinos m?s pr?ximos) con distancia
euclidiana y de intersecci?n, las cuales entregaron buenos resultados en la clasificaci?n de
cuatro especies de heliconias encontradas en la Universidad de Ibagu?.
Los datos empleados para el entrenamiento, prueba y validaci?n de los m?todos fueron
im?genes RGB tomadas en el h?bitat natural de las heliconias, con el fin de tener
informaci?n desde su germinaci?n hasta su momento ?ptimo de corte. Las im?genes fueron
preprocesadas, haciendo un ajuste de balance de blancos, contraste y temperatura del
color. Para separar las heliconias del fondo se utiliz? una t?cnica de segmentaci?n por
grafos mediante SPG. Los descriptores se obtuvieron empleando la t?cnica conocida como
BoW (Bag of Words), encontrando que el n?mero de palabras visuales m?s adecuadas para
la clasificaci?n estaba entre 20 a 40. El m?todo con el que se obtuvieron los mejores
resultados fue el KNN; empleando los tres vecinos m?s cercanos, con una precisi?n del 97%. Colombia is the country with the largest number of plant species in the world. Within it, the
heliconias play an important ecological role within the ecosystems, since they are frequent
components of the interior and limits of the forests, as well as of open environments such
as pastures, roadsides and riverbanks. In some ecosystems they act as pioneers in the
process of natural regeneration of vegetation and restoration of degraded soil. In addition,
they maintain important co-evolutionary relationships with other animal and plant species,
becoming an important element within the complex framework of life in the tropics.
The classification of plant species is crucial for the protection and conservation of
biodiversity. Manual classification is time-consuming, costly and requires experts who are
often limited in their availability. To address these problems, three methods of classification
of SVM (Support Vector Machine), ANN (Neural Networks), KNN (Nearest Neighbors)
images with Euclidean distance and intersection were used in this work, which gave good
results in the classification of four species of heliconias found at the University of Ibagu?.
The data used for training, testing and validation of the methods were RGB images taken in
the natural habitat of the heliconias, in order to have information from their germination
to their optimal cutting time. The images were pre-processed, making an adjustment of
white balance, contrast and color temperature. To separate the heliconias from the
background, a graphical segmentation technique using GPS was used. The descriptors were
obtained using the technique known as BoW (Bag of Words), finding that the number of
visual words most suitable for classification was between 20 and 30. The method with which
the best results were obtained was the KNN; using the three closest neighbors, with an
accuracy of 97%