info:eu-repo/semantics/article
Vehicle classification and counting through image analysis.
Clasificación y conteo vehícular mediante análisis de imágenes.
Registro en:
10.56048/MQR20225.6.4.2022.313-334
Autor
Segarra López, Juan Fernando
Cobos Torres, Juan Carlos
Resumen
This work proposes an algorithm capable of analyzing a video sample (recording) or video in real-time of vehicular traffic, the final model is capable of differentiating, classifying, and counting 3 types of vehicles using fundamental concepts of artificial intelligence and computer vision, with open-source libraries; TensorFlow for the artificial intelligence and OpenCV for the computer vision. The methodology used can be fundamentally separated into three steps; data acquisition (creating an own database with models of vehicles that travel in the points of the city used for this project), the development of the network (based on a network model known as AlexNet, a convolutional neural network widely used in projects for image classification with proven and reliable results) and finally the information processing (with a final subroutine, through which the images of moving objects detected in the video are extracted to count later and classify them according to type). The results obtained are above ninety percent effective if contrasted with manual methodologies, these results have been analyzed in different cases separated by time: in the morning, in the afternoon, and at night; where even though the luminosity and the vehicular flow change, it is concluded that the model is robust and can be taken to production in the private or public industry. Este trabajo propone un algoritmo capaz de analizar una muestra de video (grabación) o video en tiempo real del tránsito vehicular, el modelo final es capaz de diferenciar, clasificar y contar 3 tipos de vehículos utilizando conceptos fundamentales de inteligencia artificial y visión por computadora, con bibliotecas de código abierto; TensorFlow para la inteligencia artificial y OpenCV para la visión artificial. La metodología utilizada puede dividirse fundamentalmente en tres pasos; adquisición de datos (creando una base de datos propia con modelos de vehículos que transitan en los puntos de la ciudad utilizados para este proyecto), el desarrollo de la red (basado en un modelo de red conocido como AlexNet, una red neuronal convolucional muy utilizada en proyectos de imagen clasificación con resultados probados y confiables) y finalmente el procesamiento de la información (con una subrutina final, a través de la cual se extraen las imágenes de objetos en movimiento detectados en el video para luego contarlos y clasificarlos según su tipo). Los resultados obtenidos superan el noventa por ciento de efectividad si se contrastan con metodologías manuales, estos resultados han sido analizados en diferentes casos separados por horarios: por la mañana, por la tarde y por la noche; donde a pesar de que cambia la luminosidad y el flujo vehicular, se concluye que el modelo es robusto y puede ser llevado a producción en la industria privada o pública.