Artículo de revista
Propuesta supervisada de aprendizaje de máquina para la estimación de la edad biológica humana basada en odontología forense
Fecha
2020-06-21Registro en:
1794-1237
10.24050/reia.v17i34.1392
2463-0950
Autor
Becerra Alvarez, Johana Gabriela
Cortés Osorio, Jimy Alexander
Institución
Resumen
Código de Procedimiento Penal Colombiano avala el uso apropiado de las piezas dentales para la identificación de individuos, por lo que esta técnica resulta una herramienta de gran importancia en las instituciones que apoyan la administración de justicia. Los métodos clásicos de identificación humana, en especial, los usados para la determinación de la edad biológica de muerte en adultos, han sido desarrollados usando información de poblaciones con características morfológicas, métricas y culturales diferentes a las de Colombia. En consecuencia, se han obtenido tasas de error altas en sus resultados. En esta investigación, se calculó inicialmente la edad biológica usando el método clásico de Lamendin. Posteriormente, con las medidas directas e indirectas, también usadas en el método de Lamendin, se realizó el entrenamiento de las técnicas de aprendizaje de máquina conociendo la edad cronológica de los individuos de la muestra. Se compararon los resultados de las técnicas de regresión de aprendizaje de máquina supervisado: Máquinas de Soporte Vectorial (SVM), Procesos Gaussianos por Regresión (GPR) y Conjuntos de Árboles (Ensembles of Trees), entre otras. Se estudió una muestra de 48 piezas dentales de una sola raíz pertenecientes a 45 individuos de nacionalidad colombiana, con edades cronológicas de fallecimiento conocidas dentro del rango de edades desde los 19 años hasta los 81 años. Por otro lado, se utilizaron el pie de rey digital y el macroscopio de comparación para estimar las alturas de las características morfológicas en las piezas dentales. La mejor exactitud en la estimación de la edad biológica se alcanzó con GPR que presentó una raíz del error medio cuadrático (RMSE) de 3,37 años en la identificación, la cual se contrastó con la exactitud alcanzada por el método de Lamendin con un RMSE de 15,52 años. Esta investigación evidencia que el aprendizaje de máquina con regresión GPR, en especial para el caso colombiano, resulta una herramienta válida para la estimación de la edad biológica de muerte con errores muy inferiores a los entregados por técnicas tradicionales de origen europeo. Colombian Criminal Procedure Code supports the appropriate use of dental pieces for the identification of individuals, so this technique is a tool of great importance for the administration of justice institutions. The classic methods of human identification, especially those used to estimate the biological age of death in adults such as Lamendin, have been developed using information from populations with morphological, metric and cultural characteristics different from those in Colombia. Consequently, Colombian forensic specialists have obtained high error rates in age estimation results. In this research, the biological age was initially calculated using the classic method of Lamendin. Subsequently, with the direct and indirect measures, also used in the Lamendin method, the training of machine learning techniques was carried out knowing the chronological age of the individuals in the sample. The results of the supervised machine learning regression techniques were compared: Vector Support Machines (SVM), Gaussian Regression Processes (GPR) and Ensembles of Trees (EoT), among others. A sample of 48 single-root dental pieces belonging to 45 individuals of Colombian nationality was studied, with chronological ages of death known within the age range from 19 to 81 years.
Additionally, the digital caliper gauge and the comparison microscope were used to measure the heights of the morphological characteristics in the dental pieces. The best accuracy in the estimation of the biological age was achieved with the GPR regression that showed a root mean square error (RMSE) of 3.37 years in the identification, which was compared with the accuracy reached by the Lamendin method with a RMSE of 15.52 years. This research shows that the GPR machine learning regression, especially for the Colombian case, is a valid tool for estimating the biological age of death with much lower errors than those achieved by traditional European techniques.