Objeto de conferencia
Algoritmo con cobertura muestral en data mining aplicado al estudio de la biodiversidad
Autor
Santa María, Cristóbal
Soria, Marcelo A.
Institución
Resumen
Enmarcadas en la biología computacional, la aplicación conjunta de técnicas de Data Mining y Simulación a secuencias muestrales de ADN con el objeto de evaluar la riqueza, principal parámetro de biodiversidad, ha producido resultados que mejoran las estimaciones usualmente realizadas por procedimientos solo estadísticos.
A partir del agrupamiento jerárquico de secuencias de la muestra en diferentes “clusters” que representan taxones distintos seleccionados por umbral de disimilaridad, es posible construir un modelo experimental y aplicar sobre él algoritmos de recuento de especies, o más generalmente de taxones (ARE ), que elevan a niveles compatibles con la apreciación biológica la riqueza subestimada por los procedimientos estándar. Se desarrolla aquí en detalle un algoritmo alternativo a dichos procedimientos ARE que incorpora el concepto de cobertura muestral y proporciona así estabilidad a la simulación asociada. Se procesan dos conjuntos muestrales y se obtienen conclusiones sobre el desempeño del algoritmo con cobertura muestral. Eje: Base de datos y minería de datos Red de Universidades con Carreras en Informática (RedUNCI)