Objeto de conferencia
Análisis de datos simbólicos para data science
Registro en:
isbn:978-987-24611-3-3
isbn:978-987-24611-4-0
Autor
Mallea, Adriana
Carrizo, Jorgelina
Ganga, Leonel
Martínez, Cecilia Fernanda
Salas, Andrea
Institución
Resumen
La ciencia de datos, considerada como una ciencia en sí misma, es en términos generales, la extracción de conocimiento de los datos. Data Mining es una poderosa tecnología con gran potencial para extraer tal conocimiento. Sin embargo, desde el punto de vista estadístico, sus herramientas sólo han sido desarrolladas para trabajar con matrices de datos clásicas, es decir, donde cada unidad es individual y las variables toman un único valor para cada individuo. El análisis de datos simbólicos (SDA, por sus siglas en inglés) brinda una nueva forma de pensar en Data Science al extender la entrada estándar a un conjunto de clases de entidades individuales. Por lo tanto, las clases de una población dada se consideran unidades de una población de nivel superior a estudiar. Tales clases a menudo representan las unidades reales de interés. Para tener en cuenta la variabilidad entre los miembros de cada clase, las clases se describen por intervalos, distribuciones, conjunto de categorías o números que a veces se ponderan. De esa manera, obtenemos nuevos tipos de datos, llamados "simbólicos", ya que no se pueden reducir a números sin perder información sobre la variabilidad interna. SDA es un nuevo paradigma que abre un vasto dominio de investigación y aplicaciones al proporcionar resultados complementarios a los métodos clásicos aplicados a los datos estándar. A lo largo de las últimas tres décadas se han extendido distintos métodos del análisis clásico de datos al simbólico, la mayoría de ellos descriptivos. Esto fundamenta la necesidad de continuar investigando sobre la modelización e inferencia en el contexto de datos de naturaleza simbólica. El presente proyecto pretende responder a esta necesidad. Las metodologías se aplicarán a problemas reales o simulados. Eje: Bases de Datos y Minería de Datos. Red de Universidades con Carreras en Informática