dc.contributorNavarro Badino, Gonzalo
dc.contributorFacultad de Ciencias Físicas y Matemáticas
dc.contributorDepartamento de Ciencias de la Computación
dc.contributorBarbay, Jeremy
dc.contributorBustos Cárdenas, Benjamín
dc.contributorArroyuelo Billiardi, Diego Gastón
dc.creatorProvidel Godoy, Eliana Paz
dc.date.accessioned2013-04-01T18:48:50Z
dc.date.available2013-04-01T18:48:50Z
dc.date.created2013-04-01T18:48:50Z
dc.date.issued2012
dc.identifierhttps://repositorio.uchile.cl/handle/2250/112506
dc.description.abstractLas estructuras de datos compactas ofrecen funcionalidad y acceso a los datos usando poco espacio. En una estructura de datos plana se conservan los datos en su forma original y se busca minimizar el espacio extra usado para proveer la funcionalidad, mientras que en una estructura comprimida además se recodifican los datos para comprimirlos. En esta tesis se estudian estructuras de datos compactas para secuencias de bits (bitmaps) que proveen las operaciones rank y select: rankb(B,i) cuenta el número de bits b ∈ {0,1} en B[1..i] y selectb(B,i) retorna la posición de la i-ésima ocurrencia de b en B. En teoría ambas consultas se pueden responder en tiempo constante, pero la implementación práctica de estas soluciones no siempre es directa o con buenos resultados empíricos. Las estructuras de datos con un enfoque más práctico, usualmente no óptimas en teoría, pueden tener mejor desempeño que implementaciones directas de soluciones teóricamente óptimas. Esto es particularmente notorio para la operación select. Además, las implementaciones más eficientes para rank son deficientes para select, y viceversa. En esta tesis se definen nuevas estructuras de datos prácticas para mejorar el desempeño de las operaciones de rank y select, basadas en dos ideas principales. La primera consiste en, a diferencia de las técnicas actuales, que usan estructuras separadas para rank y select, reutilizar cada estructura también para acelerar la otra operación. La segunda idea es simular en tiempo de consulta una tabla de resultados precomputados en vez de almacenarla, lo que permite utilizar tablas universales mucho mayores que las que sería posible almacenar. Los resultados experimentales muestran que la primera idea, aplicada a estructuras planas, utiliza sólo 3% de espacio sobre el bitmap y ofrece tiempos similares a estructuras que usan mucho más espacio, para ambas operaciones. En estructuras de datos comprimidas se pueden combinar ambas ideas, obteniendo un espacio extra de menos de 7 % sobre el bitmap comprimido y manteniendo, para ambas operaciones, tiempos similares o mejores que las estructuras actuales (que usan 27 % de espacio extra).
dc.languagees
dc.publisherUniversidad de Chile
dc.subjectEstructuras de datos (Ciencia de la computación)
dc.subjectCompresión de datos (Ciencia de la computación)
dc.subjectEstructuras compactas
dc.subjectSecuencias binarias
dc.titleSoluciones eficientes para Rank y Select en secuencias binarias
dc.typeTesis


Este ítem pertenece a la siguiente institución