dc.contributorSAUL EDUARDO POMARES HERNANDEZ
dc.creatorALBERTO CALIXTO SIMON
dc.date2013-12
dc.date.accessioned2023-07-25T16:21:09Z
dc.date.available2023-07-25T16:21:09Z
dc.identifierhttp://inaoe.repositorioinstitucional.mx/jspui/handle/1009/223
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/7805444
dc.descriptionLa necesidad de resolver problemas complejos eficientemente nos ha forzado a combinar diversos ambientes de cómputo (sistemas heterogéneos), sin embargo esta solución adoptada por muchos sistemas acarrea otros problemas tal como el problema de tolerancia a fallas. Checkpointing es una técnica eficiente para la tolerancia a fallas en sistemas distribuidos y paralelos, esta es utilizada además para solucionar un amplio rango de problemas en sistemas distribuidos y paralelos, tales como: la depuración de software, balance de carga, migración de procesos, entre otros. Dentro de los algoritmos de checkpointing, los algoritmos de checkpointing de comunicación inducida (CIC) se caracterizan por su bajo overhead, generación de checkpoints asíncronos y eliminación del efecto dominío. Para lograr esto, los algoritmos CIC acarrean información en los mensajes de las aplicaciones y generan checkpoints forzados cuando detectan patrones potencialmente peligrosos (e.g. z-paths). Las principales desventajas de los algoritmos CIC son el overhead por mensaje y el overhead de almacenamiento inducido (cantidad de checkpoints forzados). En está investigación exponemos un nuevo algoritmo de comunicación inducida de checkpointing HSDC (Heterogeneous Scable Delay Checkpointing) para sistemas heterogéneos con modelos de ejecución síncrono y asíncrono. A diferencia de los trabajos existentes, nuestro trabajo soporta de manera simultánea ambos tipos de ejecuciones, tiene un bajo overhead de mensajes, no inhibe la ejecución, es escalable, permite que cada proceso genere checkpoints asíncronamente y elimina el efecto dominío. El algoritmo HSDC utiliza un orden parcial de conjunto de eventos para establecer una representación compacta y coherente de la ejecución causal del sistema heterogéneo, la cual permite disminuir considerablemente el overhead haciendolo escalable. El algoritmo HSDC también reduce el número de checkpoints forzados detectando ciertas condiciones que nosotros llamamos Condiciones Seguras para el Retraso de Checkpoint (CSRC).
dc.formatapplication/pdf
dc.languagespa
dc.publisherInstituto Nacional de Astrofísica, Óptica y Electrónica
dc.relationcitation:Calixto-Simon A.
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightshttp://creativecommons.org/licenses/by-nc-nd/4.0
dc.subjectinfo:eu-repo/classification/Puntos de chequeo/Checkpointing
dc.subjectinfo:eu-repo/classification/Cálculo tolerante a fallos/Fault tolerant computing
dc.subjectinfo:eu-repo/classification/Sistemas heterogéneos/Heterogeneous systems
dc.subjectinfo:eu-repo/classification/Procesamiento distribuido/Distributed processing
dc.subjectinfo:eu-repo/classification/Procesamiento en paralelo/Parallel processing
dc.subjectinfo:eu-repo/classification/cti/1
dc.subjectinfo:eu-repo/classification/cti/12
dc.subjectinfo:eu-repo/classification/cti/1203
dc.subjectinfo:eu-repo/classification/cti/1203
dc.titleAlgoritmo de checkpointing de comunicación-inducida para sistemas heterogéneos
dc.typeinfo:eu-repo/semantics/doctoralThesis
dc.typeinfo:eu-repo/semantics/acceptedVersion
dc.audiencestudents
dc.audienceresearchers
dc.audiencegeneralPublic


Este ítem pertenece a la siguiente institución