Objeto de conferencia
Extensión de CluSim: Simulación de la arquitectura tolerante a fallos RADIC
Autor
Lasserre, Cecilia María
Pérez Otero, Nilda
Verazay, Abigaíl R. N.
Institución
Resumen
Los sistemas de Cómputo de Altas Prestaciones se utilizan para desarrollar software en una gran cantidad de campos. Es evidente el creciente predominio e impacto de las aplicaciones del Cómputo de Altas Prestaciones (High Performance Computing - HPC) en la sociedad moderna. Sin embargo, la presencia de fallos en el hardware o software de computadores paralelos hace necesario el uso de mecanismos tolerantes a fallos para asegurar que las aplicaciones finalicen exitosamente. Para ello se ha desarrollado RADIC, una arquitectura transparente, descentralizada, flexible y escalable para tolerancia a fallos que provee alta disponibilidad en sistemas de paso de mensajes. La falta de disponibilidad física de grandes clusters y el hecho de estar ligado a una implementación específica de MPI como base, son las principales dificultades con las que se encontraron los desarrolladores de RADIC. Como una solución a estos problemas el presente proyecto de investigación propone el desarrollo de un entorno de simulación para RADIC basado en OMNeT++, a partir de CLUSIM (Simulador de clusters basado en OMNet++). Eje: Procesamiento distribuido y paralelo Red de Universidades con Carreras en Informática (RedUNCI)