Objeto de conferencia
Simulador de un cluster tolerante a fallos basado en OMNeT++
Registro en:
Autor
Pérez Ibarra, Marcelo
Lasserre, Cecilia María
Liberatori, Héctor
Pérez Otero, Nilda
Valdiviezo, Luis M.
Institución
Resumen
La Computación de Altas Prestaciones mediante clusters de computadoras basados en workstation y redes, posibilitó la construcción y uso de computadoras paralelas. Su principal objetivo es el aumento de prestaciones, utilizando el potencial ofrecido por un gran número de procesadores. La construcción de un cluster tiene tres retos: Alto Rendimiento, Alta Disponibilidad y Alta Productividad. Respecto a la Alta Disponibilidad se debe considerar la probabilidad de fallos o desconexión de nodos por lo que se debe reducir el tiempo medio entre fallos. Para ello es necesario definir la configuración adecuada de tolerancia a fallos para diferentes tipos de aplicaciones, teniendo en cuenta los requerimientos de rendimiento y prestaciones del usuario. Para definir y validar un modelo genérico de aplicación-prestación-tolerancia a fallos es necesario realizar mediciones en un cluster. La realización de estas mediciones, considerando diferentes configuraciones de cluster, tipos de aplicaciones y la tolerancia a fallos, resulta compleja. Por ello, en este proyecto se pretende desarrollar un simulador para la arquitectura tolerante a fallos RADIC. El entorno sobre en cual se desarrollará el simulador será OMNeT++ junto con el framework INET. Eje: Procesamiento distribuido y paralelo Red de Universidades con Carreras en Informática (RedUNCI)