info:eu-repo/semantics/article
The BPS preconditioner on Beowulf cluster
The BPS preconditioner on Beowulf cluster
Registro en:
10.15517/rmta.v16i1.1424
Autor
Salas-Huertas, Oscar
Marazzina, Daniele
Rovida, Sergio
Sacchi, Giovanni
Scacchi, Simone
Institución
Resumen
This work presents the implementation on a Linux Cluster of a parallel preconditioner for the solution of the linear system resulting from the finite element discretization of a 2D second order elliptic boundary value problem. The numerical method, proposed by Bramble, Pasciak and Schatz, is developed using Domain Decomposition techniques, which are based on the splitting of the computational domain into subregionsof smaller size, enforcing suitable compatibility conditions. The Fortran code is implemented using PETSc: a suite of data structures and routines devoted to the scientific parallel computing and based on the MPI standard for all message-passing communications. The main interest of the paper is to present an efficient and portable code for the solution of large-scale linear systems and to investigate how the architecturalaspects of the cluster influence the performance of the considered algorithm. We provide an analysis of the execution times as well as of the scalability, using as test case the classical Poisson equation with Dirichlet boundary conditions. En este trabajo se presenta una implementación para Cluster Linux de un pre-condicionador útil para resolver en forma eficiente sistemas lineales obtenidos de la discretización por medio de elementos finitos de problemas de valor inicial 2D elípticos de segundo orden. El método numérico implementado fue propuesto por Bramble, Pasciak and Schatz, y en él se utiliza la técnica de Descomposición de Dominio, la cual se basa en una división del dominio computacional en subregiones de dimensiones siempre más pequeñas, las cuales cumplen con condiciones apropiadas de compactibilidad. El código fue implementado en Fortran usando la librería PETSC: una colección de estructuras y funciones, desarrolladas para el Cálculo Científico en Paralelo y basada en el estándar MPI para administrar la comunicación y el cambio de mensajes. Nuestro objetivo en este trabajo es demostrar la eficiencia y portabilidad del código cuando se emplea en la solución de grandes sistemas y además analizar cuál es la influencia que tiene la arquitectura del cluster en las prestaciones del algoritmo considerado. Nosotros presentamos una análisis de los tiempos de ejecución obtenidos así como de la escalabilidad, usando como problema test la ecuación clásica de Poisson con condiciones de Dirichlet en la frontera.