info:eu-repo/semantics/article
Increased computational performance for vector operations on BLAS-1
Cómputo de alto desempeño para operaciones vectoriales en BLAS-1
Autor
Muñoz Gómez, José Antonio
Jiménez Pérez, Abimael
Rodríguez Gómez, Gustavo
Resumen
The functions library, called Basic Linear Algebra Subprograms (BLAS-1), is considered the programming standard in scientific computing. In this work, we focus on the analysis of various code optimization techniques to increase the computational performance of BLAS-1. In particular, we address a combinational approach to explore possible methods of encoding using unroll technique with di erent levels of depth, vector data programming with MMX and SSE for Intel processors. Using the main functions of BLAS-1, it was determined numerically a computational increase, expressed in mega-ops, up to 52% compared to the optimized BLAS-1 ATLAS library La biblioteca de funciones denominada Subprogramas Básicos de Álgebra Lineal (BLAS-1) es considerada el estándar de programación en computación científica. En este trabajo nos enfocamos en el análisis de diversas técnicas de optimización de código para incrementar el desempeño computacional de BLAS-1. En particular abordamos un enfoque combinacional para explorar las posibles formas de codificación empleando la técnica de unroll con diversos niveles de profundidad, programación vectorial de datos con MMX y SSE para procesadores Intel. Empleando las funciones principales de BLAS-1 determinamos numéricamente un incremento computacional, expresado en mega flops, de hasta 52% en comparación con la biblioteca optimizada BLAS-1 de ATLAS.