Loop parallelization in the cloud using OpenMP and MapReduce
Paralelização de laços na nuvem usando OpenMP e MapReduce
dc.creator | Wottrich, Rodolfo Guilherme, 1990- | |
dc.date | 2014 | |
dc.date | 2014-09-04T00:00:00Z | |
dc.date | 2017-04-02T01:48:00Z | |
dc.date | 2017-06-09T15:08:25Z | |
dc.date | 2017-04-02T01:48:00Z | |
dc.date | 2017-06-09T15:08:25Z | |
dc.date.accessioned | 2018-03-29T02:20:43Z | |
dc.date.available | 2018-03-29T02:20:43Z | |
dc.identifier | WOTTRICH, Rodolfo Guilherme. Loop parallelization in the cloud using OpenMP and MapReduce. 2014. 64 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: <http://www.bibliotecadigital.unicamp.br/document/?code=000926582>. Acesso em: 1 abr. 2017. | |
dc.identifier | http://repositorio.unicamp.br/jspui/handle/REPOSIP/275500 | |
dc.identifier.uri | http://repositorioslatinoamericanos.uchile.cl/handle/2250/1314504 | |
dc.description | Orientadores: Guido Costa Souza de Araújo, Rodolfo Jardim de Azevedo | |
dc.description | Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação | |
dc.description | Resumo: A busca por paralelismo sempre foi um importante objetivo no projeto de sistemas computacionais, conduzida principalmente pelo constante interesse na redução de tempos de execução de aplicações. Programação paralela é uma área de pesquisa ativa, na qual o interesse tem crescido devido à emergência de arquiteturas multicore. Por outro lado, aproveitar as grandes capacidades de computação e armazenamento da nuvem e suas características desejáveis de flexibilidade e escalabilidade oferece várias oportunidades interessantes para abordar problemas de pesquisa relevantes em computação científica. Infelizmente, em muitos casos a implementação de aplicações na nuvem demanda conhecimento específico de interfaces de programação paralela e APIs, o que pode se tornar um fardo na programação de aplicações complexas. Para superar tais limitações, neste trabalho propomos OpenMR, um modelo de execução baseado na sintaxe e nos princípios da API OpenMP que facilita a tarefa de programar sistemas distribuídos (isto é, clusters locais ou a nuvem remota). Especificamente, este trabalho aborda o problema de executar a paralelização de laços, usando OpenMR, em um ambiente distribuído, através do mapeamento de iterações do laço para nós MapReduce. Assim, a interface de programação para a nuvem se torna a própria linguagem, livrando o desenvolvedor da tarefa de se preocupar com detalhes da distribuição de cargas de trabalho e dados. Para avaliar a validade da proposta, modificamos benchmarks da suite SPEC OMP2012 para se encaixarem no modelo proposto, desenvolvemos outros toy benchmarks que são I/O-bound e executamo-os em duas configurações: (a) um cluster de computadores disponível localmente através de uma LAN padrão; e (b) clusters disponíveis remotamente através dos serviços Amazon AWS. Comparamos os resultados com a execução utilizando OpenMP em uma arquitetura SMP e mostramos que a técnica de paralelização proposta é factível e demonstra boa escalabilidade | |
dc.description | Abstract: The pursuit of parallelism has always been an important goal in the design of computer systems, driven mainly by the constant interest in reducing program execution time. Parallel programming is an active research area, which has grown in interest due to the emergence of multicore architectures. On the other hand, harnessing the large computing and storage capabilities of the cloud and its desirable flexibility and scaling features offers a number of interesting opportunities to address some relevant research problems in scientific computing. Unfortunately, in many cases the implementation of applications on the cloud demands specific knowledge of parallel programming interfaces and APIs, which may become a burden when programming complex applications. To overcome such limitations, in this work we propose OpenMR, an execution model based on the syntax and principles of the OpenMP API which eases the task of programming distributed systems (i.e. local clusters or remote cloud). Specifically, this work addresses the problem of performing loop parallelization, using OpenMR, in a distributed environment, through the mapping of loop iterations to MapReduce nodes. By doing so, the cloud programming interface becomes the programming language itself, freeing the developer from the task of worrying about the details of distributing workload and data. To assess the validity of the proposal, we modified benchmarks from the SPEC OMP2012 suite to fit the proposed model, developed other I/O-bound toy benchmarks and executed them in two settings: (a) a computer cluster locally available through a standard LAN; and (b) clusters remotely available through the Amazon AWS services. We compare the results to the execution using OpenMP in an SMP architecture and show that the proposed parallelization technique is feasible and demonstrates good scalability | |
dc.description | Mestrado | |
dc.description | Ciência da Computação | |
dc.description | Mestre em Ciência da Computação | |
dc.format | 64 p. : il. | |
dc.format | application/octet-stream | |
dc.language | Inglês | |
dc.publisher | [s.n.] | |
dc.subject | Programação paralela (Computação) | |
dc.subject | Computação em nuvem | |
dc.subject | OpenMP (Programação paralela) | |
dc.subject | MapReduce (Programação paralela distribuída) | |
dc.subject | Parallel programming (Computer science) | |
dc.subject | Cloud computing | |
dc.subject | OpenMP (Parallel programming) | |
dc.subject | MapReduce (Distributed parallel programming) | |
dc.title | Loop parallelization in the cloud using OpenMP and MapReduce | |
dc.title | Paralelização de laços na nuvem usando OpenMP e MapReduce | |
dc.type | Tesis |