Dissertação
Avaliação do impacto de falhas no tráfego da rede da Universidade Federal de Juiz de Fora
Autor
Duarte, Rodrigo Costa
Institución
Resumen
In this paper we characterize the impact of failures in the RNP´s (Rede Nacional de
Ensino e Pesquisa) network on data traffic at UFJF (Universidade Federal de Juiz de Fora).
In particular, we study the impact of failures on traffic, user, and application behavior.
We classify the failures we study into partial failures and performance problems. Partial
failures are interesting in that they persist for several hours and impact only international
links, so destinations hosted in Brazil remain reachable. On the other hand, performance
problems, caused by the disruption of connectivity between important links in the RNP
backbone, without causing loss of end-to-end connectivity between the university and
destinations in Brazil and abroad. Our results show that, during partial failures, although
failures in international links have negligible impact on the performance of national traffic,
users do adapt their behavior to the unavailability of services hosted abroad. For example,
entertainment traffic migrates from Facebook to YouTube, which remains reachable during
the analyzed failures; and the fraction of interactive traffic gradually decreases during
failures, indicating that users may leave the campus early. We also show that, during
partial failures, asynchronous applications hosted abroad, like Dropbox and SMTP, queue
up tasks during the failure and cause traffic bursts when the failure is restored. We found
that performance failures primarily impact the volume of data transmitted and metrics
such as RTT. We have observed that when performance problems occurs, contrary to
expectations, the performance improves for some destinations, due to changes in the routes
used as primary path for transmissions. Our results can be used to guide improvements in
the infrasctruture of the RNP backbone and assist in better defining parameters of route
configurations to minimize the impact of some kind of failures. Neste trabalho caracterizamos o impacto de falhas na Rede Nacional de Ensino e
Pesquisa (RNP) no tráfego de dados da rede da Universidade Federal de Juiz de Fora.
Nós estudamos o impacto das falhas no comportamento do tráfego, dos usuários e das
aplicações na rede da universidade. As falhas estudadas se dividem em falhas parciais e
problemas de desempenho. As falhas parciais são interessantes pois persistem por várias
horas e afetam apenas enlaces internacionais da RNP, sem impedir acesso a destinos no
Brasil. Por outro lado, as falhas de desempenho são causadas por queda de conectivi-
dade entre links importantes do núcleo de rede da RNP, sem causar no entanto perda de
conectividade fim-a-fim entre a universidade e destinos no Brasil e no exterior. Nossos
resultados mostram que falhas nos enlaces internacionais da RNP tem impacto desprezível
no desempenho de conexões nacionais e que usuários modificam seu comportamento em
função da indisponibilidade de serviços hospedados fora do Brasil. Por exemplo, o tráfego
de entretenimento migra do Facebook para o YouTube, que permanece ativo durante as
falhas; e a fração de tráfego interativo reduz gradativamente durante a falha, indicando
evasão dos usuários da rede. Mostramos também que, durante as falhas parciais, aplica-
ções assíncronas com servidores fora do Brasil, como Dropbox e SMTP, acumulam tarefas
durante a falha e causam rajadas de tráfego quando a falha é restaurada. Durante falhas de desempenho, verificamos que estas impactam principalmente o volume de dados
transmitidos e métricas como o RTT das conexões. Observamos também que em alguns
momentos, ao contrário do esperado, há melhoras de algumas métricas de desempenho
para alguns destinos. Isso ocorre pois alterações nas rotas utilizadas como caminho prin-
cipal pelas transmissões podem melhorar seu desempenho. Nossos resultados podem ser
aplicados na melhoria da infraestrutura de redes do backbone da RNP e na definição de
parâmetros de configuração de rotas para minimizar o impacto de alguns tipos de falhas.