masterThesis
Previsão de séries temporais usando sistemas de múltiplos preditores
Autor
SILVA, Eraylson Galdino da
Institución
Resumen
Sistema de Múltiplos Preditores (SMP) consiste no desenvolvimento de um conjunto de modelos para prever a mesma variável. Na literatura é possível encontrar trabalhos que mostram que a sua utilização em previsão de séries temporais pode melhorar a acurácia. Para tal, é construído um conjunto com diferentes preditores e a previsão final é obtida através da seleção ou combinação. A seleção de preditores consiste em encontrar um preditor dentro do conjunto que possa retornar a melhor previsão, podendo reduzir o custo computacional e aumentar a acurácia do sistema de previsão. Além da abordagem para retornar a previsão final é necessário que exista diversidade entre os preditores, a qual, consiste em desenvolver um conjunto de preditores que apresentem previsões diferentes para a mesma variável. Uma das técnicas para criar modelos diversos é particionar a série em diferentes amostras e treinar um modelo para cada amostra, possibilitando o desenvolvimento de preditores especialistas em padrões diferentes da série. Sabendo que a utilização de SMP pode aumentar a acurácia de sistemas de previsão de séries temporais, ainda existe a necessidade de pesquisas que apresentem em que circunstâncias a combinação é melhor que a seleção de preditores, além disso, quais as melhores formas de combinação e qual a influência de treinar os preditores através de partições diferentes da série. Para tal, esta dissertação realiza uma comparação entre diferentes abordagens de combinação: Média Simples, Mediana, Regressão Linear, Redes Neurais e Maquina de Vetor de Suporte; e uma abordagem de seleção de preditores que utiliza medida de distância entre os padrões para selecionar o melhor modelo, com o intuito de responder esses questionamentos. Para avaliar o desempenho das diferentes abordagens, foram utilizadas quatro séries: Mackey Glass, Laser, Microsoft e Goldman Sachs. Em cada série os desempenhos das arquiteturas foram avaliados através de um conjunto de métricas. Com base nos resultados obtidos, é possível inferir que em média os desempenhos apresentados pelas melhores abordagens de combinação: Redes Neurais, Regressão Linear e Média Simples, são melhores que a abordagem de seleção utilizada. Além disso, a relação entre a acurácia e a diversidade dos modelos pode variar de acordo com a abordagem de combinação utilizada. CNPq Multiple Predictor Systems (MPS) consists in development a group of models for forecast same variable. According to some works in the literature, MPS can improve in time series forecast. For that, building a group with several models for same forecasting variable and the final forecast is to get through a combination or selection model.The selection of forecasts consists in finding the better model inside of a group that can improve efficiency and performance. The motivation for selection decreases the cost and to use a specific model for each pattern of the time series. Beyond the approach to get the final forecast of Ensemble, it is necessary that exist diversity among models forecasting. For that, one approach is to split the time series in different samples and train a model for each sample, thus making it possible to build off experts’ models. In the knowledge that time series forecast can be better through MPS, it still exists the necessity for new research to find answers to some questions. For instance, in which circumstances are combination approaches better than selection? Which are the better approaches to combining? How important is it to train the models through different partitions of the series? For that, in present theses are developed with diverse approaches of combination: Mean Simple, Median, Linear Regression, Neural Networks and Support Vector Machine, and an approach to forecasting selection that use a distance measure between patterns for select the model. To verify the feasibility between different approaches, four series are used: Mackey-Glass, Laser, Microsoft, and Goldman Sachs. For each time series, the performances of the architectures were evaluated through several metrics. Based on the results obtained, it is possible to infer that on average, the performances presented by better combination approaches: Neural Network, Linear Regression, and Simple Mean are better than selection approach. Moreover, the relationship between accuracy and diversity for combination approach vary according to approach used.