Trabalho de Conclusão de Curso
Aprendizado profundo: redes LSTM
Registro en:
PEREIRA, Matheus de Mattos. Aprendizado profundo: redes LSTM. 2017. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) – Faculdade de Ciências Exatas e Tecnologias, Universidade Federal da Grande Dourados, Dourados, MS, 2017.
Autor
Pereira, Matheus de Mattos
Institución
Resumen
Over the last decade, there has been a very rapid advance in neural networks research. Due to the success of new techniques, big results in competitions in several fields, and its increasing use in industry, this field gained its own name, which has become a buzzword over the past years: deep learning. This work seeks to offer a brief introduction on deep learning, exploring its techniques and explaining what constitutes a deep neural network. After this brief introduction, it will be discussed in more detail one of the techniques responsible for the recent success of deep learning, the Long Short Term Memory (LSTM) networks, and how this technique can be applied to time series prediction. From the results obtained training a LSTM network for time series prediction using four datasets, the LSTM network performed better in three of these sets compared to other methods, which shows their effectiveness against other already consolidated techniques for this kind of problem, such as artificial neural networks and ARIMA. Desde a última década vem ocorrendo um avanço muito rápido na pesquisa de redes neurais. Devido ao sucesso de novas técnicas, grandes resultados em competições de diversas áreas, e seu crescente uso na indústria, essa área ganhou um nome próprio, que vêm se popularizando cada vez mais nos últimos anos: aprendizado profundo (deep learning). Este trabalho busca oferecer uma breve introdução ao aprendizado profundo, explorando suas técnicas e explicando o que de fato torna uma rede neural profunda. Após essa breve introdução, será discutido mais detalhadamente uma das técnicas responsáveis pelo grande sucesso do aprendizado profundo recentemente, as redes Long Short Term Memory (LSTM), e como essa técnica pode ser aplicada para a predição de séries temporais. A partir dos resultados obtidos de uma rede LSTM treinada para a predição de séries temporais em quatro conjuntos de dados, a rede LSTM se saiu melhor em três desses conjuntos testados em comparação com outros métodos, o que mostra sua eficácia contra outras técnicas já consolidadas para esse tipo de problemas, como redes neurais artificiais e ARIMA.