Dissertation
The role of Twitter in the U.S. financial market
Autor
Ramacciotti, Fernando Martinelli
Institución
Resumen
Significant market events in the financial market will only occur if there is synchrony among large groups of people and the media is the main vehicle to it. Previous works could find some relationship between newspapers and financial market indicators. This work revisits, in some sense, the findings of the traditional literature on financial market investors’ behavior and its relationship to the news, but now in the Modern Era context of social media. The main goal of this work is to identify if the overall sentiment of Twitter users has some relationship with the financial market. We created a database that joins non-structured data from tweets and structured time series data related to the S&P500 index, its trading volume and implied volatility (measured by the VIX). The non-structured data was processed in order to categorize each word from each tweet into several semantic categories defined by the Harvard-IV psychological dictionary. Then, two sentiment indexes were created via Principal Component Analysis (PCA): Engagement Factor (EF) and Optimism Factor (OF). Using Vector Autoregressive (VAR) framework, we simultaneously estimated the effects of sentiment on financial market variables and vice versa. Our results indicate that Twitter users seem to respond to financial market events, i.e. their sentiment is a consequence of financial events and do not have predictive power. Eventos significativos no mercado financeiro ocorrem apenas se existe uma sintonia entre grupos de pessoas e a mídia é o principal meio para tal. Trabalhos anteriores encontraram relações entre notícias de jornais e o indicadores usados no mercado financeiro. Este trabalho, de certo modo, retoma as descobertas da literatura tradicional sobre a relação entre o comportamento de investidores do mercado financeiro e as notícias, porém agora no contexto da Era Moderna das mídias sociais. O principal objetivo desse estudo é identificar se o sentimento dos usuários do Twitter tem alguma relação com o mercado financeiro. Construiu-se uma base de dados que unifica dados não-estruturados de tweets com dados estruturados de séries de tempo financeiras do índice americano S&P500, o seu volume negociado e a sua volatilidade (esta medida pelo índice VIX). Os dados não-estruturados foram processados para poder categorizar cada palavra de cada tweet em categorias semânticas definidas dicionário psicológico Harvard-IV. Após isso, foram criados duas medidas de sentimento via Análise de Componentes Principais (PCA na sigla em inglês): os Fatores de Engajamento e Otimismo. Adotou-se o modelo de Vetor Autoregressivo (VAR) para estimar simultaneamente os efeitos dos sentimentos e variáveis do mercado financeiro uns nos outros. Os resultados indicam que os usuários do Twitter parecem ser mais responsivos aos eventos do mercado, ou seja, o sentimento produzido por seus tweets parecem ser reflexo de eventos financeiros e não têm poder preditivo.