Ideologia de Políticos usando o Twitter

March 16, 2015
By

(This article was first published on Stats2U, and kindly contributed to R-bloggers)

Utilizando dados do twitter, sua API e o R, resolvi estimar ideologia de políticos importantes no cenário nacional.A ideia é  calcular “Pontos ideais” levando em consideração os seguidores das contas do twitter de cada Político.

Estimar “Ideal Points” não é uma ideia nova e a interpretação do que de fato significam essas estimativas ainda são pontos de discussão. Entretanto, não é incomum associar os resultados a ideologia. 

Vemos, como era de se esperar, que políticos do DEM estão mais associados a direita, assim como políticos do PSOL estão mais associados a esquerda, de acordo com seus seguidores no Twitter.

Veja o gráfico abaixo:

– Próximo passo: Estimar “Pontos Ideais” pros usuários. Exemplo: Luciano Huck, Leonardo Boff e Jabour estão mais identificados, ideologicamente, com a esquerda ou com a direita?
Obs: Esse é só um exercício inicial… Preciso de um computador um pouco mais potente que meu MacBook Pro (i5 com 4gb) pra fazer esses cálculos. Quem tiver um super computador eu ofereço minha amizade verdadeira em troca de algumas (muitas) horas de processamento =)
Questões Técnicas :
O exercício foi possível e graças ao excelente artigo e documentação do Pablo Barberá da New York University (Birds of the Same Feather Tweet Together. Bayesian Ideal Point Estimation Using Twitter DataPolitical Analysis, 2015, 23 (1), 76-91).  O modelo dele estima Ideal Points não só para os Políticos (e outros), como também para os seguidores desses políticos. A probabilidade de um usuário do twitter  i seguir uma conta de um político j é dada por:
Nenhum dos parâmetros do modelo pode ser observado então fazer inferência, principalmente sobre theta e o phi (ideal points dos usuários e dos políticos) é problemático… 
A função de máxima verossimilhança é:
Já da pra ver que estimar isso é um verdadeiro INFERNO! pode ser bem complicado . A ideia é, então, partir pra simulação usando Markov Chain Monte Carlo (http://en.wikipedia.org/wiki/Markov_chain_Monte_Carlo). Usando distribuição Normal pra cada um dos parâmetros Alpha, Beta, Theta e Phi, a distribuição conjunta a posteriori é então:
 Agora é só simular e correr pro abraço!

To leave a comment for the author, please follow the link and comment on their blog: Stats2U.

R-bloggers.com offers daily e-mail updates about R news and tutorials on topics such as: Data science, Big Data, R jobs, visualization (ggplot2, Boxplots, maps, animation), programming (RStudio, Sweave, LaTeX, SQL, Eclipse, git, hadoop, Web Scraping) statistics (regression, PCA, time series, trading) and more...



If you got this far, why not subscribe for updates from the site? Choose your flavor: e-mail, twitter, RSS, or facebook...

Comments are closed.

Sponsors

Never miss an update!
Subscribe to R-bloggers to receive
e-mails with the latest R posts.
(You will not see this message again.)

Click here to close (This popup will not appear again)