A metodologia do Listening Pulse

Entenda como funciona nossa tecnologia

SOBRE O PROJETO

O Political Pulse é uma aplicação do Núcleo que identifica tendências de engajamento no Twitter, Facebook e Instagram considerando posts compartilhados pelos principais políticos brasileiros.

Esses dados são relevantes porque podem indicar tanto o humor do momento quanto a mobilização de bases de apoio ou de oposição em relação a certo ator político ou assunto.

Com pouco mais de 16 milhões de usuários [1], o Twitter não representa o eleitorado brasileiro [2], mas, nos últimos anos, a rede social passou a funcionar como um termômetro do debate político no Brasil [3] e em muitos outros países.

A rede social é recorrentemente um meio utilizado por autoridades para se comunicar diretamente com suas bases, o que a tornou uma ferramenta de tomada de decisões, além de pautar a imprensa e boa parte do debate.

Para entender mais a importância do Twitter na política e na diplomacia, acesse o estudo Twiplomacy[4]. Segundo a pesquisa, governos e líderes de 189 países possuíam uma presença oficial na rede social -- quase todos os membros das Nações Unidas.

METODOLOGIA

A fim de garantir total transparência para nossos métodos e abordagens, descrevemos abaixo passo a passo de como chegamos aos resultados do gráfico.

A base do código é aberta e tem como referência a ferramenta Science Pulse, projeto de monitoramento de ciência do Volt Data Lab, a empresa por trás do Núcleo.

Escolha dos nomes

Os perfis dos políticos foram baseados em diversas fontes:

A lista pode ser aumentada, e, inclusive, reduzida, a depender de fatores políticos e eleitorais.

Qualquer pessoa pode sugerir um nome para integrar a lista de atores políticos, através deste formulário, explicando por que.

Dados

Os dados do Twitter são baseados em tweets originais (retweets são desconsiderados) publicados pelos próprios atores em seus perfis oficiais e verificados pelo Twitter.

Os dados analisados são obtidos diretamente da API do Twitter[5], e atualizados a cada 20 minutos. O código para extração pode ser encontrado neste gist. A política de API do Twitter não permite a reprodução integral dos dados.

A API gratuita do Twitter só permite retornar os últimos 3.200 tweets de cada perfil.

Base da análise

A análise é baseada em três variáveis: data de publicação, total de curtidas por tweet e total de retweets por tweet.

Os dados não consideram comentários, por dois motivos:

1. curtidas e retweets estão limitados a apenas um por perfil, funcionando quase como uma métrica de endosso ao conteúdo. Isso torna mais difícil para bots e perfis falsos inflarem artificialmente tweets originais, ao contrário do que acontece com uma hashtag, por exemplo, à medida que um perfil pode curtir múltiplos tweets com um termo.

2. comentários são ilimitados, o que pode inflar indevidamente o número de interações. Além disso, eles frequentemente não refletem uma interação provável de endosso, podendo ser críticos, ofensivos, spam, piadas, memes ou tags para pessoas acompanharem o assunto.

Vale notar que a metodologia do Political Pulse é válida para se visualizar engajamento em perfis específicos, mas não acerca de dados conversacionais. Com uma hashtag ou campanha online, por exemplo, o caso é diferente, à medida que há vários tweets com hashtags ou termos que um bot ou um humano possam interagir em massa.

Fórmulas

O Political Pulse agrega, por dia, o número de tweets disparados entre 00h e 23h59 e soma o total de curtidas e retweets. Essa soma é considerada como o total de interações.

Isso nos permite calcular duas métricas fundamentais para nossa análise: a taxa de engajamento e tendência de engajamento.

  • Taxa de engajamento: é a média simples do total de interações pelo número de tweets disparados em um único dia. Assim, se um perfil tuitou 10 vezes e teve 100 interações, a taxa de engajamento é de 10 interações por tweet. Se outro perfil tuitou uma vez e teve 100 interações, essa taxa é de 100 por tweet;
  • Tendência de engajamento: é a média móvel exponencial de X dias da taxa de engajamento. Consideramos 15 dias como o default, indicando um ciclo noticioso rápido, mas constante;
  • Tweets em alta: lista tweets de autoria de perfis monitorados pelo Monitor Nuclear que tenham o maior número de retweets de toda a população de usuários (contagem de RTs), no momento da última coleta de dados. Usuários podem escolher duas opções para visualização: Descoberta mostra tweets de usuários que estejam abaixo da mediana do número de seguidores dentre os perfis listados no Monitor Nuclear, e Popularidade mostra tweets de todos os perfis da base de dados.

Em todos os casos, a linha de tendência utiliza regressão local (LOESS), um método estatístico que estima curvas e superfícies através de suavização, melhor para identificar tendências de curto prazo.

Fundamentos técnicos

O Political Pulse é construído com a linguagem de programação R, utilizando o pacote Shiny. O ETL (processo de captura e organização de dados) é feito a partir de uma instância no Rstudio, e o banco de dados que armazena as informações é PostgresSQL.

Referências

Statista, ref. fevereiro de 2021 ↩︎

TSE - Estatísticas de Eleitorado ↩︎

Uma definição interessante vem do jornalista José Roberto de Toledo, no podcast Foro de Teresina: "O Twitter não é um espelho da sociedade, ele é um espelho do debate político e ali o que a gente está medindo é o engajamento, a força dos atores, de quanto eles conseguem mobilizar suas bases." - Episódio #95, Foro de Teresina aos 28m28s ↩︎

Twiplomacy Study 2020 ↩︎

API DO TWITTER ↩︎

Receba nossas newsletters e traga felicidade para sua vida.

Não perca nada: você vai receber as newsletters Garimpo (memes e atualidades), Polígono (curadoria de ciência nas redes sociais) e Prensadão (resumo semanal de tudo o que o Núcleo fez). É fácil de receber e fácil de gerenciar!
Show de bola! Verifique sua caixa de entrada e clique no link para confirmar sua inscrição.
Erro! Por favor, insira um endereço de email válido!