Cadastre-se gratuitamente nas nossas newsletters

A apresentação do parecer final do projeto de lei 2630, o chamado PL das Fake News, na noite de quinta-feira (27.abr.2023) trouxe um ponto fundamental para pesquisadores: o acesso gratuito a dados desagregados de plataformas digitais, inclusive via API.

ℹ️
O QUE SÃO APIS? Em poucas palavras, APIs são recursos fornecidos por plataformas digitais (ou por qualquer empresa que tenha produtos digitais) para automatizar o uso da ferramenta por terceiros, inclusive com o fornecimento de dados estruturados para monitoramentos.

O QUE DIZ O TEXTO. No artigo 25, intitulado "Acesso à pesquisa":

Os provedores deverão viabilizar o acesso gratuito de instituição científica, tecnológica e de inovação a dados desagregados, inclusive por meio de interface de programação de aplicações, para finalidade de pesquisa acadêmica, observados os segredos comercial e industrial, a anonimização e a proteção de dados pessoais conforme a Lei no 13.709, de 14 de agosto de 2018 e conforme regulamentação.

Pelo texto, inclusive, as plataformas vão precisar fornecer dados que mostram o funcionamento dos algoritmos de segmentação, algo que elas não têm muito interesse em destrinchar em detalhes:

O disposto no caput abrange o acesso a informações sobre os algoritmos usados na moderação de contas e de conteúdos, priorização, segmentação, recomendação e exibição de conteúdo, publicidade de plataforma e impulsionamento, e dados suficientes sobre como esses algoritmos afetam o conteúdo visualizado pelos usuários.

Veja a tramitação do PL e documentos relevantes aqui

RELEVANTE. Isso é incrivelmente importante, visto que grandes empresas, como Meta, TikTok, Twitter, Telegram e Kwai, são extremamente conservadoras com quem acessa suas APIs oficiais, inclusive até acadêmicos e pesquisadores.

É BOM, MAS... Não há nenhuma previsão para que organizações jornalísticas também tenham acesso. Muitos veículos, como este Núcleo, trabalham com organizações de pesquisa e com monitoramento ativo para encontrar coisas como abuso sexual infantil, venda ilegal de armas e conteúdo nazista, entre muitos outros assuntos.

COMO FUNCIONA HOJE?

  • A Meta, por exemplo, possui uma ferramenta de pesquisa acadêmica chamada FORT, lançada em jan.2022, mas cujo uso é bem restrito, e pouca gente (pelo menos no Brasil) tem acesso a isso. Outra plataforma da Meta, o CrowdTangle, não tem tido mais tanto desenvolvimento ativo de novos recursos e funcionalidades, além de retornar dados limitados (não traz, por exemplo, comentários de posts);
  • O TikTok possui uma API acadêmica limitada apenas a pesquisadores nos EUA, que precisam responder a um longo e burocrático formulário para tentar conseguir acesso;
  • O Twitter, por sua vez, cobra US$42 mil (cerca de R$220 mil) por mês para acadêmicos terem acesso a seus dados. Embora a empresa tenha dito que está analisando opções para pesquisadores, ainda não há nada definido;
  • O Google possui mais de 400 APIs para dezenas de serviços e produtos, mas boa parte delas são pagas e caras ou possuem limites baixos de requisição. No catálogo de recursos, não consta uma uma API específica para pesquisas acadêmicas;
  • Kwai e Telegram não possuem acessos acadêmicos às suas APIs;
  • O Reddit possui uma API bem extensa.
Por Sérgio Spagnuolo
Edição Laís Martins
Regulação
Venha para o NúcleoHub, nossa comunidade no Discord.