A apresentação do parecer final do projeto de lei 2630, o chamado PL das Fake News, na noite de quinta-feira (27.abr.2023) trouxe um ponto fundamental para pesquisadores: o acesso gratuito a dados desagregados de plataformas digitais, inclusive via API.
O QUE DIZ O TEXTO. No artigo 25, intitulado "Acesso à pesquisa":
Os provedores deverão viabilizar o acesso gratuito de instituição científica, tecnológica e de inovação a dados desagregados, inclusive por meio de interface de programação de aplicações, para finalidade de pesquisa acadêmica, observados os segredos comercial e industrial, a anonimização e a proteção de dados pessoais conforme a Lei no 13.709, de 14 de agosto de 2018 e conforme regulamentação.
Pelo texto, inclusive, as plataformas vão precisar fornecer dados que mostram o funcionamento dos algoritmos de segmentação, algo que elas não têm muito interesse em destrinchar em detalhes:
O disposto no caput abrange o acesso a informações sobre os algoritmos usados na moderação de contas e de conteúdos, priorização, segmentação, recomendação e exibição de conteúdo, publicidade de plataforma e impulsionamento, e dados suficientes sobre como esses algoritmos afetam o conteúdo visualizado pelos usuários.
Veja a tramitação do PL e documentos relevantes aqui
RELEVANTE. Isso é incrivelmente importante, visto que grandes empresas, como Meta, TikTok, Twitter, Telegram e Kwai, são extremamente conservadoras com quem acessa suas APIs oficiais, inclusive até acadêmicos e pesquisadores.
É BOM, MAS... Não há nenhuma previsão para que organizações jornalísticas também tenham acesso. Muitos veículos, como este Núcleo, trabalham com organizações de pesquisa e com monitoramento ativo para encontrar coisas como abuso sexual infantil, venda ilegal de armas e conteúdo nazista, entre muitos outros assuntos.
COMO FUNCIONA HOJE?
- A Meta, por exemplo, possui uma ferramenta de pesquisa acadêmica chamada FORT, lançada em jan.2022, mas cujo uso é bem restrito, e pouca gente (pelo menos no Brasil) tem acesso a isso. Outra plataforma da Meta, o CrowdTangle, não tem tido mais tanto desenvolvimento ativo de novos recursos e funcionalidades, além de retornar dados limitados (não traz, por exemplo, comentários de posts);
- O TikTok possui uma API acadêmica limitada apenas a pesquisadores nos EUA, que precisam responder a um longo e burocrático formulário para tentar conseguir acesso;
- O Twitter, por sua vez, cobra US$42 mil (cerca de R$220 mil) por mês para acadêmicos terem acesso a seus dados. Embora a empresa tenha dito que está analisando opções para pesquisadores, ainda não há nada definido;
- O Google possui mais de 400 APIs para dezenas de serviços e produtos, mas boa parte delas são pagas e caras ou possuem limites baixos de requisição. No catálogo de recursos, não consta uma uma API específica para pesquisas acadêmicas;
- Kwai e Telegram não possuem acessos acadêmicos às suas APIs;
- O Reddit possui uma API bem extensa.