Receba nossas newsletters
É de graça. Só tem coisa fina, você vai curtir!
Empresas de inteligência artificial (especialmente a OpenAI) estão aprendendo a duras penas a treta que é utilizar conteúdo protegido por direitos autorais para treinar seus grandes modelos de linguagem e criar produtos de apelo para usuários.
Ninguém sabe ainda o tamanho do problema que isso vai ser (se alguém falar para você que sabe, ou tá mentindo ou tá chutando), mas dá pra ter uma ideia: processos judiciais já foram iniciados, indiretas sobre uso indevido de conteúdo alheio comem soltas na indústria e acusações bem diretas já viraram norma.
A mais recente notícia veio da atriz Scarlett Johansson, que acusou a OpenAI de ter copiado sua voz para criar a Sky, sua nova assistente de voz, a qual agora tem mais personalidade e até flerta com usuários. A atriz chegou a receber uma oferta do CEO da empresa, Sam Altman, mas recusou, o que não o impediu de seguir em frente com uma voz muito parecida com a dela (é o filme favorito dele).
A empresa nega e diz que há provas documentais de que uma atriz contratada que gravou a voz de Sky.
Seja como for, o caso só mostra como as empresas de IA estão na ponta do gatilho dos advogados, especialmente nos EUA, após anos captando basicamente tudo o que existe publicamente na internet, mesmo que protegido por direitos autorais ou regras de plataformas.
Isso coloca empresas como OpenAI e Google em rota de colisão, já que a empresa do ChatGPT quase certamente utilizou vídeos do YouTube (que pertence ao Google) para treinar seu modelo de linguagem, o que vai contra as regras da plataforma.
Só que o Google também usa dados do YouTube para treinar seu modelo, o que em tese também conflita com essas regras.
E mais, quem no fim das contas detém os direitos de exploração desses vídeos para treinar sistemas de IA, os autores ou a plataforma? Ninguém parece saber, e eventualmente vai caber ao judiciário decidir.
Desde o fim do ano passado, o New York Times processa a OpenAI nos Estados Unidos buscando indenização pelo uso de seu jornalismo. Diversos atores e personalidades também judicializaram a ferramenta.
À medida que essas ferramentas ficam melhores, mais acessíveis e ganham escala, mais as empresas por trás desses recursos vão se ver frente a frente com detentores de direitos dos conhecimentos (aka conteúdos originais) que elas utilizaram, sem permissão, para construir produtos bilionários.
Algumas empresas têm mais jogo de cintura, como o Reddit, que em vez de sair na porrada fechou acordos com OpenAI e Google para vender acesso a seus dados.
Ninguém sabe para onde essa estrada vai levar, a gente só sabe que ela está apenas começando.