Cadastre-se gratuitamente nas nossas newsletters

A Meta lançou o modelo de IA chamado SeamlessM4T, capaz de traduzir e transcrever aproximadamente 100 idiomas por meio de texto e fala. Esse modelo está disponível em código aberto no GitHub, juntamente com o SeamlessAlign, um novo conjunto de dados de tradução.

💡
Multimodal refere-se à integração e interação de diferentes formas de dados ou mídias, como texto, imagem, áudio e vídeo, em um único sistema ou aplicação.

ENTENDA. O SeamlessM4T possibilita traduções sob demanda, facilitando a comunicação entre pessoas que falam diferentes idiomas. Ele reconhece automaticamente os idiomas de origem, eliminando a necessidade de um modelo de identificação de idioma separado.

Esse modelo é resultado do uso de dados de texto e fala publicamente disponíveis, com um conjunto de treinamento denominado SeamlessAlign. Ele consegue transcrever, traduzir e gerar fala com base nas informações coletadas.

RESULTADOS. Em um post no blog da comunidade, a empresa destacou que o modelo apresenta bom desempenho em tarefas de transcrição de fala para texto, especialmente em cenários com ruído de fundo e variações de fala.

No entanto, também foi observado que o modelo possui vieses, como a preferência por formas masculinas ao traduzir termos neutros. Apesar disso, a empresa afirmou que o modelo não gera quantidades excessivas de “texto tóxico” em suas traduções.

IMPORTANTE. No post, a Meta esclareceu que o modelo não é adequado para traduções de longo formato, traduções certificadas, nem para fins médicos ou legais.

A empresa ressaltou a importância de manter seres humanos envolvidos no processo de tradução para preservar a riqueza lexical e a diversidade.

Meta, Google, Amazon e OpenAI prometem ser responsáveis com IA
Os representantes assinaram um termo de compromisso. A expectativa é que as empresas trabalhem imediatamente nas medidas
Meta lança o LLaMa2, modelo de IA em parceria com a Microsoft
A licença do modelo de código aberto ressalta ser proibido usar o modelo para violação de leis locais, incitação à violência, desinformação e práticas enganosas

Via Meta Newsroom (em inglês)

Texto Sofia Schurig
Edição Alexandre Orrico

MetaInteligência ArtificalGithub
Venha para o NúcleoHub, nossa comunidade no Discord.