A Meta lançou o modelo de IA chamado SeamlessM4T, capaz de traduzir e transcrever aproximadamente 100 idiomas por meio de texto e fala. Esse modelo está disponível em código aberto no GitHub, juntamente com o SeamlessAlign, um novo conjunto de dados de tradução.
ENTENDA. O SeamlessM4T possibilita traduções sob demanda, facilitando a comunicação entre pessoas que falam diferentes idiomas. Ele reconhece automaticamente os idiomas de origem, eliminando a necessidade de um modelo de identificação de idioma separado.
Esse modelo é resultado do uso de dados de texto e fala publicamente disponíveis, com um conjunto de treinamento denominado SeamlessAlign. Ele consegue transcrever, traduzir e gerar fala com base nas informações coletadas.
RESULTADOS. Em um post no blog da comunidade, a empresa destacou que o modelo apresenta bom desempenho em tarefas de transcrição de fala para texto, especialmente em cenários com ruído de fundo e variações de fala.
No entanto, também foi observado que o modelo possui vieses, como a preferência por formas masculinas ao traduzir termos neutros. Apesar disso, a empresa afirmou que o modelo não gera quantidades excessivas de “texto tóxico” em suas traduções.
IMPORTANTE. No post, a Meta esclareceu que o modelo não é adequado para traduções de longo formato, traduções certificadas, nem para fins médicos ou legais.
A empresa ressaltou a importância de manter seres humanos envolvidos no processo de tradução para preservar a riqueza lexical e a diversidade.
Via Meta Newsroom (em inglês)