A Meta divulgou nesta segunda-feira (22.mai) novos modelos de inteligência artificial (IA) capazes de lidar com 1,1 mil idiomas.
O número é 11 vezes maior que os modelos mais avançados disponíveis até então, como o Whisper, da OpenAI.
O QUE HOUVE? Os novos modelos conseguem reconhecer falas e textos em 1,1 mil idiomas e converter entre esses formatos.
É grande salto em relação aos modelos vigentes, capazes de lidar com cerca de 100 idiomas.
UTILIZAÇÃO. Segundo a Meta, há inúmeras aplicações possíveis, como em aplicativos de realidade virtual e de trocas de mensagens. O objetivo é que mais pessoas consigam interagir com interfaces e outras pessoas em seus idiomas nativos.
“Nosso objetivo é facilitar às pessoas o acesso à informação e o uso de seus dispositivos em seus idiomas preferidos”, diz a empresa.
A Meta abriu os modelos sob uma licença de uso comum. Eles podem ser baixados no GitHub.
COMO? A grande dificuldade para o reconhecimento de idiomas é a ausência gravações em áudio, devidamente rotuladas, nos idiomas menos falados.
Para superar essa lacuna, os engenheiros da Meta reduziram a amostragem a textos do Novo Testamento da Bíblia, pela ampla disponibilidade e porque “suas traduções foram amplamente estudadas para a pesquisa de traduções de idiomas baseados em texto”.
Em média, cada gravação da Bíblia produziu 32 horas de dados por idioma. Essas gravações também foram transcritas.
Em seguida, a empresa usou um algoritmo para alinhar a versão rotulada do áudio da Bíblia a uma não rotulada. Por fim, outros algoritmos de alinhamento de texto e áudio foram usados para “ensinar” os idiomas ao modelo.
Apesar do treino baseado em textos bíblicos, a Meta afirma que “isso não gerou vieses no modelo para produzir mais linguagem religiosa”.
E AGORA? Os materiais disponibilizados no GitHub não são usáveis por qualquer um. São voltados a desenvolvedores, que poderão implementá-los em aplicações comerciais.
Via Meta, MIT Technology Review (ambos em inglês).