Pular para o conteúdo

Meta usou Bíblia para fazer com que modelos de IA reconheçam 1,1 mil idiomas

Novos modelos “entendem” 11 vezes mais idiomas que os rivais. Meta abriu a tecnologia a todos os interessados, sem custo.

Meta usou Bíblia para fazer com que modelos de IA reconheçam 1,1 mil idiomas

A Meta divulgou nesta segunda-feira (22.mai) novos modelos de inteligência artificial (IA) capazes de lidar com 1,1 mil idiomas.

O número é 11 vezes maior que os modelos mais avançados disponíveis até então, como o Whisper, da OpenAI.

O QUE HOUVE? Os novos modelos conseguem reconhecer falas e textos em 1,1 mil idiomas e converter entre esses formatos.

É grande salto em relação aos modelos vigentes, capazes de lidar com cerca de 100 idiomas.

UTILIZAÇÃO. Segundo a Meta, há inúmeras aplicações possíveis, como em aplicativos de realidade virtual e de trocas de mensagens. O objetivo é que mais pessoas consigam interagir com interfaces e outras pessoas em seus idiomas nativos.

“Nosso objetivo é facilitar às pessoas o acesso à informação e o uso de seus dispositivos em seus idiomas preferidos”, diz a empresa.

A Meta abriu os modelos sob uma licença de uso comum. Eles podem ser baixados no GitHub.

COMO? A grande dificuldade para o reconhecimento de idiomas é a ausência gravações em áudio, devidamente rotuladas, nos idiomas menos falados.

Para superar essa lacuna, os engenheiros da Meta reduziram a amostragem a textos do Novo Testamento da Bíblia, pela ampla disponibilidade e porque “suas traduções foram amplamente estudadas para a pesquisa de traduções de idiomas baseados em texto”.

Em média, cada gravação da Bíblia produziu 32 horas de dados por idioma. Essas gravações também foram transcritas.

Em seguida, a empresa usou um algoritmo para alinhar a versão rotulada do áudio da Bíblia a uma não rotulada. Por fim, outros algoritmos de alinhamento de texto e áudio foram usados para “ensinar” os idiomas ao modelo.

Apesar do treino baseado em textos bíblicos, a Meta afirma que “isso não gerou vieses no modelo para produzir mais linguagem religiosa”.

E AGORA? Os materiais disponibilizados no GitHub não são usáveis por qualquer um. São voltados a desenvolvedores, que poderão implementá-los em aplicações comerciais.

Via Meta, MIT Technology Review (ambos em inglês).

Rodrigo Ghedin

Rodrigo Ghedin

Comunicólogo e jornalista. Fundador e editor do Manual do Usuário, um blog sobre os impactos da tecnologia no nosso comportamento. Interesso-me por por tudo que nos faz humanos. Freelancer no Núcleo.

Todos os artigos

Mais em Jogo Rápido

Ver tudo

Mais de Rodrigo Ghedin

Ver tudo