Logo da Meta, empresa responsável por Facebook, Instagram e WhatsApp (Foto: Canva Pro)
Logo da Meta, empresa responsável por Facebook, Instagram e WhatsApp (Foto: Canva Pro)

A Meta, empresa proprietária do Facebook, Instagram e WhatsApp, desenvolveu modelos de inteligência artificial capazes de identificar mais de 4.000 idiomas falados e reconhecer 1.100 deles falados em voz alta, com base em dados da Bíblia.

Isso significa 40 vezes mais do que qualquer tecnologia anterior conhecida . “É um passo significativo para preservar idiomas que correm o risco de desaparecer”, diz a empresa por trás do Facebook e do Instagram.

Seus modelos Massively Multilingual Speech (MMS) visam “tornar mais fácil para as pessoas acessar informações e usar dispositivos em seu idioma preferido”.

A Meta os está disponibilizando em software de acesso aberto, para que “outros na comunidade de pesquisa possam desenvolver nosso trabalho”.

“Coletar dados de áudio para milhares de idiomas foi nosso primeiro desafio porque os maiores conjuntos de dados de fala existentes cobrem no máximo 100 idiomas. Para superar isso, nos voltamos para textos religiosos, como a Bíblia, que foram traduzidos em muitos idiomas diferentes e cujas traduções foram amplamente estudadas para pesquisa de tradução de linguagem baseada em texto”, diz a Meta.

Dados da Bíblia

Existem cerca de 7.000 idiomas no mundo, mas os modelos de reconhecimento de fala existentes cobrem apenas cerca de 100 deles de forma abrangente.

Para superar isso e treinar o modelo, eles criaram dois conjuntos de dados com textos religiosos cujas traduções e gravações de áudio de pessoas que os lêem estão disponíveis publicamente em diferentes idiomas.

Um dos conjuntos contém gravações de áudio do Novo Testamento e seu texto correspondente retirado da internet em 1.107 idiomas, o que forneceu em média 32 horas de dados por idioma; o outro contém gravações sem rótulo de várias outras leituras religiosas cristãs.

No entanto, eles enfatizam que “embora o conteúdo das gravações de áudio seja religioso, nossa análise mostra que isso não influencia o modelo a produzir uma linguagem mais religiosa”.

No futuro, a Meta espera “aumentar a cobertura do MMS para suportar ainda mais idiomas e também enfrentar o desafio de lidar com dialetos, que muitas vezes é difícil para a tecnologia de fala existente”.

Folha Gospel com informações de Evangelical Focus

Comentários