YouTube lança ferramenta "Aloud" para dobrar vídeos automaticamente em várias línguas

Conteúdo neste artigo ver

YouTube anuncia ferramenta de inteligência artificial para dobragem automática de vídeos

O YouTube anunciou na VidCon desta semana a integração de uma nova ferramenta de inteligência artificial (IA) que irá dobrar automaticamente vídeos em outros idiomas, ajudando criadores e espectadores a superar a barreira da língua. A funcionalidade, chamada “Aloud”, faz parte do incubador Area 120 da Google para projetos experimentais e foi anunciada no ano passado como parte do aumento do investimento da empresa em recursos baseados em IA para todos os seus produtos e serviços.

Como funciona o Aloud?

O Aloud permite que os criadores dobrem rapidamente e facilmente os seus vídeos em vários idiomas, “desbloqueando conhecimento que pode estar preso num único idioma hoje”. A Google espera que a funcionalidade torne a dobragem mais acessível para criadores que acham complicado ou caro dobrar seus vídeos em vários idiomas.

O processo começa com a transcrição do vídeo, permitindo que o criador revise e edite a transcrição. Em seguida, o Aloud traduz e dobra o vídeo no idioma desejado antes de ser publicado pelo criador.

Testes e disponibilidade

Amjad Hanif, do YouTube, afirmou em entrevista ao The Verge que a ferramenta está atualmente a ser testada com centenas de criadores em todo o mundo. No entanto, o Aloud suporta apenas alguns idiomas no momento, com a expectativa de adicionar mais no futuro. Inicialmente, estará disponível apenas em inglês, espanhol e português, com a adição de hindi, bahasa-indonésio e outros idiomas prevista para breve.

Benefícios e melhorias futuras

O Aloud é um exemplo interessante do uso da IA para ajudar os criadores a alcançar um público mais amplo. Segundo Hanif, a empresa está a trabalhar não só para fazer com que as faixas de áudio traduzidas soem como a voz do criador, mas também para incorporar mais expressão no conteúdo dobrado. Além disso, a Google pretende introduzir a sincronização labial para tornar os vídeos mais naturais. No entanto, essas funcionalidades só estarão disponíveis no próximo ano. Por enquanto, os vídeos permanecerão fora de sincronia com o áudio, e a voz dobrada soará relativamente mecânica.