Fazer login no IT Mídia Redefinir senha
Bem-vindo de volta,
Digite seu e-mail e clique em enviar
Ainda não tem uma conta? Cadastre-se
Logo ITMidia
Logo ComputerWorld
Logo PCWorld
Logo CIO
Logo ITForum
Salvar em Nova pasta de favoritos

+

Criar pasta
Últimos favoritos Ver todos
Últimas notícias do conteúdo : Ver todos
Inteligência Artificial do Facebook copia com perfeição a voz de Bill Gates
Inteligência Artificial do Facebook copia com perfeição a voz de Bill Gates
Home > Internet

Inteligência Artificial do Facebook copia com perfeição a voz de Bill Gates

Batizado de “MelNet”, mecanismo gera resultados mais consistentes que outras tecnologias e poderia se usado em assistentes de voz do futuro

Da Redação

11/06/2019 às 10h23

Foto: Shutterstock

Muito se fala sobre como a inteligência artificial (IA) poderá se confundir com os seres humanos no futuro. E aqui está uma prova disso: engenheiros do Facebook desenvolveram um mecanismo chamado MelNet capaz de reproduzir com fidelidade a voz de outras pessoas. E para exemplificar a tecnologia, eles recriaram a voz de Bill Gates, fundador da Microsoft.

As informações são do site The Verge. Para duplicar a voz do homem mais rico do mundo, o MelNet foi construído a partir de um enorme banco de dados de áudio. Isso inclui audiobooks e 450 horas de palestras feitas no TED. Depois, a plataforma criada pelos pesquisadores do Facebook analisa as diferentes nuances e tons da voz humana, para então gerar uma cópia idêntica à ela.

O que torna o MelNet único, em comparação com programas semelhantes, é o que os engenheiros da rede social chamam de “espectrograma”. Trata-se de uma forma mais avançada de captura de áudio que, em vez de exibir a variação das ondas sonoras, mostra formas quase impossíveis de serem colocadas no papel. Por conta dessa densidade, os algoritmos de IA podem reproduzir vozes mais consistentes - e, com isso, enganar o ouvinte.

Contudo, há algumas limitações. A mais importante dela é que o MelNet não é capaz de replicar como uma voz humana pode mudar em longos períodos de tempo. Um exemplo citado é durante a leitura de um parágrafo ou texto em que o conteúdo tenha drama ou tensão. Em todo o caso, o mecanismo deve ser aprimorado para gerar resultados mais precisos e realistas, e com grande potencial para ser aplicado na próxima geração dos assistentes de voz.

Você pode ouvir as vozes geradas pelo MelNet neste link, na seção "Selected Speakers".

Junte-se a nós e receba nossas melhores histórias de tecnologia. Newsletter por e-mail Newsletter por e-mail
Vai um cookie?

A IT Mídia usa cookies para personalizar conteúdo e anúncios, para melhorar sua experiência em nosso site. Ao continuar, você aceitará o uso. Para mais detalhes veja nossa Política de Privacidade.

Este anúncio desaparecerá em:

Ir para o site