Maria Lígia Barros | 29 de março de 2024 - 19h50

OpenAI apresenta tecnologia que 'clona' vozes humanas, mas opta por não lançá-la agora

A ferramenta Voice Engine consegue recriar a voz de uma pessoa específica e fazê-la ler mensagens escritas pelo usuário, baseada em uma gravação de apenas 15 segundos do orador original

ÁUDIO EM IA

OpenAI apresenta tecnologia que 'clona' vozes humanas, mas opta por não lançá-la agora - (Foto: Flickr)

A OpenAI, responsável pelo desenvolvimento do ChatGPT, anunciou nesta sexta-feira (29) o seu novo modelo de inteligência artificial (IA) capaz de reproduzir vozes humanas. No entanto, a empresa informou que por enquanto optará por apenas demonstrar a tecnologia ao público, sem realizar um lançamento amplo, devido aos potenciais riscos de utilização indevida.

A ferramenta Voice Engine consegue recriar a voz de uma pessoa específica e fazê-la ler mensagens escritas pelo usuário, baseada em uma gravação de apenas 15 segundos do orador original, segundo o comunicado da OpenAI. A companhia disse que desenvolveu a tecnologia no fim de 2022, e que começou a testá-la preliminarmente com um pequeno grupo de "parceiros confiáveis".

No anúncio desta sexta, a OpenAI compartilhou insights sobre as aplicações até agora com a justificativa de iniciar um diálogo sobre a adoção responsável do que chamou de "vozes sintéticas". "De acordo com as conversas e os resultados de pequenos testes, vamos tomar uma decisão mais informada sobre como ou se usaremos essa tecnologia", falou, em uma publicação no seu blog.

A OpenAI disse que identificou formas de aplicação "para o bem", como: fornecer assistência de leitura a pessoas que não sabem ler; traduzir conteúdos; ajudar pacientes a recuperarem a voz; e outros usos terapêuticos.

Por outro lado, a empresa reconheceu que a tecnologia representa sérios riscos, sobretudo em ano de eleições ao redor do mundo. A companhia falou esperar que o Voice Engine motive a construção de maior resiliência da sociedade contra os desafios. Ela propõe, por exemplo, eliminar aos poucos as autenticações por voz para acessar contas bancárias, explorar políticas para proteger o uso de vozes de indivíduos, acelerar o desenvolvimento de técnicas de identificação de conteúdo criado por IA.