Voice Engine: IA clona vozes a partir de áudios de apenas 15 segundos

| Em 05/04/2024 19:00

A OpenAI surpreende novamente com o anúncio de sua mais recente criação: o Voice Engine. Essa tecnologia promete a capacidade de clonar uma voz com apenas 15 segundos de áudio, proporcionando uma fala natural e emotiva.

Mas, afinal, como isso funciona e quais são os seus impactos? Descubra tudo a seguir!

LEIA MAIS: A evolução dos chatbots: de Eliza (nos anos 60) ao ChatGPT

Base tecnológica e funcionamento

O Voice Engine é uma expansão da API de conversão de texto em fala pré-existente da OpenAI, desenvolvida desde 2022. Utilizando análises avançadas de amostras de áudio, o Voice Engine é capaz de imitar qualquer locutor, gerando vozes emotivas e realistas.

Essa tecnologia promete ser útil em diversas áreas, como assistência à leitura, tradução de idiomas e auxílio para pessoas com problemas de fala.

Além de sua capacidade de clonar vozes com precisão, o Voice Engine pode ainda oferecer uma variedade de recursos avançados para atender às necessidades e preferências individuais.

A tecnologia é altamente adaptável e pode ser integrada facilmente em uma variedade de aplicativos e dispositivos, desde assistentes virtuais até sistemas de tradução de idiomas e dispositivos de acessibilidade.

Potenciais benefícios e riscos

Apesar dos benefícios potenciais, é importante considerar os riscos associados ao uso dessa tecnologia. Os cibercriminosos podem abusar dela para disseminar informações falsas e prejudiciais, o que levanta sérias preocupações éticas e de segurança.

Por isso, a OpenAI está trabalhando para garantir medidas de privacidade e segurança robustas antes de uma implementação completa, como uma espécie de marca d’água para rastrear a origem de qualquer áudio.

Ao que se sabe, os testadores concordaram com as políticas de uso da empresa, que proíbem a representação de outro indivíduo sem consentimento ou direito legal.

Livox: inovação na área da inclusão

Além da tecnologia da OpenAI, é importante mencionar outra inovação na área da voz e da inclusão: o Livox.

Desenvolvido para auxiliar pessoas com deficiência na comunicação, a ferramenta é um aplicativo de comunicação alternativa baseado em inteligência artificial.

Ela permite que pessoas com dificuldades de fala se expressem e se comuniquem de forma eficaz, proporcionando maior autonomia e inclusão, o que pode nos mostrar um direcionamento de como o sistema da OpenAi pode funcionar.

LEIA MAIS: 8 dicas para manter a segurança dos idosos na Internet

Atualizações e parceria com a Microsoft

Além do Voice Engine, a OpenAI anunciou uma nova parceria estratégica com a Microsoft. Juntas, as empresas estão trabalhando em um ambicioso projeto de supercomputador chamado “Stargate”.

Esse supercomputador promete revolucionar o campo da computação avançada e pode ter aplicações em diversas áreas, incluindo análise de dados e pesquisa em inteligência artificial, podendo custar até US$ 100 bilhões, segundo o site Information.

Quanto ao lançamento oficial do Voice Engine, a OpenAI ainda não divulgou uma data específica. No entanto, informações sugerem que a tecnologia pode ter um impacto significativo no mercado, incluindo no setor de audiobooks. Estamos ansiosos para descobrir mais informações!

  • Jéssica Bernardo

    Sou uma profissional de marketing, nasci em 1998, natural do estado de São Paulo, com uma paixão pela leitura e escrita.

Tags: áudio | OpenAI

Recentes

SUVs compactos: descubra os 5 campeões em porta-malas

SUVs compactos: descubra os 5 campeões em porta-malas

Os SUVs compactos tornaram-se uma escolha popular entre as famílias brasileiras, graças à combinação de design completo, conforto e versatilidade. Mas é importante destacar que, ao escolher um SUV, o espaço do porta-malas é um fator decisivo para quem precisa...

De aviões a trens: Onde os antigos disquetes ainda são utilizados?

De aviões a trens: Onde os antigos disquetes ainda são utilizados?

Os disquetes, ou “floppy disks”, como são conhecidos em inglês, foram uma criação tecnológica importantíssima para a computação nas décadas de 1970 e 1980. Afinal, eles permitiram o armazenamento portátil de dados, revolucionando, na época, a forma como os...

Dormir com o cabelo molhado faz mal? Mitos e verdades

Dormir com o cabelo molhado faz mal? Mitos e verdades

Ter um dia corrido e ter que escolher entre lavar o cabelo e secar ou simplesmente dormir mais cedo… bom, isso acontece frequentemente. Nesse sentido, muitas pessoas já ouviram falar que dormir com o cabelo molhado pode causar uma série de problemas de saúde, desde...

Itens de cozinha que você não deveria colocar na sua lava-louças

Itens de cozinha que você não deveria colocar na sua lava-louças

Não é segredo que a lava-louças pode ser uma grande aliada na cozinha. No entanto, apesar de sua versatilidade, nem todos os utensílios são adequados para se colocar nesse eletrodoméstico. Isso porque materiais específicos e itens delicados podem ser danificados pelo...

Quais os carros mais vendidos do mundo? Veja o ranking global!

Quais os carros mais vendidos do mundo? Veja o ranking global!

Com cerca de 78,32 milhões de novos carros de passeio vendidos - um crescimento de 10% em comparação a 2022 -, o mercado automotivo global passou por um momento importante em 2023. Isso porque, pela primeira vez, um carro elétrico conquistou a liderança no ranking de...

0 comentários

Pin It on Pinterest