Voice Engine: IA clona vozes a partir de áudios de apenas 15 segundos

por Jéssica Bernardo
| Em 05/04/2024 às 19:00

A OpenAI surpreende novamente com o anúncio de sua mais recente criação: o Voice Engine. Essa tecnologia promete a capacidade de clonar uma voz com apenas 15 segundos de áudio, proporcionando uma fala natural e emotiva.

Mas, afinal, como isso funciona e quais são os seus impactos? Descubra tudo a seguir!

LEIA MAIS: A evolução dos chatbots: de Eliza (nos anos 60) ao ChatGPT

Base tecnológica e funcionamento

O Voice Engine é uma expansão da API de conversão de texto em fala pré-existente da OpenAI, desenvolvida desde 2022. Utilizando análises avançadas de amostras de áudio, o Voice Engine é capaz de imitar qualquer locutor, gerando vozes emotivas e realistas.

Essa tecnologia promete ser útil em diversas áreas, como assistência à leitura, tradução de idiomas e auxílio para pessoas com problemas de fala.

Além de sua capacidade de clonar vozes com precisão, o Voice Engine pode ainda oferecer uma variedade de recursos avançados para atender às necessidades e preferências individuais.

A tecnologia é altamente adaptável e pode ser integrada facilmente em uma variedade de aplicativos e dispositivos, desde assistentes virtuais até sistemas de tradução de idiomas e dispositivos de acessibilidade.

Potenciais benefícios e riscos

Apesar dos benefícios potenciais, é importante considerar os riscos associados ao uso dessa tecnologia. Os cibercriminosos podem abusar dela para disseminar informações falsas e prejudiciais, o que levanta sérias preocupações éticas e de segurança.

Por isso, a OpenAI está trabalhando para garantir medidas de privacidade e segurança robustas antes de uma implementação completa, como uma espécie de marca d’água para rastrear a origem de qualquer áudio.

Ao que se sabe, os testadores concordaram com as políticas de uso da empresa, que proíbem a representação de outro indivíduo sem consentimento ou direito legal.

Livox: inovação na área da inclusão

Além da tecnologia da OpenAI, é importante mencionar outra inovação na área da voz e da inclusão: o Livox.

Desenvolvido para auxiliar pessoas com deficiência na comunicação, a ferramenta é um aplicativo de comunicação alternativa baseado em inteligência artificial.

Ela permite que pessoas com dificuldades de fala se expressem e se comuniquem de forma eficaz, proporcionando maior autonomia e inclusão, o que pode nos mostrar um direcionamento de como o sistema da OpenAi pode funcionar.

LEIA MAIS: 8 dicas para manter a segurança dos idosos na Internet

Atualizações e parceria com a Microsoft

Além do Voice Engine, a OpenAI anunciou uma nova parceria estratégica com a Microsoft. Juntas, as empresas estão trabalhando em um ambicioso projeto de supercomputador chamado “Stargate”.

Esse supercomputador promete revolucionar o campo da computação avançada e pode ter aplicações em diversas áreas, incluindo análise de dados e pesquisa em inteligência artificial, podendo custar até US$ 100 bilhões, segundo o site Information.

Quanto ao lançamento oficial do Voice Engine, a OpenAI ainda não divulgou uma data específica. No entanto, informações sugerem que a tecnologia pode ter um impacto significativo no mercado, incluindo no setor de audiobooks. Estamos ansiosos para descobrir mais informações!

  • Jéssica Bernardo

    Sou uma profissional de marketing, nasci em 1998, natural do estado de São Paulo, com uma paixão pela leitura e escrita.

Tags: áudio | OpenAI

Recentes

Chatbots podem reduzir crença em teorias da conspiração, diz estudo

Chatbots podem reduzir crença em teorias da conspiração, diz estudo

Com a internet facilitando a disseminação de teorias da conspiração, algumas inofensivas e outras com potencial para causar grandes danos, pesquisadores estão explorando novas estratégias para combater esse problema. Uma recente pesquisa realizada por especialistas do...

4 opções baratas de carros automáticos atualmente – seu preços!

4 opções baratas de carros automáticos atualmente – seu preços!

Se você está buscando praticidade na direção, um carro automático pode ser uma excelente opção. E, no Brasil, com o aumento da demanda por esse tipo de câmbio, as montadoras estão cada vez mais se empenhando para oferecer modelos automáticos a preços acessíveis. A...

Uso do ChatGPT pode prejudicar desempenho de estudantes, aponta estudo

Uso do ChatGPT pode prejudicar desempenho de estudantes, aponta estudo

Um estudo conduzido por pesquisadores da Universidade da Pensilvânia revelou que o uso do ChatGPT como ferramenta de apoio no aprendizado pode, na verdade, prejudicar o desempenho dos alunos em testes. Duvida disso? Bom, a pesquisa, que envolveu estudantes do ensino...

Este modelo pode acabar com as imagens estranhas criadas por IA

Este modelo pode acabar com as imagens estranhas criadas por IA

A geração de imagens por inteligência artificial (IA) sempre enfrentou dificuldades em criar resultados consistentes, frequentemente cometendo erros bizarros em detalhes como dedos e simetria facial. Além disso, esses modelos podem falhar completamente quando...

iPhone 16: Quantos salários mínimos são necessários para comprar um?

iPhone 16: Quantos salários mínimos são necessários para comprar um?

O lançamento do iPhone 16 no Apple Event gerou grande expectativa, pelas suas novas funções e design, além do preço. Só para ilustrar, aqui no Brasil, o valor de venda deve chegar a quase R$ 8 mil! Por isso, surge uma pergunta: quantos salários mínimos compram o novo...

Minha Smart TV Box é homologada pela Anatel? Confira a lista completa!

Minha Smart TV Box é homologada pela Anatel? Confira a lista completa!

A Anatel (Agência Nacional de Telecomunicações) estabelece requisitos técnicos rigorosos para a homologação de Smart TV Boxes no Brasil, a fim de garantir a conformidade dos dispositivos com as normas de segurança e operação. O Ato nº 9281, de 05 de julho de 2023,...

9 comandos ‘secretos’ da Alexa para você aproveitar

9 comandos ‘secretos’ da Alexa para você aproveitar

A assistente virtual Alexa, desenvolvida pela Amazon, já é parte de várias famílias, facilitando a vida dos usuários com comandos de voz que controlam dispositivos inteligentes, tocam músicas e fornecem informações. No entanto, além de suas funções mais conhecidas, a...

Planejando viagens com a IA: Veja o que fazer (e o que evitar!)

Planejando viagens com a IA: Veja o que fazer (e o que evitar!)

A popularização da IA generativa tem feito com que os bots inteligentes assumam uma variedade de funções no nosso dia a dia, desde a criação de aplicativos até a produção de filmes. E agora, essas ferramentas estão se tornando também companheiras de viagem, servindo...