A OpenAI surpreende novamente com o anúncio de sua mais recente criação: o Voice Engine. Essa tecnologia promete a capacidade de clonar uma voz com apenas 15 segundos de áudio, proporcionando uma fala natural e emotiva.
Mas, afinal, como isso funciona e quais são os seus impactos? Descubra tudo a seguir!
LEIA MAIS: A evolução dos chatbots: de Eliza (nos anos 60) ao ChatGPT
Base tecnológica e funcionamento
O Voice Engine é uma expansão da API de conversão de texto em fala pré-existente da OpenAI, desenvolvida desde 2022. Utilizando análises avançadas de amostras de áudio, o Voice Engine é capaz de imitar qualquer locutor, gerando vozes emotivas e realistas.
Essa tecnologia promete ser útil em diversas áreas, como assistência à leitura, tradução de idiomas e auxílio para pessoas com problemas de fala.
Além de sua capacidade de clonar vozes com precisão, o Voice Engine pode ainda oferecer uma variedade de recursos avançados para atender às necessidades e preferências individuais.
A tecnologia é altamente adaptável e pode ser integrada facilmente em uma variedade de aplicativos e dispositivos, desde assistentes virtuais até sistemas de tradução de idiomas e dispositivos de acessibilidade.
Potenciais benefícios e riscos
Apesar dos benefícios potenciais, é importante considerar os riscos associados ao uso dessa tecnologia. Os cibercriminosos podem abusar dela para disseminar informações falsas e prejudiciais, o que levanta sérias preocupações éticas e de segurança.
Por isso, a OpenAI está trabalhando para garantir medidas de privacidade e segurança robustas antes de uma implementação completa, como uma espécie de marca d’água para rastrear a origem de qualquer áudio.
Ao que se sabe, os testadores concordaram com as políticas de uso da empresa, que proíbem a representação de outro indivíduo sem consentimento ou direito legal.
Livox: inovação na área da inclusão
Além da tecnologia da OpenAI, é importante mencionar outra inovação na área da voz e da inclusão: o Livox.
Desenvolvido para auxiliar pessoas com deficiência na comunicação, a ferramenta é um aplicativo de comunicação alternativa baseado em inteligência artificial.
Ela permite que pessoas com dificuldades de fala se expressem e se comuniquem de forma eficaz, proporcionando maior autonomia e inclusão, o que pode nos mostrar um direcionamento de como o sistema da OpenAi pode funcionar.
LEIA MAIS: 8 dicas para manter a segurança dos idosos na Internet
Atualizações e parceria com a Microsoft
Além do Voice Engine, a OpenAI anunciou uma nova parceria estratégica com a Microsoft. Juntas, as empresas estão trabalhando em um ambicioso projeto de supercomputador chamado “Stargate”.
Esse supercomputador promete revolucionar o campo da computação avançada e pode ter aplicações em diversas áreas, incluindo análise de dados e pesquisa em inteligência artificial, podendo custar até US$ 100 bilhões, segundo o site Information.
Quanto ao lançamento oficial do Voice Engine, a OpenAI ainda não divulgou uma data específica. No entanto, informações sugerem que a tecnologia pode ter um impacto significativo no mercado, incluindo no setor de audiobooks. Estamos ansiosos para descobrir mais informações!