A Microsoft anunciou recentemente mais uma novidade no ramo da inteligência artificial (IA) com o lançamento do VASA-1, um modelo avançado capaz de transformar fotografias estáticas em vídeos. Este sistema é capaz de sincronizar os movimentos dos lábios com precisão, ao mesmo tempo em que também ajusta expressões faciais e a posição da cabeça em três dimensões.
Como o VASA-1 funciona?
Imagine um editor 3D avançado. É basicamente assim que o VASA-1 opera. Por meio de um processo chamado “disentanglement”, o sistema consegue controlar e editar independentemente as expressões faciais, a posição da cabeça em 3D e outras características do rosto. Isso permite um nível de realismo impressionante.
LEIA MAIS: 6 funções de acessibilidade do iOS 17 que todo mundo deve experimentar
Além disso, o VASA-1 não se limita a reproduzir fielmente o que aprendeu. Mesmo que a IA tenha sido treinada com fotos realistas e falas em inglês, ela é capaz de gerar vídeos com personagens de desenhos animados, dublagens artísticas e até falas em outros idiomas!
Você pode conferir vários exemplos impressionantes de aplicação da ferramenta diretamente no site da Microsoft dedicado à VASA-1.
Capacidades e possibilidades do novo modelo
A Microsoft destaca a eficiência do VASA-1 em tempo real. O sistema consegue gerar vídeos de resolução razoável (512×512 pixels) com taxas de quadros impressionantes, chegando a 45 fps no modo offline e 40 fps online.
Imagine a Mona Lisa mandando um rap bem humorado! Pois é, os pesquisadores da Microsoft utilizaram a IA para animar a famosa pintura com a voz da atriz Anne Hathaway. Divertido, né? Você pode conferir o resultado aqui.
Mas o VASA-1 vai muito além do entretenimento. A Microsoft prevê aplicações na área da educação, acessibilidade para pessoas com deficiências na fala e até mesmo a criação de companhias virtuais.
LEIA MAIS: Por que seu celular Android não está recarregando? Saiba como resolver!
Impactos potenciais e preocupações éticas
É fato que a tecnologia do VASA-1 abre portas incríveis, mas também levanta preocupações. A possibilidade de criar vídeos falsos ultrarrealistas gera receios quanto à disseminação de desinformação.
Por enquanto, a Microsoft optou por não liberar o VASA-1 para o público. A empresa segue a mesma linha de sua parceira OpenAI, que disponibilizou sua ferramenta de geração de vídeos com IA, o Sora, apenas para uso profissional restrito.
“Somos contra qualquer comportamento que crie conteúdo enganoso ou prejudicial sobre pessoas reais”, declararam os pesquisadores da Microsoft. A empresa ressalta que só disponibilizará o VASA-1 publicamente quando houver garantias de uso responsável e de acordo com regulamentações apropriadas.