A OpenAI “sacudiu” o mundo da tecnologia com o lançamento do GPT-4o, modelo avançado do ChatGPT. Segundo a empresa, a nova inteligência artificial generativa deve mudar a própria experiência com a máquina. Só para ilustrar, ela consegue englobar imagem, voz e texto, levando a experiência do usuário a um nível jamais visto.
Mas, essa não foi a única novidade recente! O Google anunciou, nesta terça-feira (14), grandes novidades para o Gemini que já começaram a rodar.
As novidades foram apresentadas na Google I/O, evento anual que a gigante da tecnologia realiza para desenvolvedores. Só para ter uma ideia, os detalhes do Gemini Advanced, versão paga da IA generativa, tomaram conta de praticamente toda a agenda.
LEIA MAIS: GPT-4o: OpenAI introduz novo ChatGPT com poderoso modelo ‘Omni’ – Mundo e-Tech
Vamos ver o que cada versão traz de novo?
O que você precisa saber sobre o Gemini Advanced
A princípio, o Gemini Advanced traz, como qualquer versão premium, mais recursos do que a gratuita. Ela agora consegue processar documentos de até 1,5 mil palavras ou resumir até 100 e-mails. Também já está disponível o upload direto do Google Drive e, caso a pessoa usuária faça questionamentos sobre o conteúdo, a IA responde rapidamente. Ademais, outras novidades anunciadas no evento foram:
- A IA tem uma versão mais leve, o Gemini Flash
- Versão Gemini 1.5 Pro agora disponível para quem assina o Google One AI Premium
- Função Gemini Live que transforma o app em um assistente de voz (você pode fazer de conta que conversa com a IA pelo telefone, por exemplo)
- Ainda sobre as pesquisas do Drive, o Gemini agora resume tudo no painel lateral, tanto do Gmail quanto da nuvem. E é a partir daí que conseguirá resumir, não apenas documentos, quanto conteúdo de e-mails
- O Gemini está mais integrado à busca. Só para exemplificar, permitirá à pessoa usuária buscas mais complexas e até elaboração de documentos, como o cardápio do mês
- Quem tem Android ganha uma função do Gmail para resumir os e-mails direto no celular
- O Gmail e o Google Docs agora tem o idioma português adicionado à função “Ajuda para escrever”. O comando é bem similar ao que se usa na IA
- Duas novas inteligências generativas audiovisuais: Veo, para criação de vídeo e Imagen 3, que transforma texto em imagem
- Criação de música com IA por meio da Music AI Sandbox, uma plataforma multimídia
- Integração entre Gemini e Google Meet para compilar os melhores momentos de alguma sessão, por exemplo
- Projeto Astra, uma versão viva do filme “Ela”: a ideia é que a IA combine entradas de vídeo e áudio para criar conteúdo. Em outras palavras, é como se a máquina “enxergasse” o mundo
Para os próximos meses, a Google ainda deve trazer o Ask Photos, que localizará fotos específicas na galeria apenas por meio de um comando de texto. E, por fim, a habilidade do Gemini Pro 1.5 em interpretar planilhas.
O que o GPT-4o traz de novo?
Segundo a própria OpenaAI, a atualização do ChatGPT tem o objetivo de trazer uma experiência de conversação semelhante à humana. A princípio, traz melhorias ao chatbot, principalmente ao introduzir recursos que combinam áudio, imagem e texto. Assim, a ferramenta parece conversar com as pessoas usuárias como se fosse um diálogo entre humanos.
Além disso, o sistema é capaz de processar e responder a comandos de voz em tempo real, sem atrasos perceptíveis. A habilidade de interromper e retomar conversas com o sistema imita de maneira mais natural o fluxo de diálogos. E tem mais!
Além de se mostrar superior na tradução de linguagem em tempo real, o GPT-4o ainda proporciona assistência visual para problemas matemáticos. Assim, amplia as possíveis aplicações práticas da tecnologia.
Inicialmente, a versão só estará disponível para um grupo mais restrito de desenvolvedores até, posteriormente, ser disponibilizada para os assinantes do ChatGPT Plus e Team. A assinatura destes serviços custa US$ 20 e US$ 25 por mês, respectivamente. Quem usa a versão gratuita também terá acesso, ainda que de forma limitada.
No entanto, não há data estimada para esta disponibilização. Ok, e como vou saber se ela já chegou aos usuários da versão gratuita? Segundo demonstrações na rede X, basta clicar no ícone de seleção do modelo assim que acessar a ferramenta.
LEIA MAIS: Afinal, por que os teclados não seguem a ordem alfabética?
Nada de novidades sobre o Android 15
Embora todo mundo esperasse pelo lançamento do Android 15, atualização do sistema operacional da Google, nada veio. De fato, o foco ficou mesmo na inteligência artificial. Apenas para ilustrar, o termo “IA” foi mencionado 121 vezes durante o evento. Ou seja, parece que a inteligência generativa deve tomar conta da empresa de Mountain View, né?
Ah, e antes tarde do que nunca: para quem usa a versão gratuita da IA da Google, o Gemini Pro 1.5 está disponível para versão de teste por dois meses. Que tal experimentar e ver o que acha?