O Google avançou sua jornada no campo da Inteligência Artificial (IA) com o lançamento do Gemini 2.0, modelo que promete redefinir os padrões de desempenho e funcionalidade no setor.
Sundar Pichai, CEO do Google e Alphabet, comentou o compromisso da empresa com a inovação. “No último ano, temos focado no desenvolvimento de modelos ainda mais “proativos”, ou seja, capazes de entender melhor o mundo ao seu redor, pensar vários passos à frente e agir por você, sempre com a sua supervisão. Os avanços do Gemini 2.0 são resultado de mais de uma década de investimentos na nossa abordagem integrada e única para inovação em IA”.
O lançamento do Gemini 2.0 ocorre em um momento crítico, em que a competição no setor de IA é mais acirrada do que nunca. A gigante da tecnologia busca assumir a liderança na “corrida da IA”.
A questão é que o Google larga atrás da OpenAI, que lançou na semana passada a Sora, modelo de IA capaz de transformar comandos por texto em vídeos realistas. Além disso, em setembro de 2024, a OpenAI anunciou o lançamento das versões beta de seu mais novo modelo de Inteligência Artificial generativa: o OpenAI o1. O modelo conta com um treinamento avançado voltado para raciocínios complexos.
O que é o Gemini 2.0?
O Gemini 2.0 se mostra mais do que uma atualização simples de sua versão anterior. Segundo o Google, apresenta capacidades mais avançadas, uma evolução do modelo 1.5 Flash, que traz suporte a entradas e saídas multimodais, combinando imagens, vídeos, texto e áudio. Além disso, permite criar conteúdo multimodal de maneira fluida. O modelo é especialmente otimizado para velocidade e personalização, com recursos como texto-para-fala (TTS) ajustados em vários idiomas.
Segundo o Google, as capacidades avançadas do Gemini 2.0 Flash, como raciocínio multimodal, compreensão de contextos amplos, execução de instruções complexas, estão sendo trabalhadas juntas para inaugurar uma nova classe de experiências de agentes.
Novos projetos e aplicações
A aplicação prática de sistemas de agentes de IA é uma área de pesquisa repleta de possibilidades. A gigante da tecnologia está explorando esse novo território com uma série de protótipos que ajudam as pessoas a realizar tarefas. Entre eles:
- Projeto Astra: potencializado pelo Gemini 2.0, o Astra combina imagens, vídeos e voz em uma linha do tempo de eventos para conversas mais naturais e uma recuperação eficiente de informações;
- Projeto Mariner: explora o futuro da interação entre humanos e sistemas, começando pelo navegador, ou seja, novo protótipo de pesquisa inicial construído com o Gemini 2.0, o Mariner reimagina como as pessoas interagem com a web. Combina as capacidades de compreensão multimodal do Gemini com a interação web para automatizar tarefas e agir em seu nome;
- Jules: um agente de código baseado em IA projetado para auxiliar desenvolvedores;
- Deep Research: trata-se de uma nova capacidade para usuários do Gemini Advanced que utilizam a IA para explorar tópicos complexos, fornecendo resultados em um relatório completo.
Novos recursos alimentados por IA para Android que melhoram a acessibilidade, a criatividade e a produtividade.
O futuro do Gemini 2.0
Com uma visão voltada para o longo prazo, o Google já anunciou que outros modelos baseados no Gemini serão lançados nos próximos anos, prometendo avanços ainda maiores. O desafio agora é consolidar sua posição no mercado, competindo com rivais, como a OpenAI e a Anthropic, que têm conquistado rapidamente a atenção do público.
Estaria o Google redefinindo o jogo?
*Foto: Alphabet/Google.