Gemini 3.5 Flash e Gemini Omni no Google I/O 2026: benchmarks confirmados, preços e impacto real para criadores

Gemini 3.5 e Gemini Omni: Tudo Que o Google I/O 2026 Mudou Para Usuários e Criadores

O Google I/O 2026, realizado em 19 e 20 de maio em Mountain View, foi a edição mais agressiva da história do evento em termos de lançamentos de IA. Foram 100 anúncios (o Google literalmente publicou uma lista com esse título), mas dois roubaram a cena: o Gemini 3.5 Flash, novo modelo agêntico que já chegou disponível ao público (GA), e o Gemini Omni, um modelo que cria vídeo a partir de praticamente qualquer entrada — imagem, áudio, vídeo ou texto. Some a isso o Gemini Spark (um agente pessoal 24/7), a evolução do Antigravity e o redesenho completo do app Gemini, e fica claro que o Google decidiu disputar 2026 no atacado.

Para quem usa IA no dia a dia, cria conteúdo ou toca negócio digital no Brasil, esse pacote não é só barulho de keynote. Tem mudança concreta de preço, de capacidade e de fluxo de trabalho — e parte dela já está no ar. Neste deep-dive, separamos o que de fato importa: os números reais de benchmark (confirmados), o que cada produto faz, quanto custa e o que muda para você a partir de agora.


Gemini 3.5 Flash: O “Flash” Que Supera o “Pro” do Ano Passado

A manchete técnica do I/O foi inusitada: um modelo da linha Flash (a linha rápida e barata do Google) superando o Gemini 3.1 Pro, o carro-chefe da geração anterior, em benchmarks que simulam trabalho real. Não é marketing — os números foram divulgados pelo próprio Google e replicados por análises independentes.

Os benchmarks (confirmados)

  • Terminal-Bench 2.1: 76,2%. Mede a capacidade do modelo de operar dentro de um terminal como um agente autônomo.
  • GDPval-AA: 1656 de Elo. Avalia desempenho em tarefas econômicas reais.
  • MCP Atlas: 83,6% (o Google reportou o número do 3.5 Flash; análises independentes posicionam o Flash à frente dos concorrentes no uso de ferramentas via protocolo MCP, incluindo o Claude Opus 4.7, em torno de 79%, e o GPT-5.5, em torno de 75%).
  • CharXiv Reasoning (multimodal): 84,2%, mostrando que o salto não é só em código.

Além da inteligência, a velocidade: o Google afirma que o 3.5 Flash gera tokens de saída cerca de 4x mais rápido que outros modelos de fronteira, e a um custo “frequentemente menor que metade” dos concorrentes. Nas palavras do próprio Google: “o que costumava levar dias de um desenvolvedor ou semanas de um auditor, o 3.5 Flash agora ajuda a completar em uma fração do tempo.”

Onde ele já está

O 3.5 Flash chegou em disponibilidade geral (GA) já no dia do anúncio, acessível via Gemini API no Google AI Studio, Android Studio e a plataforma Antigravity. Mais importante para o usuário comum: ele virou o modelo padrão do AI Mode na Busca do Google, globalmente. Ou seja, quando você faz uma pergunta conversacional no Google e recebe uma resposta gerada por IA, é o 3.5 Flash respondendo.

E o Gemini 3.5 Pro?

O Google confirmou que o 3.5 Pro já está em uso interno e tem rollout planejado para o mês seguinte ao I/O — ou seja, deve aparecer ao longo de junho de 2026. A lógica é a mesma de sempre: o Flash entrega velocidade e custo para tarefas agênticas e o Pro mira raciocínio profundo e os casos mais difíceis.

A leitura prática: para quem constrói agentes, automações ou produtos que precisam “fazer algo” (não apenas “responder uma pergunta difícil”), o 3.5 Flash provavelmente já é a melhor escolha de custo-benefício no mercado. Se você está comparando opções, vale conferir nosso panorama atualizado sobre qual é o melhor modelo de IA em 2026.


Gemini Omni: Vídeo a Partir de Qualquer Coisa

Se o 3.5 Flash foi o anúncio para desenvolvedores, o Gemini Omni foi o que fez a plateia aplaudir. É um novo modelo (ou melhor, uma nova série) que cria vídeo a partir de qualquer entrada: você dá uma imagem, um trecho de áudio, um vídeo de referência ou simplesmente texto, e ele gera vídeo de alta qualidade — editável por conversa.

O diferencial: entendimento de mundo

O ponto que o Google enfatizou é que o Omni não está só “colando pixels bonitos”. Ele combina a inteligência do Gemini com modelos de mídia generativa para um nível mais alto de entendimento de mundo. Na prática, isso significa que, ao editar uma cena, o modelo mantém coerência física e narrativa: nas palavras do Google, “seus personagens permanecem consistentes, a física se sustenta e a cena lembra o que veio antes.”

Essa noção de física é o que separa o Omni de geradores de vídeo mais antigos. O modelo lida melhor com como objetos se movem, caem e interagem — gravidade, movimento, fluidos — em vez de produzir aquelas distorções estranhas de mãos e objetos que marcaram a primeira geração de vídeo por IA. (Vale a ressalva honesta: nem todo número de “entendimento de física” foi publicado com benchmark fechado; o que o Google demonstrou foram exemplos práticos de consistência.)

Consistência de personagem

Um recurso específico que o Google destacou é a consistência de personagem no Gemini Omni Flash: a identidade e a voz de um personagem são preservadas de uma cena para outra. Esse é, historicamente, o maior calcanhar de Aquiles do vídeo por IA — fazer o mesmo rosto e a mesma voz atravessarem múltiplos cortes sem “trocar de pessoa”. Para criadores, é justamente o que faltava para produzir narrativas com começo, meio e fim.

Todo conteúdo gerado carrega marca d’água SynthID imperceptível, parte do esforço do Google de rotular mídia sintética.

Onde e quanto custa

Aqui está a parte que mais interessa ao bolso:

  • Gemini Omni está em rollout para assinantes Google AI Plus, Pro e Ultra, globalmente, via app Gemini e via Google Flow (a ferramenta de criação audiovisual do Google).
  • Gemini Omni Flash chega de graça no YouTube Shorts Remix e no app YouTube Create (restrito a maiores de 18 anos).

Esse “de graça no YouTube” é estratégico. O Google está colocando geração de vídeo por IA na frente de bilhões de pessoas sem cobrar nada — e ancorando isso na plataforma de vídeo onde o criador brasileiro já vive. Se você produz Shorts, isso muda a equação de produção quase imediatamente. Para entender o conceito por trás disso tudo, vale revisar nosso guia sobre IA multimodal: o que é e como usar. E se você quer começar a criar vídeo com IA agora, nosso tutorial do Google Veo 3.1 mostra o passo a passo na prática.


Gemini Spark: O Agente Pessoal 24/7

O terceiro grande anúncio foi o Gemini Spark, descrito pelo Google como um agente pessoal que “executa ações em seu nome” para navegar sua vida digital. O detalhe importante: ele roda em máquinas virtuais dedicadas no Google Cloud e opera 24 horas por dia, ou seja, trabalha em segundo plano mesmo com seu notebook fechado. Ele é construído sobre o Gemini 3.5 e o Antigravity.

Na prática, o Spark integra Gmail, Docs e outros apps do Workspace, e deve se expandir para ferramentas de terceiros via protocolo MCP ao longo do verão (do hemisfério norte — ou seja, segundo semestre de 2026). O roadmap inclui mandar mensagens e e-mails diretamente, criar subagentes personalizados e até executar pagamentos autorizados com controles de orçamento.

O acesso começou restrito: beta inicial apenas para assinantes Google AI Ultra nos EUA, na semana seguinte ao I/O. Para o Brasil, a chegada será mais lenta — como costuma acontecer com recursos agênticos que mexem com pagamento e dados pessoais. Ainda assim, o Spark é o sinal mais claro de para onde a indústria vai: de “chatbot que responde” para “agente que faz”. Aprofundamos esse movimento na nossa análise sobre agentes de IA autônomos em 2026.


Antigravity e Stitch: As Ferramentas Para Quem Constrói

Para desenvolvedores e designers, o I/O trouxe a evolução de duas plataformas:

  • Antigravity ganhou três formatos: o Antigravity 2.0 (app de desktop para orquestrar múltiplos agentes, agora com comando por voz), o Antigravity CLI (interface de terminal reescrita em Go, mais rápida, para criar agentes na hora) e o Antigravity SDK (acesso programático para construir agentes personalizados; no caso de empresas, dá para conectar direto a projetos no Google Cloud). O Google afirma que tarefas de engenharia que levavam dias agora colapsam em horas ou minutos via colaboração entre subagentes.
  • Stitch, a ferramenta de design do Google, passou a permitir design em tempo real guiado por texto ou voz, e agora importa código e arquivos de design existentes para manter consistência de marca.

Para o ecossistema brasileiro de pequenos estúdios, freelancers e devs solo, essas ferramentas reduzem a barreira de entrada: dá para prototipar produto, design e backend com um time de agentes em vez de um time de pessoas. Não substitui talento — mas multiplica o alcance de quem já tem.


A Mudança de Preço Que Quase Passou Despercebida

No meio dos lançamentos brilhantes, o Google mexeu na estrutura de preços de um jeito que importa:

  • O plano Google AI Ultra passou a ter uma faixa de entrada de US$ 100/mês (com 5x mais uso que o AI Pro e 20 TB de armazenamento). O antigo plano de US$ 250 caiu para US$ 200 com as mesmas capacidades.
  • Mais relevante: o Google está migrando do modelo de “limite diário de prompts” para um modelo de compute consumido, baseado na complexidade do prompt e nas funcionalidades usadas. Os limites se renovam a cada cinco horas até atingir um teto semanal.

Tradução para criadores e profissionais: o custo de usar IA pesada vai ficar mais atrelado ao quanto você realmente consome de processamento. Para uso leve, tende a sobrar. Para quem gera vídeo e roda agentes o dia inteiro, é hora de prestar atenção no consumo — assim como já se faz com nuvem.


O Que Muda Na Prática Para o Brasil

Juntando tudo, o impacto concreto para o público brasileiro se divide em três frentes:

Para usuários comuns. O AI Mode da Busca já roda no 3.5 Flash globalmente, então respostas de IA no Google ficaram mais rápidas e capazes — sem você fazer nada. O app Gemini foi redesenhado (a “Neural Expressive Design”) e já está no ar em Android, iOS e web.

Para criadores. O Gemini Omni Flash de graça no YouTube Shorts e no YouTube Create é o anúncio mais imediato. Geração de vídeo com consistência de personagem, sem custo, na plataforma onde você já publica. Quem souber roteirizar e dirigir a IA vai produzir mais rápido e mais barato. A janela de vantagem é para quem aprender primeiro.

Para empreendedores e devs. O 3.5 Flash via API, a um custo “menor que metade” dos concorrentes e com performance agêntica de ponta, derruba o custo de construir produtos de IA. Antigravity e Stitch encurtam o ciclo de prototipagem. Para quem quer transformar isso em negócio de conteúdo, nosso passo a passo de como criar um blog de IA que rankeia em 2026 continua valendo.


Perguntas Frequentes

O Gemini 3.5 Flash já está disponível no Brasil?

Sim. O 3.5 Flash entrou em disponibilidade geral (GA) no dia do anúncio, acessível via Gemini API no Google AI Studio, Android Studio e Antigravity. Além disso, ele já é o modelo padrão do AI Mode da Busca do Google globalmente — o que inclui o Brasil.

O Gemini Omni é gratuito?

Em parte. O Gemini Omni Flash é gratuito no YouTube Shorts Remix e no app YouTube Create (para maiores de 18 anos). A versão completa do Gemini Omni está sendo liberada para assinantes Google AI Plus, Pro e Ultra, via app Gemini e Google Flow.

O Gemini 3.5 Flash é mesmo melhor que o Gemini 3.1 Pro?

Em benchmarks agênticos e de código, é o que o Google afirma: a empresa diz que o 3.5 Flash supera o 3.1 Pro nesses testes, e divulgou números como Terminal-Bench 2.1 em 76,2%, GDPval-AA em 1656 de Elo e MCP Atlas em 83,6%. A ressalva: esses testes medem “trabalho de agente”, não necessariamente perguntas de pesquisa muito difíceis — para esses casos, o 3.5 Pro, que chega em junho de 2026, deve ser a opção mais forte. Para uma comparação direta entre os modelos de ponta, veja nosso Gemini 3.5 Flash vs GPT-5.5 vs Claude Opus.

Quando o Gemini 3.5 Pro será lançado?

O Google confirmou que o 3.5 Pro já está em uso interno, com rollout planejado para o mês seguinte ao I/O — ou seja, ao longo de junho de 2026. Não há data exata pública até o momento desta edição.

O Gemini Omni entende física de verdade?

O Google demonstrou que o Omni mantém coerência física e narrativa ao editar cenas — objetos se movem e caem de forma plausível, e personagens permanecem consistentes entre cortes. Isso representa um salto sobre geradores anteriores. Vale a transparência: o Google divulgou exemplos práticos e a noção de “entendimento de mundo”, mas não publicou um benchmark fechado e único de física com número exato.

O Gemini Spark já funciona no Brasil?

Ainda não. O beta inicial do Spark ficou restrito a assinantes Google AI Ultra nos EUA na semana seguinte ao I/O. A expansão para terceiros (via MCP) e para outros países deve acontecer ao longo do segundo semestre de 2026.


O Que Acompanhar a Partir de Agora

O Google I/O 2026 deixou claro que a estratégia da empresa é vencer pela distribuição: colocar modelos de ponta dentro da Busca, do Android, do Workspace e do YouTube — onde bilhões de pessoas já estão — em vez de depender de um app isolado. Três coisas valem o monitoramento nas próximas semanas:

  1. O lançamento do Gemini 3.5 Pro (esperado para junho de 2026) e como ele se posiciona contra GPT-5.5 e Claude Opus em raciocínio profundo.
  2. A expansão do Gemini Omni e do Spark para o Brasil, especialmente os recursos de pagamento e integração com apps de terceiros.
  3. O efeito real do novo modelo de cobrança por compute no custo mensal de quem usa IA de forma intensiva.

Para acompanhar as próximas atualizações, assine a newsletter do iabrief — 1 email por semana, sem hype, com o que importa.

Posts Similares

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *