Nano Banana 2 Lite: o Google aposta na velocidade — e estreia vídeo por comando de texto
O Google lançou em 30 de junho uma versão enxuta do Nano Banana 2 que gera imagens em quatro segundos por menos de meio centavo de dólar cada — e o Gemini Omni Flash, que transforma essas imagens em vídeo de dez segundos editável por linguagem natural.
Toda corrida de geração de imagem por IA chegou a um ponto em que a qualidade do modelo de ponta já convence. O que ainda separa um protótipo de um produto em produção é outra coisa: quanto custa gerar mil imagens, e quanto tempo o usuário espera olhando para uma barra de carregamento. Foi nesse eixo — velocidade e custo, não qualidade máxima — que o Google decidiu competir em 30 de junho de 2026, com o lançamento simultâneo do Nano Banana 2 Lite e do Gemini Omni Flash.
O que o Nano Banana 2 Lite realmente troca
Tecnicamente batizado de Gemini 3.1 Flash-Lite Image, o modelo é a versão enxuta do Nano Banana 2 lançado em fevereiro. A promessa central: texto vira imagem em cerca de quatro segundos, a um custo de US$ 0,034 por mil imagens em resolução 1K — uma fração do preço da variante Pro. O Google recomenda o Lite como substituto direto do Nano Banana original (Gemini 2.5 Flash Image), não como uma opção "menor" para casos secundários.
A parte que costuma quebrar em modelos otimizados para velocidade é justamente onde o Google diz ter segurado a qualidade: aderência ao prompt, consistência de personagem entre gerações e texto legível dentro da imagem — para pôsteres, diagramas, capas. Avaliações internas por Elo (pontuação relativa entre modelos em comparações par a par, feitas por humanos) colocam o Lite competindo de perto com a variante Pro em geração texto-para-imagem, apesar do corte de custo.
- Nano Banana 2 Lite: ~4s por imagem · US$ 0,034/mil imagens (1K) · substitui o Nano Banana original.
- Gemini Omni Flash: vídeos de até 10s · US$ 0,10 por segundo gerado.
- Disponibilidade: Google AI Studio, Gemini API, Gemini Enterprise, e rollout em AI Mode, Gemini app, NotebookLM, Google Photos, Stitch, Flow e Google Ads.
Gemini Omni Flash: edição de vídeo por conversa
A segunda metade do anúncio é o Gemini Omni Flash, um modelo multimodal que aceita texto, imagem e vídeo como entrada e devolve vídeo — editável em linguagem natural, sem timeline nem software de edição. O pitch do Google é "edição conversacional de vídeo": pedir para trocar o fundo, sincronizar texto e gráficos com a ação em cena, ou ajustar um plano específico, tudo por comando escrito.
Os clipes saem em blocos de 10 segundos — o Google promete durações maiores "em breve" — a US$ 0,10 por segundo de saída. É um modelo de precificação que favorece iteração rápida e barata sobre produção de peça longa pronta.
As limitações que o próprio Google reconhece
Nem tudo funciona ainda. Referências de áudio e extensão de cena não são suportadas na API. O processamento de vídeo como referência aceita até três segundos, mas de forma incompleta. E a consistência de personagem entre trocas de cena — um problema recorrente em geração de vídeo por IA — segue como área de melhoria reconhecida pelo próprio Google, não escondida em letra miúda.
Por que a disputa migrou para custo por unidade
Quando toda a categoria de modelos de imagem já produz resultados convincentes, a métrica que decide adoção em produto deixa de ser "quão bonita é a imagem" e passa a ser "quantas imagens dá para gerar por dólar, e com que latência". Nano Banana 2 Lite e Gemini Omni Flash são, nesse sentido, menos sobre uma nova capacidade e mais sobre tornar geração de mídia barata o suficiente para rodar dentro de um pipeline de produto — anúncio, catálogo, thumbnail — em vez de ficar restrita a um caso de uso único e caro.
Perguntas Frequentes
Nano Banana 2 Lite substitui o Nano Banana 2 padrão?
Não — ele substitui o Nano Banana original (Gemini 2.5 Flash Image) como opção de entrada. A versão Pro do Nano Banana 2, lançada em fevereiro de 2026, continua disponível para quem prioriza qualidade máxima sobre custo e velocidade.
O Gemini Omni Flash gera vídeo do zero, só com texto?
Sim, mas também aceita imagem e vídeo como entrada para manter controle de cena. Os vídeos saem em blocos de 10 segundos, editáveis por comando em linguagem natural.
Onde já dá para usar esses modelos?
Google AI Studio, Gemini API e Gemini Enterprise Agent Platform desde já; o rollout para consumidor já chegou a AI Mode na Busca, app Gemini, NotebookLM, Google Photos, Stitch, Google Flow e Google Ads.