Editorial Multimodal

Project Genie: o Google abriu seu gerador de mundos ao público — e a corrida ficou cara

Alimentado pelo Genie 3, o protótipo cria ambientes 3D navegáveis a partir de um prompt de texto. Funciona bem quando o pedido é uma fantasia em aquarela; tropeça quando tenta ser realista — e chega ao mercado no mesmo mês em que rivais levantaram mais de US$ 1 bilhão para brigar pela mesma categoria.

Ponto Zero · 30 de janeiro de 2026

Em 29 de janeiro de 2026, o Google começou a liberar o Project Genie para assinantes do Google AI Ultra nos Estados Unidos. A promessa é direta: descreva um lugar, e o modelo constrói um mundo em três dimensões que você explora em tempo real, quadro a quadro — não um vídeo pronto, mas um ambiente que se gera conforme você anda por ele. É a primeira vez que o público comum encosta a mão num world model (modelo de mundo) de ponta, tecnologia até então trancada em laboratórios de pesquisa.

O motor por trás é o Genie 3, anunciado pela DeepMind em agosto de 2025. O que muda agora não é o modelo — é a porta de entrada. E o momento não podia ser mais competitivo: no mesmo semestre em que o Google finalmente abriu seu produto, dois concorrentes bem financiados levantaram juntos mais de um bilhão de dólares para brigar pela mesma ideia.

O que exatamente o Genie 3 faz

Um world model não gera um clipe de vídeo do início ao fim — ele gera o próximo instante do mundo em resposta ao que você faz agora, como um motor de jogo que inventa o cenário conforme a câmera se move. O Genie 3 roda a 720p e 24 quadros por segundo em tempo real, mantendo o ambiente coerente por alguns minutos, com uma espécie de memória visual que consegue "lembrar" do que existia há cerca de um minuto atrás — se você voltar a um ponto por onde já passou, o cenário costuma continuar lá.

A própria DeepMind descreve o Genie 3 como o primeiro modelo da família a permitir interação em tempo real, melhorando consistência e realismo em relação ao Genie 2. No laboratório, o recurso mais chamativo são os "promptable world events" — a possibilidade de alterar o mundo já em andamento via texto, mudando o clima ou inserindo um objeto novo sem reiniciar a simulação. É um recurso de pesquisa: ainda não chegou à versão que o público usa.

O que o Project Genie realmente entrega hoje

O produto público é mais modesto que a demonstração de laboratório. Ele oferece três modos — esboçar um mundo a partir de texto e imagem, explorá-lo navegando livremente, e remixar um mundo já criado, com opção de baixar o vídeo da exploração. Cada sessão tem um limite duro de 60 segundos, imposto pelo custo computacional de gerar cada quadro em tempo real. Os "promptable world events" que impressionam nas demos internas da DeepMind não estão disponíveis nesta primeira leva.

      Lançamento: 29 de janeiro de 2026, para assinantes Google AI Ultra nos EUA (18+).
Tecnologia: Genie 3 + Nano Banana Pro + Gemini.
Especificações: 720p, 24fps, sessões de até 60 segundos.
Preço de acesso: assinatura Google AI Ultra, a partir de US$ 100/mês (tier de entrada) ou US$ 200/mês (tier completo).
Limitações reconhecidas pelo Google: texto renderiza mal, geografia real é imprecisa, controle de personagem tem latência perceptível, múltiplos agentes independentes não são bem modelados.

    

O resultado prático, segundo quem já testou, segue um padrão claro: prompts estilizados — um castelo de massinha com torres de marshmallow, uma floresta em traço de anime, uma paisagem em aquarela — saem surpreendentemente bem. Já os pedidos fotorrealistas decepcionam, produzindo algo mais parecido com gráfico de videogame datado do que com a cena "quase real" que a demonstração sugeria. A tecnologia ainda entrega fantasia com mais consistência do que realidade.

Por que isso não é só um brinquedo

Mundos gerados sob demanda têm uso além do entretenimento. Robótica é o caso mais citado: treinar um agente físico em ambientes simulados infinitos e variados é mais barato e mais seguro do que testar no mundo real repetidamente. Simulação para treino de outros modelos de IA, prototipagem rápida de cenários para jogos e design, e educação — visitar reconstruções interativas de lugares ou situações — completam a lista de aplicações que a própria indústria aponta como horizonte, ainda que nenhuma delas esteja madura na versão pública de hoje.

A corrida ficou cara — e o Google não está sozinho

O que dá contexto à chegada do Project Genie é o dinheiro que está entrando na categoria de world models em 2026. A World Labs, fundada pela pesquisadora Fei-Fei Li, levantou US$ 1 bilhão em uma rodada seed em fevereiro — só a Autodesk entrou com US$ 200 milhões — e já vende seu produto, o Marble, com planos de graça a US$ 95 por mês, mirando fluxos de trabalho criativos e de design. A Odyssey fechou uma Series B de US$ 310 milhões em 17 de junho, avaliada em US$ 1,45 bilhão, com Amazon Web Services e AMD Ventures entre os investidores; seu modelo Odyssey-2 Pro já faz streaming a 720p e cerca de 22fps.

A lista de concorrentes não para aí: Nvidia tem o Cosmos, de código aberto; a Wayve constrói modelos de mundo voltados a direção autônoma; a Physical Intelligence foca só em modelos de fundação para robôs. O argumento a favor do Google é ter capacidade computacional que nenhuma dessas startups consegue igualar. O contra-argumento é que, apesar disso, o produto que chegou ao público em janeiro ainda esbarra em limites de 60 segundos e falha justamente onde o realismo importa mais.

O que vem a seguir

A pergunta que separa hype de tecnologia madura, aqui, é simples: o limite de 60 segundos e a fragilidade em cenas realistas são um gargalo de custo — que cai com mais eficiência de modelo e mais GPU — ou um limite estrutural de como esses sistemas geram cada quadro sem perder a coerência do conjunto? Por enquanto, a resposta é a segunda leitura: o Google, a DeepMind e os concorrentes bem financiados estão todos apostando que é a primeira.

Perguntas Frequentes

Genie 3 e Project Genie são a mesma coisa?

Não. Genie 3 é o modelo de mundo da DeepMind, anunciado em agosto de 2025. Project Genie é o produto público construído sobre ele, liberado em janeiro de 2026 para assinantes do Google AI Ultra — com menos recursos do que as demonstrações internas do modelo mostram.

Preciso pagar para usar o Project Genie?

Sim. O acesso exige assinatura do Google AI Ultra, cujos planos custam US$ 100 ou US$ 200 por mês após a reestruturação anunciada no Google I/O 2026. Não há versão avulsa ou gratuita do produto.

Dá para usar isso para treinar robôs hoje?

Ainda não na versão pública. Treinar robôs em ambientes simulados é o caso de uso mais citado para modelos de mundo como o Genie 3, mas o Project Genie, como está disponível agora, é voltado a exploração e criação por texto — sem os recursos de pesquisa (como os "promptable world events") que tornariam isso viável em escala.

O Google está sozinho nessa corrida?

Longe disso. Em 2026, a World Labs (de Fei-Fei Li) levantou US$ 1 bilhão e a Odyssey levantou US$ 310 milhões, ambas vendendo produtos concorrentes de geração de mundos. Nvidia, Wayve e Physical Intelligence também têm modelos de mundo voltados a nichos como robótica e direção autônoma.

// relacionados

Project Genie: o Google abriu seu gerador de mundos ao público — e a corrida ficou cara

O que exatamente o Genie 3 faz

O que o Project Genie realmente entrega hoje

Por que isso não é só um brinquedo

A corrida ficou cara — e o Google não está sozinho

O que vem a seguir

Perguntas Frequentes

Genie 3 e Project Genie são a mesma coisa?

Preciso pagar para usar o Project Genie?

Dá para usar isso para treinar robôs hoje?

O Google está sozinho nessa corrida?

Leia também

Auditing Generalization in AI-Generated Video Detection: A Six-Control Protocol and the VidAudit Toolkit

3D HAMSTER: Bridging Planning and Control in Hierarchical Vision Language Action Models through 3D Trajectory Guidance

Dense Structural Priors for Sparse Functional Landmark Localization in Surgical Videos

Building a Multimodal Dataset of Academic Paper for Keyword Extraction