Ideogram 4.0: o primeiro modelo de imagem aberto da empresa vem com uma letra miúda importante
Depois de três versões fechadas, a Ideogram liberou os pesos do seu modelo de geração de imagens — compacto, com renderização de texto no topo do ranking. Mas "aberto" aqui não quer dizer "livre para vender": a licença proíbe uso comercial.
Toda vez que um laboratório de geração de imagens libera pesos abertos, vale a pergunta que a euforia costuma pular: aberto para quê, exatamente? O Ideogram 4.0 é um bom teste para essa pergunta. É o primeiro modelo da Ideogram — até aqui, uma empresa de API fechada, sem histórico de pesos públicos — a sair de portas abertas. E é, ao mesmo tempo, um modelo cuja licença deixa claro que "aberto" não é sinônimo de "livre para qualquer uso".
Da API fechada aos pesos públicos
Fundada em 2022 por ex-pesquisadores do Google Brain e do time do Imagen — Mohammad Norouzi, William Chan, Chitwan Saharia e Jonathan Ho —, a Ideogram construiu reputação em três versões anteriores mantidas inteiramente fechadas, acessíveis só via aplicativo web ou API paga. O Ideogram 4.0, anunciado em 3 de junho de 2026, rompe esse padrão: é treinado do zero (não é um ajuste fino de outro modelo) e disponibilizado com pesos publicados na Hugging Face.
A mudança de estratégia é notável para uma empresa que levantou cerca de US$ 96,5 milhões — US$ 16,5 milhões em seed e US$ 80 milhões em uma rodada série A, em fevereiro de 2024 — com fundos como a16z, Index Ventures, Redpoint e Pear VC.
O que o modelo traz de novo
O Ideogram 4.0 é um Transformer de difusão de fluxo único, com 9,3 bilhões de parâmetros, 34 camadas e mecanismos técnicos como QK-RMSNorm e RoPE multimodal 3D — arquitetura relativamente compacta para os padrões atuais (o FLUX.2 [dev] tem 32 bilhões de parâmetros; o Hunyuan Image v3, um modelo de mistura de especialistas, chega a 80 bilhões). Para interpretar texto e imagem, usa um Qwen3-VL-8B-Instruct congelado como codificador, e para decodificar a imagem final, um decodificador VAE do Flux, também congelado.
Na prática, isso habilita três recursos: prompts estruturados em JSON, que permitem estilizar cada elemento da imagem separadamente; layout explícito por caixas delimitadoras, útil para composições com posição controlada; e condicionamento por paleta de cores. O modelo trabalha nativamente em resolução 2K (de 256 a 2048 pixels) e proporções de até 6:1 — bom o bastante para banners ou peças bem alongadas.
- 9,3 bilhões de parâmetros — compacto frente a modelos rivais de dezenas de bilhões
- 0,97 no benchmark X-Omni de renderização de texto em imagem — o melhor da categoria
- 1.062 pontos ELO em preferência de designers (4.366 votos), atrás do GPT Image 2 (1.141) mas à frente do Nano Banana 2 (1.004) e do FLUX.2 Pro (982)
- Licença "Ideogram 4 Non-Commercial" — pesos públicos, uso comercial vedado por padrão
- Versões quantizadas fp8 e nf4, esta última rodando em uma única GPU de 24 GB
Onde ele se posiciona: bom em texto, não o melhor em tudo
No X-Omni, benchmark que mede a fidelidade da renderização de texto dentro de imagens geradas — um dos pontos historicamente mais fracos de modelos de difusão —, o Ideogram 4.0 pontua 0,97, o melhor resultado entre os modelos avaliados. Já num ranking de preferência de designers, com 4.366 votos comparando sete modelos, ele fica em segundo lugar (1.062 pontos), atrás do GPT Image 2 (1.141) mas à frente de nomes como Nano Banana 2, Grok Imagine, Luma 1.1, FLUX.2 Pro e Hunyuan Image v3 — o que o credencia como o melhor modelo de pesos abertos do grupo, sem ser o melhor do grupo como um todo.
A letra miúda: "aberto" não é "livre para negócio"
Aqui está o ponto que merece ceticismo em vez de comemoração automática: os pesos do Ideogram 4.0 estão publicados e podem ser baixados — mediante aceite de termos e token de acesso na Hugging Face —, mas sob uma licença batizada de "Ideogram 4 Non-Commercial". Ou seja, é um modelo aberto para inspeção, pesquisa e uso pessoal, mas não é, por padrão, livre para uso comercial — uma diferença relevante frente a concorrentes como o Krea-2, cujos pesos abertos permitem uso comercial sem essa restrição.
Isso não invalida o lançamento, mas muda o que "aberto" significa na prática: uma startup que queira construir um produto pago em cima do Ideogram 4.0 não pode simplesmente baixar os pesos e sair vendendo — precisa negociar licenciamento comercial separado, provavelmente via API paga da própria Ideogram.
Onde acessar
O modelo está disponível pelo aplicativo web da Ideogram, por API para desenvolvedores e, para quem quer rodar localmente, pelos pesos publicados na Hugging Face — com checkpoints quantizados que cabem em hardware de consumidor, incluindo uma versão nf4 que roda numa única placa de 24 GB de memória.
Perguntas Frequentes
O Ideogram 4.0 é realmente um modelo aberto?
Os pesos são públicos e podem ser baixados na Hugging Face, mas sob a licença "Ideogram 4 Non-Commercial" — que permite uso pessoal e de pesquisa, mas não uso comercial por padrão. É "aberto" no sentido de pesos acessíveis, não no sentido de licença permissiva para negócio.
Como ele se compara a modelos como FLUX.2 ou Nano Banana 2?
Em um ranking de preferência com 4.366 votos de designers, o Ideogram 4.0 fica atrás apenas do GPT Image 2, superando Nano Banana 2, Grok Imagine, Luma 1.1, FLUX.2 Pro e Hunyuan Image v3 — sendo o melhor colocado entre os modelos de pesos abertos avaliados.
Qual é o diferencial técnico do modelo?
Renderização de texto dentro da imagem, onde atinge a melhor pontuação registrada no benchmark X-Omni, além de suporte a prompts estruturados em JSON, layout por caixas delimitadoras e resolução nativa de até 2K em proporções bem alongadas.
Dá para rodar o Ideogram 4.0 em uma GPU comum?
Sim, na versão quantizada nf4, que roda em uma única GPU de 24 GB — hardware de faixa alta de consumidor, mas bem mais acessível que os clusters normalmente exigidos por modelos de dezenas de bilhões de parâmetros.
O Ideogram 4.0 é, ao mesmo tempo, uma boa notícia e um lembrete de cautela: uma empresa historicamente fechada abrindo os pesos do próprio modelo é um sinal de que a pressão competitiva por abertura está funcionando — mas a licença não comercial é a prova de que "peso aberto" e "uso livre" continuam sendo coisas diferentes, e vale sempre ler a letra miúda antes de construir um produto em cima de qualquer lançamento anunciado como aberto.