Editorial Geração de Imagem

Krea-2: 12 bilhões de parâmetros, resolução 2K em dois segundos e pesos abertos

A Krea AI liberou os pesos de sua geração de imagens mais avançada — um DiT de 12B com variante Turbo voltada para produção e variante Raw para fine-tuning.

Ponto Zero · 24 de janeiro de 2026

Dois anos atrás, gerar uma imagem fotorrealista de alta resolução levava dezenas de segundos num hardware de consumidor e exigia ajuste cuidadoso de parâmetros. O Krea-2 Turbo faz isso em dois segundos, a 2048 × 2048 pixels, com oito passos de inferência. E os pesos foram publicados no Hugging Face em 22 de junho de 2026, disponíveis para download e modificação.

A Krea AI é conhecida pela interface de geração em tempo real que demonstrou modelos de imagem em situações de uso que a maioria dos laboratórios não mostra publicamente. Liberar os pesos do Krea-2 é uma aposta de posicionamento: a empresa quer que sua infraestrutura de modelo seja a base que outros usam — e que fine-tuners, pesquisadores e integradores construam sobre ela.

DiT de 12 bilhões de parâmetros: o que isso significa

O Krea-2 usa uma arquitetura DiT — Diffusion Transformer — com 12 bilhões de parâmetros. Isso o coloca em escala comparável aos maiores modelos abertos de geração de imagem disponíveis. DiTs substituíram as arquiteturas U-Net dos modelos de difusão originais por transformers, que escalam melhor e permitem contexto mais longo — o que se traduz em melhor coerência entre prompt e imagem gerada.

Os modelos de geração de imagem em escala de 12B são diferentes dos LLMs de 12B em custo de inferência. A geração de imagem exige passar pelos pesos várias vezes (um por passo de difusão), e o Krea-2 Turbo reduz esses passos para oito através de destilação — um processo que treina um modelo "rápido" a imitar o comportamento de um modelo mais lento e preciso, sacrificando um pouco de diversidade por velocidade.

Turbo e Raw: dois modelos para dois propósitos

O lançamento inclui dois checkpoints com funções distintas.

O Krea-2 Turbo é o modelo de produção. Com oito passos e geração em cerca de dois segundos a 2K de resolução em hardware de consumidor, ele foi otimizado para integração em produtos. A licença permite uso comercial gratuito para indivíduos e equipes pequenas.

O Krea-2 Raw é o modelo base, sem a destilação de velocidade. Ele existe para quem quer fazer fine-tuning, treinar LoRAs — adaptadores leves que especializam o modelo em estilo ou domínio sem retreinar os 12B parâmetros inteiros — ou explorar o comportamento sem a compressão imposta pela destilação. Treze adaptadores já estão disponíveis no repositório do modelo.

      Arquitetura: Diffusion Transformer (DiT) com 12 bilhões de parâmetros
Krea-2 Turbo: 8 passos de inferência, geração em ~2s a 2048 × 2048 px
Krea-2 Raw: modelo base não-destilado, voltado para fine-tuning e LoRA
Licença: Krea 2 Community License — comercial gratuito para uso individual e equipes pequenas; Enterprise pago acima de 50 usuários
Disponibilidade: pesos no Hugging Face; código de inferência oficial no GitHub krea-ai/krea-2; integração com Diffusers (pip)

    

O que diferencia de FLUX e Stable Diffusion

O campo de geração de imagem com pesos abertos é dominado pelo FLUX (Black Forest Labs) e pelas versões abertas do Stable Diffusion. Ambos têm ecossistemas maduros de fine-tuning e ferramentas de comunidade. O Krea-2 entra nesse mercado com uma proposta diferente: não é um modelo de pesquisa, é um modelo de produto que a empresa já usa em produção na própria plataforma Krea.ai.

Isso implica que o Krea-2 já passou por iteração em casos de uso real — prompts de usuários comuns, não prompts cuidadosamente ajustados para benchmark. A qualidade em produção e a qualidade em benchmark às vezes divergem bastante; um modelo que a empresa usa para seu próprio serviço comercial tem, em teoria, incentivo para minimizar esse gap.

Por outro lado, o Krea-2 chega sem o ecossistema de ferramentas que FLUX e Stable Diffusion construíram ao longo de anos. LoRAs específicas para estilos ou personagens, pipelines de inpainting, controladores de pose — tudo isso precisa ser construído pela comunidade a partir do zero, sobre o Raw.

A licença comercial e seus limites

A Krea 2 Community License é gratuita para a maioria dos usos: indivíduos, empresas menores, projetos de pesquisa. O limite aparece quando a organização precisa de mais de 50 licenças simultâneas, SSO corporativo, SLAs ou contratos de dados customizados — aí entra o tier Enterprise pago.

Essa estrutura é diferente de licenças verdadeiramente abertas como a MIT ou a Apache 2.0, que o GLM-5.2 e alguns modelos de texto usam. Ela também é mais permissiva do que as licenças "non-commercial only" que muitos modelos de imagem ainda adotam. Para a maioria dos casos de uso, o Krea-2 é efetivamente livre — mas vale ler o texto completo antes de construir um produto sobre ele.

O que falta saber

O modelo foi lançado sem comparativos públicos sistemáticos contra FLUX 2 ou GPT Image 2. A Krea descreve a qualidade em termos qualitativos — prompts de linguagem natural, coerência de estilo, controle de composição — mas não publicou avaliações em benchmarks estabelecidos como o GenAI-Bench ou o HEIM.

A velocidade de dois segundos é impressionante se realmente reproduzível em hardware de consumidor com GPU de médio porte. Testes independentes da comunidade nas próximas semanas vão calibrar se esse número é típico ou é o melhor caso de um conjunto específico de condições.

Perguntas Frequentes

O que é um DiT?

Diffusion Transformer — uma arquitetura que substitui as redes U-Net tradicionais dos modelos de difusão por transformers. A vantagem principal é escalabilidade: transformers escalam melhor com mais parâmetros e dados, produzindo ganhos de qualidade mais previsíveis.

O que é um LoRA?

Low-Rank Adaptation — uma técnica de fine-tuning que treina apenas um conjunto pequeno de parâmetros adicionais, em vez de retreinar o modelo completo. Para um modelo de 12B parâmetros, um LoRA pode ter apenas alguns milhões de parâmetros, tornando o fine-tuning acessível sem hardware de datacenter.

Posso usar o Krea-2 Turbo gratuitamente em um produto comercial?

Sim, para equipes pequenas e indivíduos, conforme a Krea 2 Community License. Organizações com mais de 50 usuários, contratos de SLA ou necessidades de SSO precisam contratar o tier Enterprise.

O Krea-2 funciona com o Stable Diffusion WebUI ou ComfyUI?

O modelo suporta a biblioteca Diffusers do Hugging Face via Krea2Pipeline. Integração nativa com ComfyUI ou Automatic1111 depende de nós ou extensões desenvolvidas pela comunidade — ainda não disponíveis no lançamento.

// relacionados

Krea-2: 12 bilhões de parâmetros, resolução 2K em dois segundos e pesos abertos

DiT de 12 bilhões de parâmetros: o que isso significa

Turbo e Raw: dois modelos para dois propósitos

O que diferencia de FLUX e Stable Diffusion

A licença comercial e seus limites

O que falta saber

Perguntas Frequentes

O que é um DiT?

O que é um LoRA?

Posso usar o Krea-2 Turbo gratuitamente em um produto comercial?

O Krea-2 funciona com o Stable Diffusion WebUI ou ComfyUI?

Leia também

Sol Video Inference Engine: Agent-Native Full-Stack Acceleration Framework for Efficient Video Generation

The Geometry Behind Diffusion and Flow Matching: Gradient Flows and Geodesics in Wasserstein Space

Sesame: Structure-Aware Molecular Generation via Spatial Density-Map Conditioning

Prob-BBDM: a Probabilistic Brownian Bridge Diffusion Model for MRI sequence image-to-image translation