Inteligência artificial, em português.
O radar diário do Hugging Face — papers, modelos e datasets do momento em leitura editorial, sem hype.
As 5 que importam
GPT-5.6 Sol vai rodar a 750 tokens por segundo na Cerebras — e a OpenAI reclama do próprio acordo com o governo
A NVIDIA colou um "gêmeo" de difusão num LLM pronto — e ele ficou 2,42x mais rápido
Um passo errado no início contamina todo o resto: a IA médica que aprendeu a se corrigir cedo
Gerar uma imagem em um único passo — e ainda superar a versão "lenta" do mesmo modelo
Um agente de IA consegue melhorar a própria estratégia com poucas tentativas? Um novo benchmark testa isso
No ar agora
Um agente de IA consegue melhorar a própria estratégia com poucas tentativas? Um novo benchmark testa isso
O EvoPolicyGym mede algo diferente de "o modelo acerta a resposta": mede se um agente consegue refinar, sozinho e dentro de um orçamento limitado de interações, uma política de decisão que já não funciona tão bem. Nos 16 ambientes testados, o GPT-5.5 ficou entre os dois melhores em todos — mas o estudo mostra que saber "quando parar de tentar" importa tanto quanto saber corrigir.
GPT-5.6 Sol vai rodar a 750 tokens por segundo na Cerebras — e a OpenAI reclama do próprio acordo com o governo
Um contrato de mais de US$ 20 bilhões com a Cerebras promete tirar o GPT-5.6 Sol da faixa de 40–120 tokens por segundo típica de GPUs e levá-lo a 750 — quase dez vezes mais rápido. Mas o acesso ao modelo mais capaz da família está sujeito a aprovação caso a caso do governo dos EUA, e a própria OpenAI diz que isso "não deveria virar o padrão".
Gerar uma imagem em um único passo — e ainda superar a versão "lenta" do mesmo modelo
Um time de pesquisadores europeus mostrou que dá para comprimir a geração de imagem por difusão — normalmente dezenas de passos de refinamento — em um único passo, sem perder qualidade. O truque foi descobrir como comparar corretamente duas distribuições de imagens, algo que a área andava fazendo errado.
Um passo errado no início contamina todo o resto: a IA médica que aprendeu a se corrigir cedo
Pesquisadores coreanos identificaram que a maior causa de erro em sistemas de resposta visual médica não é a falta de conhecimento — é um primeiro passo de raciocínio errado que contamina tudo depois. Um novo método de treino, o MRPO, penaliza esses erros iniciais com mais peso e reduziu a taxa de falhas precoces de 64% para 13%.
A NVIDIA colou um "gêmeo" de difusão num LLM pronto — e ele ficou 2,42x mais rápido
O Nemotron-Labs-TwoTower pega um modelo autorregressivo já treinado, congela-o e acopla uma segunda rede que aprende a "adivinhar" blocos inteiros de texto de uma vez. O resultado: throughput 2,42 vezes maior mantendo 98,7% da qualidade original — treinando apenas a peça nova, com uma fração do orçamento de dados do modelo base.
CVE-2026-LGTM
A história (quase) real de dois agentes de code review que só queriam aprovar um ao outro. Um curta sobre o que acontece quando a frota inteira sabe produzir aprovação — e nenhum membro dela tem o direito de dizer não.
2min29 · trilha: “The Complex” — Kevin MacLeod (incompetech.com) · CC BY 4.0
Navegue por campo de IA
Cada modalidade reúne os guias e o radar de notícias daquele território — de LLMs a robótica.
Coletamos do Hugging Face
Papers diários, modelos e datasets em alta e o blog oficial — direto da API, atualizados todos os dias.
Organizamos por modalidade
Cada item é classificado por campo de IA — LLMs, visão, áudio, multimodal — para você navegar pelo que interessa.
Traduzimos em editorial
Leitura em português, com contexto e guias que explicam a fundo — sem o ruído e sem o hype.
Comece a entender IA de verdade
Explore os guias para a base sólida, ou mergulhe no radar para o que está acontecendo agora.