1118 no radar · 31 guias

Inteligência
artificial, em português.

O radar diário de IA, direto do Hugging Face: papers em alta, modelos e datasets do momento — traduzidos em leitura editorial e guias que explicam o que de fato importa.

// radar

No ar agora

Blog LLMs & Texto

Amazon ups India bet with fresh $13B AI infrastructure investment

Amazon’s latest India investment comes as global tech companies race to expand AI infrastructure in the country.

25.06.2026 · TechCrunch AI
Editorial Visão Computacional

Unlimited-OCR: o modelo da Baidu que lê o livro inteiro de uma vez — e mantém o KV cache constante

Com apenas 500M de parâmetros ativos e uma atenção deslizante inédita, o Unlimited-OCR elimina o chunking de documentos — e acumula 1,8 mil estrelas no GitHub em menos de 24 horas de abertura.

Editorial Multimodal

JoyAI-VL-Interaction: o primeiro modelo aberto que assiste, decide quando falar e delega

O JoyAI-VL-Interaction é um modelo de 8B que assiste vídeo continuamente, resolve sozinho se deve falar ou ficar em silêncio, e passa problemas difíceis para um modelo secundário — com receita de treinamento, dados e código publicados.

Editorial Áudio & Voz

LTX-2: o primeiro modelo fundacional de vídeo e áudio em conjunto — aberto, com 19B de parâmetros

O LTX-2 abandona a abordagem de gerar vídeo e áudio separadamente: um transformer de duplo fluxo aprende ambos ao mesmo tempo, produzindo conteúdo audiovisual sincronizado de ponta.

Editorial LLMs & Texto

Jalapeño: a OpenAI projeta seu primeiro chip de inferência — e usou IA para fazer isso em 9 meses

Em parceria com a Broadcom, a OpenAI revelou seu primeiro processador dedicado a LLMs — um ASIC de inferência em TSMC 3nm com oito stacks de HBM, desenhado em tempo recorde com ajuda dos próprios modelos da empresa.

// modalidades

Navegue por campo de IA

Cada modalidade reúne os guias e o radar de notícias daquele território — de LLMs a robótica.

LLMs & Texto

Modelos de linguagem, agentes, raciocínio e o estado da arte em texto.

guia completo

LLMs: Como Funcionam os Modelos de Linguagem

Geração de Imagem

Difusão, text-to-image e vídeo: como as máquinas aprenderam a criar.

guia completo

Geração de Imagem: O Guia dos Modelos de Difusão

Visão Computacional

Detecção, segmentação e percepção visual — a IA que enxerga.

guia completo

Visão Computacional: Como a IA Enxerga

Áudio & Voz

Reconhecimento de fala, síntese de voz e geração de áudio.

guia completo

Áudio & Voz: Reconhecimento e Síntese de Fala

Multimodal

Modelos que cruzam texto, imagem, áudio e vídeo no mesmo raciocínio.

guia completo

IA Multimodal: Modelos que Veem, Leem e Ouvem

Dados & Embeddings

Embeddings, busca semântica, RAG e os datasets que treinam tudo.

guia completo

Embeddings & RAG: A Memória das IAs

Robótica & RL

Aprendizado por reforço, agentes embarcados e IA que age no mundo.

guia completo

Robótica & Aprendizado por Reforço

01

Coletamos do Hugging Face

Papers diários, modelos e datasets em alta e o blog oficial — direto da API, atualizados todos os dias.

02

Organizamos por modalidade

Cada item é classificado por campo de IA — LLMs, visão, áudio, multimodal — para você navegar pelo que interessa.

03

Traduzimos em editorial

Leitura em português, com contexto e guias que explicam a fundo — sem o ruído e sem o hype.

Comece a entender IA de verdade

Explore os guias para a base sólida, ou mergulhe no radar para o que está acontecendo agora.