684 no radar · 31 guias

Inteligência
artificial, em português.

O radar diário de IA, direto do Hugging Face: papers em alta, modelos e datasets do momento — traduzidos em leitura editorial e guias que explicam o que de fato importa.

// radar

No ar agora

Blog LLMs & Texto

Oracle’s 21,000 layoffs help drive its debt-fueled AI investments

Oracle is spending billions on data center infrastructure to support AI.

23.06.2026 · Ars Technica AI
Blog Dados & Embeddings

Datalab Releases lift: A 9B Open-Weights Vision Model That Extracts Structured JSON From PDFs Using Schemas

Datalab released lift, a 9B open-weights vision model that turns PDFs and images into schema-matching JSON. It uses schema-constrained decoding for valid structure and trained abstention to return null instead of hallucinating absent fields, scoring 90.2% field accuracy on a 225-document benchmark. The post Datalab Releases lift: A 9B Open-Weights Vision Model That Extracts Structured JSON From PDFs Using Schemas appeared first on MarkTechPost .

Blog Áudio & Voz

How to Use NVIDIA Canary-1B-v2 for ASR, Translation, and Automatic SRT Subtitle Export in Python

In this tutorial, we build a multilingual ASR and speech translation pipeline with NVIDIA Canary-1B-v2. We load the model on a GPU-enabled runtime, prepare audio into 16 kHz mono, and run English ASR. We then translate speech into French, German, Spanish, and Italian, and extract word and segment timestamps. We export translated subtitles as an SRT file, test long-form transcription, run batch processing, and benchmark inference speed. The post How to Use NVIDIA Canary-1B-v2 for ASR, Translation...

Blog Geração de Imagem

Anthropic’s Claude Tag is learning your company, one Slack message at a time

Anthropic’s new Claude Tag brings an always-on AI teammate to Slack. But beyond productivity, the feature is a strategic play to capture organizational context, institutional knowledge, and enterprise workflows.

Blog LLMs & Texto

How GPT-5 helped immunologist Derya Unutmaz solve a 3-year-old mystery

GPT-5 Pro helped solve a 3-year-old immunology mystery, offering insights into T cell behavior. The breakthrough could support cancer and autoimmune research.

// modalidades

Navegue por campo de IA

Cada modalidade reúne os guias e o radar de notícias daquele território — de LLMs a robótica.

LLMs & Texto

Modelos de linguagem, agentes, raciocínio e o estado da arte em texto.

guia completo

LLMs: Como Funcionam os Modelos de Linguagem

Geração de Imagem

Difusão, text-to-image e vídeo: como as máquinas aprenderam a criar.

guia completo

Geração de Imagem: O Guia dos Modelos de Difusão

Visão Computacional

Detecção, segmentação e percepção visual — a IA que enxerga.

guia completo

Visão Computacional: Como a IA Enxerga

Áudio & Voz

Reconhecimento de fala, síntese de voz e geração de áudio.

guia completo

Áudio & Voz: Reconhecimento e Síntese de Fala

Multimodal

Modelos que cruzam texto, imagem, áudio e vídeo no mesmo raciocínio.

guia completo

IA Multimodal: Modelos que Veem, Leem e Ouvem

Dados & Embeddings

Embeddings, busca semântica, RAG e os datasets que treinam tudo.

guia completo

Embeddings & RAG: A Memória das IAs

Robótica & RL

Aprendizado por reforço, agentes embarcados e IA que age no mundo.

guia completo

Robótica & Aprendizado por Reforço

01

Coletamos do Hugging Face

Papers diários, modelos e datasets em alta e o blog oficial — direto da API, atualizados todos os dias.

02

Organizamos por modalidade

Cada item é classificado por campo de IA — LLMs, visão, áudio, multimodal — para você navegar pelo que interessa.

03

Traduzimos em editorial

Leitura em português, com contexto e guias que explicam a fundo — sem o ruído e sem o hype.

Comece a entender IA de verdade

Explore os guias para a base sólida, ou mergulhe no radar para o que está acontecendo agora.