Paper Robótica & RL

Optimizing Visual Generative Models via Distribution-wise Rewards

A novel reinforcement learning framework for visual generation uses distribution-wise rewards to improve image diversity and quality while addressing mode collapse and computationa…

Hugging Face · Daily Papers ·Ruihang Li, Mengde Xu · 02 de janeiro de 2026 ·▲ 12 upvotes

Este artigo está em destaque na seleção diária de papers do Hugging Face, curada pela comunidade de pesquisa em IA.

Autores: Ruihang Li, Mengde Xu, Shuyang Gu, Leigang Qu, Fuli Feng, Han Hu

12 upvotes da comunidade
Temas: reinforcement learning, generative models, distribution-wise rewards, reward hacking, mode collapse, sample-wise reward functions

Resumo

Resumo original (em inglês), extraído do paper:

A novel reinforcement learning framework for visual generation uses distribution-wise rewards to improve image diversity and quality while addressing mode collapse and computational efficiency issues.

Onde ler

Ver no Hugging Face

// relacionados

Optimizing Visual Generative Models via Distribution-wise Rewards

Resumo

Onde ler

Leia também

UWORLD U1: a UBTECH lança o primeiro humanoide "ultra-biônico" em série — e a dança que expôs os limites

Takeda fecha acordo de US$ 600 milhões com a Insilico para descoberta de medicamentos com IA

Conheça o WebBrain: um agente de navegador com IA de código aberto e local-first que lê páginas e automatiza tarefas no Chrome e no Firefox

CoRe: Recompensas Combinadas com Feedback de Modelo de Visão-Linguagem para Aprendizado por Reforço Alinhado a Preferências