Blog Robótica & RL

SPLC: Aprendizado de Preferências Sociais para Navegação de Robôs em Multidões

arXiv:2607.01925v1 Tipo de Anúncio: novo Resumo: O aprendizado por reforço (RL) offline tem um potencial significativo para a navegação de robôs em multidões em aplicações de coexistência entre humanos e robôs. No entanto, a complexidade inerente do movimento dos pedestres torna o projeto de funções de recompensa eficazes para promover comportamentos robóticos socialmente adequados um desafio persistente. Este artigo propõe um algoritmo de Aprendizado de Preferências Sociais para Navegação de Robôs em Multidões (SPLC) para eliminar a necessidade de um projeto detalhado de recompensas. I...

arXiv cs.RO ·Zixuan Chen (Wuhan University of Science,Technology, Wuhan, China), Hao Fu (Wuhan University of Science,Technology, Wuhan, China), Haiwen Hu (Wuhan University of Science,Technology, Wuhan, China), Shiquan Zheng (Wuhan University of Science,Technology, Wuhan, China) · 03 de janeiro de 2026

Ver no Hugging Face

// relacionados

SPLC: Aprendizado de Preferências Sociais para Navegação de Robôs em Multidões

Leia também

UWORLD U1: a UBTECH lança o primeiro humanoide "ultra-biônico" em série — e a dança que expôs os limites

Takeda fecha acordo de US$ 600 milhões com a Insilico para descoberta de medicamentos com IA

Conheça o WebBrain: um agente de navegador com IA de código aberto e local-first que lê páginas e automatiza tarefas no Chrome e no Firefox

CoRe: Recompensas Combinadas com Feedback de Modelo de Visão-Linguagem para Aprendizado por Reforço Alinhado a Preferências