Blog
Robótica & RL
SPLC: Aprendizado de Preferências Sociais para Navegação de Robôs em Multidões
arXiv:2607.01925v1 Tipo de Anúncio: novo Resumo: O aprendizado por reforço (RL) offline tem um potencial significativo para a navegação de robôs em multidões em aplicações de coexistência entre humanos e robôs. No entanto, a complexidade inerente do movimento dos pedestres torna o projeto de funções de recompensa eficazes para promover comportamentos robóticos socialmente adequados um desafio persistente. Este artigo propõe um algoritmo de Aprendizado de Preferências Sociais para Navegação de Robôs em Multidões (SPLC) para eliminar a necessidade de um projeto detalhado de recompensas. I...
arXiv cs.RO
·Zixuan Chen (Wuhan University of Science,Technology, Wuhan, China), Hao Fu (Wuhan University of Science,Technology, Wuhan, China), Haiwen Hu (Wuhan University of Science,Technology, Wuhan, China), Shiquan Zheng (Wuhan University of Science,Technology, Wuhan, China)
·
// relacionados
Leia também
Editorial
UWORLD U1: a UBTECH lança o primeiro humanoide "ultra-biônico" em série — e a dança que expôs os limites
Blog
Takeda fecha acordo de US$ 600 milhões com a Insilico para descoberta de medicamentos com IA
Blog
Conheça o WebBrain: um agente de navegador com IA de código aberto e local-first que lê páginas e automatiza tarefas no Chrome e no Firefox
Blog