Towards Learning Representations of Policies in Two-Player Zero-Sum Imperfect-Information Games
arXiv:2607.01498v1 Announce Type: new Abstract: We investigate the problem of learning useful policy representations (embeddings) in two-player zero-sum imperfect-information games. We make three contributions: First, we introduce methods of creating datasets of policies for a given game. Second, we propose methods to learn policy representations. Third, we introduce downstream tasks to evaluate the effectiveness of such representations. We evaluate each dataset method, embedding method, and dow...
arXiv cs.LG
·Kevin Wang, Kevin Yang, Arjun Prakash, Amy Greenwald
·
// relacionados
Leia também
Blog
AI Security Institute do Reino Unido descobre que benchmarks padrão subestimam sistematicamente o que agentes de IA realmente conseguem fazer
Editorial
NVIDIA abre dataset de 1.700 horas de direção autônoma — e revela onde está o verdadeiro gargalo da IA física
Blog
Leis de escala para busca aproximada de vizinhos mais próximos baseada em grade em altas dimensões
Blog