Paper Dados & Embeddings Robótica & RL

MemLearner: Learning to Query Context memory for Video World Models

MemLearner improves video world models by using learning-based adaptive context querying with query tokens to enhance scene consistency and memory in long video sequences with occl…

Hugging Face · Daily Papers ·Jiwen Yu, Jianxiong Gao · 30 de janeiro de 2026 ·▲ 18 upvotes

Este artigo está em destaque na seleção diária de papers do Hugging Face, curada pela comunidade de pesquisa em IA.

Autores: Jiwen Yu, Jianxiong Gao, Jianhong Bai, Yiran Qin, Kaiyi Huang, Quande Liu

18 upvotes da comunidade
Temas: video world models, context frame retrieval, query tokens, video generation model, visual priors, multi-dataset training strategy

Resumo

Resumo original (em inglês), extraído do paper:

MemLearner improves video world models by using learning-based adaptive context querying with query tokens to enhance scene consistency and memory in long video sequences with occlusions and dynamic objects.

Onde ler

Ver no Hugging Face

// relacionados

MemLearner: Learning to Query Context memory for Video World Models

Resumo

Onde ler

Leia também

Using Lift to Turn Research PDFs into Structured JSON with Controlled, Schema-Guided Field-Level Evaluation

SpaceX shows investors a slim AI smartphone prototype powered by xAI technology

google/tabfm-1.0.0-pytorch

Hidden code in Claude Code secretly flagged Chinese users