Coletar dados de robô é trabalho sujo — a XDOF levantou US$ 70 milhões para fazer isso em escala
A startup XDOF, fundada por criadores do sistema de teleoperação de baixo custo GELLO, liberou o ABC-130k: mais de 130 mil episódios de manipulação com dois braços, gravados em estações próprias e abertos sob licença Apache 2.0.
Toda política de manipulação robótica que impressiona numa demonstração — um braço dobrando roupa, encaixando uma peça, entregando um objeto ao outro braço — foi treinada em cima de dados que alguém teve que coletar fisicamente, robô por robô, tarefa por tarefa, hora por hora. É trabalho manual, caro e nada glamouroso. A XDOF, startup de infraestrutura de dados para robótica, saiu do modo furtivo em 17 de junho de 2026 com uma aposta: profissionalizar exatamente essa parte do processo — e provar isso com um dataset aberto de mais de 130 mil episódios.
Quem é a XDOF
Fundada em outubro de 2024 por Philipp Wu e Fred Shentu, com Nemo Jin como diretor de operações, a XDOF (o nome vem de "degrees of freedom", graus de liberdade) tem cerca de 60 funcionários e já soma perto de 20 clientes, incluindo laboratórios de IA de ponta. Wu e Shentu não são estreantes no tema: antes da XDOF, os dois construíram o GELLO, um sistema de teleoperação de baixo custo que virou referência acadêmica para coletar demonstrações de robôs sem depender de hardware caro.
A empresa levantou US$ 70 milhões de fundos como a16z, Lux Capital, Spark Capital, Thrive Capital e WndrCo — um valor alto para uma companhia cujo produto principal é, em essência, gente teleoperando braços robóticos com disciplina e instrumentação de qualidade.
O que tem dentro do ABC-130k
O dataset reúne dados de teleoperação bimanual — dois braços de seis graus de liberdade com garras paralelas — coletados em estações batizadas de "YAM". No total, entre 130 mil e 135 mil episódios, cobrindo 195 tarefas de manipulação distintas: pegar-e-colocar, dobrar tecido, entregar objetos entre braços, inserir peças, usar ferramentas e montar componentes. São cerca de 3.500 horas de gravação e 22,1 terabytes de dados, capturados por uma câmera superior mais duas câmeras de pulso, além de estado das juntas e abertura da garra.
Cerca de um terço dos episódios — pouco mais de 43 mil — já vem com anotações de subtarefa, o que facilita treinar políticas que precisam entender etapas dentro de uma tarefa maior, não só o início e o fim. O pacote também inclui 400 horas adicionais de teleoperação simulada, para quem quer complementar dados reais com dados sintéticos mais baratos de gerar.
- ~130 mil episódios de teleoperação bimanual
- 195 tarefas de manipulação distintas
- ~3.500 horas de gravação, 22,1 TB de dados
- 43 mil episódios (33%) com anotação de subtarefa
- 400 horas extras de teleoperação simulada
- Licença Apache 2.0 para dados e código, acesso mediante termos na Hugging Face
Por que isso é mais que "mais um dataset"
O ABC-130k é o material de acompanhamento de um artigo de pesquisa assinado por Arthur Allshire, Philipp Wu, Angjoo Kanazawa e colaboradores — numa colaboração que atravessa UC Berkeley, Carnegie Mellon, MIT e o time FAR (Frontier AI & Robotics) da Amazon —, intitulado "Scalable Behavior Cloning with Open Data, Training, and Evaluation". A proposta central não é só liberar dados, é liberar o pacote inteiro: dados, configuração de hardware, código de treinamento (um Transformer de difusão batizado ABC-DiT) e protocolo de avaliação — tudo aberto, para que outros grupos possam reproduzir os resultados e comparar seus próprios métodos numa base comum.
Isso ataca um problema real e crônico da pesquisa em manipulação robótica: cada laboratório costuma coletar seus próprios dados, com seu próprio hardware e protocolo, o que torna quase impossível comparar dois métodos de forma justa. Um dataset grande, aberto e acompanhado de código de treino e avaliação padronizados reduz essa fragmentação.
Onde ele se encaixa no mapa de dados abertos de robótica
Vale calibrar a expectativa: chamar o ABC-130k de "o maior dataset aberto" exige uma ressalva. Ele é, com boa margem, o maior dataset de teleoperação bimanual coletado por um único time com protocolo consistente. Mas datasets como o Open X-Embodiment (mais de 2 milhões de trajetórias, 22 tipos de robô diferentes) ou o DROID (76 mil trajetórias, 350 horas) têm escopo diferente — mais heterogêneo, com múltiplas fontes e robôs. Comparar "maior" entre eles depende do que se está medindo: volume bruto, consistência de protocolo, ou diversidade de hardware.
Disponibilidade ainda em etapas
O lançamento não veio tudo de uma vez: a XDOF liberou primeiro um subconjunto de amostra, depois os dados simulados no fim de junho, com o release completo previsto para o fim de julho de 2026. Quem quiser acessar precisa aceitar os termos de uso e gerar um token na Hugging Face — o dataset é gated, não é download livre imediato.
Perguntas Frequentes
O que significa "130k" no nome do dataset?
Refere-se a aproximadamente 130 mil episódios (trajetórias) de teleoperação — sessões gravadas de um robô bimanual sendo controlado remotamente por um humano para executar uma tarefa específica.
O ABC-130k é realmente o maior dataset de robótica aberto que existe?
É o maior dataset de teleoperação bimanual coletado por um único time com protocolo consistente, segundo os próprios autores. Datasets mais amplos como Open X-Embodiment somam mais trajetórias no total, mas agregam dados de múltiplas fontes e tipos de robô diferentes — a comparação depende do critério usado.
Quem pode usar o dataset e para quê?
Está sob licença Apache 2.0, majoritariamente voltado a pesquisadores e empresas que treinam políticas de manipulação robótica por clonagem de comportamento (behavior cloning) — a técnica de ensinar um robô a partir de demonstrações humanas gravadas, em vez de tentativa e erro.
A XDOF vende hardware de robô?
Não é o foco da empresa. A XDOF se posiciona como infraestrutura de dados para robótica — coleta, organiza e padroniza dados de teleoperação para laboratórios de IA que precisam desse insumo para treinar seus próprios modelos.
O ABC-130k não é uma novidade de modelo nem de arquitetura — é uma aposta em que o gargalo real da robótica generalista, hoje, não é falta de algoritmo, é falta de dado bom, padronizado e em volume. Se a aposta da XDOF se confirmar, o próximo salto visível em robôs manipuladores pode vir menos de um paper de arquitetura e mais de alguém disposto a fazer, em escala, o trabalho sujo de gravar milhares de horas de um braço robótico dobrando roupa.