Editorial LLMs & Texto

O fantasma do Fable 5: banido, o modelo vive nos datasets que o destilam

Suspenso globalmente por controle de exportação em 22 de junho, o modelo de fronteira da Anthropic sobrevive como rastros de agente em datasets abertos — e já treina uma ninhada de modelos destilados que ninguém precisa pedir autorização para usar.

Ponto Zero ·

Em 22 de junho, o Claude Fable 5 deixou de existir para o público. Uma diretriz de controle de exportação dos Estados Unidos, baixada dias após o lançamento, barrou o acesso ao modelo por qualquer pessoa de fora do país — e a Anthropic suspendeu o preview globalmente. O modelo mais capaz da empresa virou, da noite para o dia, um produto que quase ninguém pode mais tocar.

Só que um modelo de linguagem não é só os seus pesos. É também tudo o que ele já disse. E enquanto o Fable 5 saía do ar, milhares de conversas suas — sessões inteiras de agente resolvendo tarefas de código, usando ferramentas, planejando e corrigindo — já tinham sido capturadas, limpas e publicadas como datasets abertos no Hugging Face. O modelo foi banido; os seus rastros, não.

O que é um "rastro de agente"

Quando um modelo trabalha como agente, ele não só responde: ele age. Lê um arquivo, roda um comando, vê o erro, decide o próximo passo. A sequência completa desses passos — o que pensou, qual ferramenta chamou, o que recebeu de volta, como corrigiu — é o rastro (em inglês, trace). É a diferença entre ter a resposta de uma prova e ter a folha de rascunho com todas as contas.

Esses rascunhos são ouro para treinar outros modelos. O dataset Glint-Research/Fable-5-traces — 38 mil downloads, auditado em 19 de junho, três dias antes do banimento — descreve a si mesmo como "um corpus compacto e de alto sinal de rastros do agente de código Fable 5", convertido para um formato padrão de sessões de agente, pronto para "aprendizado de política de uso de ferramentas e destilação de raciocínio e ação". Ao lado dele há o armand0e/claude-fable-5-claude-code e um Complete-FABLE.5-traces-2M, que se anuncia como dois milhões de trajetórias.

  • Fable 5 suspenso globalmente em 22/06 por diretriz de controle de exportação dos EUA — acesso barrado a qualquer estrangeiro.
  • Glint-Research/Fable-5-traces: 38 mil downloads, rastros de agente de código auditados em 19/06.
  • Complete-FABLE.5-traces-2M: corpus que reivindica ~2 milhões de trajetórias agênticas.
  • Qwable-v1: um Qwen3.6-35B afinado a partir de destilados, treinado por 2 épocas numa única GPU H200.
  • Modelos derivados também em Gemma 4 e gpt-oss, todos destilados de sessões reais de código.

A destilação como economia paralela

Destilação é ensinar um modelo menor a imitar um maior, usando as respostas do grande como gabarito. Não se copiam os pesos — copiam-se os comportamentos. E é exatamente isso que esses datasets permitem: pegar um modelo aberto de tamanho modesto e treiná-lo nos rastros do Fable 5 até que ele aprenda a se mover como um agente competente.

A ninhada já nasceu. O Qwable-v1 partiu de um Qwen3.6-35B, foi "aquecido" com um destilado anterior e afinado em dados agênticos por duas épocas numa única H200 — um treino que cabe no orçamento de um laboratório pequeno. Há um Gemma-4-31B-Fable-5-Agent-Distill treinado sobre rastros de código, e um derivado de gpt-oss destilado de sessões reais de programação. Nenhum deles é o Fable 5; todos carregam um pedaço do seu jeito de trabalhar.

O nome do jogo é eficiência. Não é preciso o cérebro de fronteira inteiro para fazer a maior parte do trabalho — basta um modelo pequeno que aprendeu, por imitação, os atalhos certos. A destilação virou a forma mais barata de transferir competência de quem pode treinar do zero para quem só pode afinar.

O paradoxo do controle

Aqui mora a ironia que vale a pausa. O propósito de uma diretriz de exportação é conter a difusão de uma capacidade considerada sensível. Mas a capacidade de um modelo agêntico não vive apenas nos seus pesos protegidos — vaza pelos seus comportamentos, e comportamentos são fáceis de gravar. Bastam algumas semanas de uso antes do banimento para que o essencial do "como ele faz" já esteja distribuído em datasets que ninguém consegue recolher.

Não é um vazamento no sentido técnico: são sessões que usuários legítimos rodaram e escolheram publicar. Mas o efeito líquido desafia a lógica do controle. Trancar o modelo não tranca o conhecimento que ele já espalhou — e a destilação transforma esse conhecimento numa forma que se replica em qualquer GPU.

O lado incômodo

Convém não romantizar. Destilar rastros de um modelo comercial caminha numa zona cinzenta de termos de uso e propriedade — muitos provedores proíbem explicitamente usar suas saídas para treinar concorrentes, e a fronteira entre "aprender com" e "clonar" é jurídica antes de ser técnica. Há também a questão da qualidade: um rastro carrega não só os acertos do modelo original, mas seus vieses e seus erros, fielmente copiados pelo aluno.

E há a fragilidade da fonte. Datasets que reivindicam dois milhões de trajetórias raramente vêm com auditoria independente do que está lá dentro — quanto é Fable 5 de verdade, quanto é ruído, quanto é dado contaminado. Imitação sem curadoria é uma forma eficiente de herdar problemas.

O que fica

O episódio do Fable 5 é um pequeno tratado sobre a natureza do conhecimento em IA. Pesos podem ser trancados; comportamentos, não. Um modelo de fronteira que rodou em produção por algumas semanas já deixou, em datasets abertos, o suficiente para semear modelos menores que herdam parte do seu jeito de trabalhar. A pergunta que o caso deixa não é técnica, e sim política: faz sentido controlar a exportação de um artefato cuja parte mais valiosa — o modo de agir — se copia tão facilmente quanto um arquivo de texto?

Perguntas Frequentes

O que é um rastro de agente?

É o registro completo de uma sessão em que o modelo agiu como agente: o que planejou, quais ferramentas chamou, o que recebeu de volta e como corrigiu. É a "folha de rascunho" do raciocínio, e serve de material de treino para ensinar outros modelos a se comportarem de forma parecida.

O que significa destilar um modelo?

Destilação é treinar um modelo menor para imitar um maior, usando as saídas do grande como gabarito. Não se copiam os pesos — copiam-se os comportamentos. Por isso os rastros do Fable 5 permitem afinar modelos abertos para agir como ele, sem ter acesso ao modelo original.

Isso é legal?

É uma zona cinzenta. As sessões foram rodadas por usuários legítimos e publicadas por eles, mas muitos provedores proíbem nos termos de uso treinar concorrentes com suas saídas. A fronteira entre "aprender com" e "clonar" é, antes de tudo, jurídica — e ainda mal definida.

Por que isso desafia o controle de exportação?

Porque a capacidade de um modelo agêntico não vive só nos pesos protegidos: ela vaza pelos comportamentos, que são fáceis de gravar e publicar. Trancar o modelo não tranca o conhecimento que ele já espalhou em datasets abertos.

compartilhar: