Blog
LLMs & Texto
Quando Gerar Mais Ajuda? Separando a Síntese com Fonte Fixa da Expansão de Fonte no Escalonamento de Dados Sintéticos
arXiv:2607.01727v1 Tipo de anúncio: novo Resumo: Dados sintéticos podem ser escalonados por duas rotas: a Expansão de Fonte (SE), que amplia a fonte adicionando materiais-semente ou geradores, e a Síntese com Fonte Fixa (FSS), que mantém a fonte fixa e escalona o orçamento de geração. Os estudos de escalonamento existentes normalmente expandem a fonte à medida que os dados crescem, misturando a SE com a FSS e deixando a FSS pouco explorada. Nós isolamos a FSS mantendo fixos o conjunto de perguntas-semente e o modelo professor, variando apenas o pe...
arXiv cs.CL
·Xu Guo, Jian Tong, Zhihui Lu, Qipeng Guo
·
// relacionados
Leia também
Blog
O complicado problema do Claude Code com a China envolve proibições dos dois lados do Pacífico
Blog
AI Security Institute do Reino Unido descobre que benchmarks padrão subestimam sistematicamente o que agentes de IA realmente conseguem fazer
Dataset
ByteDance-Seed/EdgeBench
Blog