Quando Gerar Mais Ajuda? Separando a Síntese com Fonte Fixa da Expansão de Fonte no Escalonamento de Dados Sintéticos

arXiv:2607.01727v1 Tipo de anúncio: novo Resumo: Dados sintéticos podem ser escalonados por duas rotas: a Expansão de Fonte (SE), que amplia a fonte adicionando materiais-semente ou geradores, e a Síntese com Fonte Fixa (FSS), que mantém a fonte fixa e escalona o orçamento de geração. Os estudos de escalonamento existentes normalmente expandem a fonte à medida que os dados crescem, misturando a SE com a FSS e deixando a FSS pouco explorada. Nós isolamos a FSS mantendo fixos o conjunto de perguntas-semente e o modelo professor, variando apenas o pe...

arXiv cs.CL ·Xu Guo, Jian Tong, Zhihui Lu, Qipeng Guo ·
compartilhar: