Paper LLMs & Texto Dados & Embeddings

CausalMix: Data Mixture as Causal Inference for Language Model Training

CausalMix addresses limitations in LLM data mixing by formulating mixture optimization as a causal inference problem, enabling dynamic adaptation to shifting data distributions wit…

Hugging Face · Daily Papers ·Zinan Tang, Yukun Zhang · 01 de janeiro de 2026 ·▲ 11 upvotes

Este artigo está em destaque na seleção diária de papers do Hugging Face, curada pela comunidade de pesquisa em IA.

Autores: Zinan Tang, Yukun Zhang, Shaomian Zheng, Zhuoshi Pan, Qizhi Pei, Dingnan Jin

11 upvotes da comunidade
Temas: data mixing, causal inference, conditional average treatment effect, causal modeling, confounding biases, data pool

Resumo

Resumo original (em inglês), extraído do paper:

CausalMix addresses limitations in LLM data mixing by formulating mixture optimization as a causal inference problem, enabling dynamic adaptation to shifting data distributions without costly retraining.

Onde ler

Ver no Hugging Face

// relacionados

CausalMix: Data Mixture as Causal Inference for Language Model Training

Resumo

Onde ler

Leia também

Claude Sonnet 5: a Anthropic aposta que o modelo do meio faz o trabalho do topo

Google’s AI buildout drove 37% increase in electricity use in 2025

OpenAI reportedly offers the Trump administration a five percent stake in the company

The Google Health API Got a CLI: ghealth is an Open-Source Tool for Your Fitbit Air Data