uw-math-ai/math-graph

Dataset com 10 – 100 milhões de exemplos — 96 downloads no Hugging Face. Math-Graph Math-Graph is the dataset behind TheoremGraph, a unified, statement-level dependency graph spanning both informal and formal mathematics.

Hugging Face · Datasets ·uw-math-ai · ·↓ 96 ·♥ 7

O dataset uw-math-ai/math-graph está entre os destaques do Hugging Face — dados que alimentam o treinamento e a avaliação dos modelos do momento.

Ficha do dataset

  • Tamanho: 10 – 100 milhões de exemplos
  • Tarefas: recuperação de texto, embeddings
  • Idiomas: inglês
  • Licença: CC BY 4.0
  • Downloads: 96 · Curtidas: 7

Sobre o dataset

Math-Graph Math-Graph is the dataset behind TheoremGraph, a unified, statement-level dependency graph spanning both informal and formal mathematics.

Como carregar

Use a biblioteca datasets do Hugging Face:

pip install -U datasets

Como é um dataset grande, vale carregar em modo streaming (sem baixar tudo):

from datasets import load_dataset

ds = load_dataset("uw-math-ai/math-graph", split="train", streaming=True)
for exemplo in ds.take(3):
    print(exemplo)

Tags

text-retrieval feature-extraction mathematics theorem-proving lean arxiv knowledge-graph dependency-graph

Explorar o dataset no Hugging Face →

compartilhar: