gaia-benchmark/GAIA
Dataset em destaque no Hugging Face — 35.1 mil downloads. GAIA dataset GAIA is a benchmark which aims at evaluating next-generation LLMs (LLMs with augmented capabilities due to added tooling, efficient promp…
Hugging Face · Datasets
·gaia-benchmark
·
·↓ 35111
·♥ 704
O dataset gaia-benchmark/GAIA está entre os destaques do Hugging Face — dados que alimentam o treinamento e a avaliação dos modelos do momento.
Ficha do dataset
- Idiomas: inglês
- Downloads: 35.1 mil · Curtidas: 704
Sobre o dataset
GAIA dataset GAIA is a benchmark which aims at evaluating next-generation LLMs (LLMs with augmented capabilities due to added tooling, efficient prompting, access to search, etc).
Como carregar
Use a biblioteca datasets do Hugging Face:
pip install -U datasets
from datasets import load_dataset
ds = load_dataset("gaia-benchmark/GAIA")
print(ds)
print(ds["train"][0])
// relacionados
Leia também
Modelo
bosonai/higgs-tts-3-4b
Editorial
LTX-2: o primeiro modelo fundacional de vídeo e áudio em conjunto — aberto, com 19B de parâmetros
Blog
How Reliable Is Your Jailbreak Judge? Calibration and Adversarial Robustness of Automated ASR Scoring
Blog