Dataset LLMs & Texto

ByteDance-Seed/EdgeBench

Dataset com menos de mil exemplos — 519 downloads no Hugging Face. Overview EdgeBench is a benchmark of 134 real-world tasks for evaluating how autonomous AI agents learn from real-world environments.

Hugging Face · Datasets ·ByteDance-Seed · 03 de janeiro de 2026 ·↓ 519 ·♥ 14

O dataset ByteDance-Seed/EdgeBench está entre os destaques do Hugging Face — dados que alimentam o treinamento e a avaliação dos modelos do momento.

Ficha do dataset

Tamanho: menos de mil exemplos
Tarefas: geração de texto
Idiomas: inglês
Licença: CC BY 4.0
Downloads: 519 · Curtidas: 14

Sobre o dataset

Overview EdgeBench is a benchmark of 134 real-world tasks for evaluating how autonomous AI agents learn from real-world environments.

Como carregar

Use a biblioteca datasets do Hugging Face:

pip install -U datasets

from datasets import load_dataset

ds = load_dataset("ByteDance-Seed/EdgeBench")
print(ds)
print(ds["train"][0])

ByteDance-Seed/EdgeBench

Ficha do dataset

Sobre o dataset

Como carregar

Tags

Leia também

O complicado problema do Claude Code com a China envolve proibições dos dois lados do Pacífico

AI Security Institute do Reino Unido descobre que benchmarks padrão subestimam sistematicamente o que agentes de IA realmente conseguem fazer

Google DeepMind e A24 anunciam parceria de pesquisa inédita

Ornith-1.0: o modelo aberto que aprende a escrever seu próprio treino