Dataset
LLMs & Texto
ByteDance-Seed/EdgeBench
Dataset com menos de mil exemplos — 519 downloads no Hugging Face. Overview EdgeBench is a benchmark of 134 real-world tasks for evaluating how autonomous AI agents learn from real-world environments.
Hugging Face · Datasets
·ByteDance-Seed
·
·↓ 519
·♥ 14
O dataset ByteDance-Seed/EdgeBench está entre os destaques do Hugging Face — dados que alimentam o treinamento e a avaliação dos modelos do momento.
Ficha do dataset
- Tamanho: menos de mil exemplos
- Tarefas: geração de texto
- Idiomas: inglês
- Licença: CC BY 4.0
- Downloads: 519 · Curtidas: 14
Sobre o dataset
Overview EdgeBench is a benchmark of 134 real-world tasks for evaluating how autonomous AI agents learn from real-world environments.
Como carregar
Use a biblioteca datasets do Hugging Face:
pip install -U datasets
from datasets import load_dataset
ds = load_dataset("ByteDance-Seed/EdgeBench")
print(ds)
print(ds["train"][0])Tags
text-generation benchmark code-agents evaluation long-horizon
// relacionados
Leia também
Blog
O complicado problema do Claude Code com a China envolve proibições dos dois lados do Pacífico
Blog
AI Security Institute do Reino Unido descobre que benchmarks padrão subestimam sistematicamente o que agentes de IA realmente conseguem fazer
Blog
Google DeepMind e A24 anunciam parceria de pesquisa inédita
Editorial