Dataset LLMs & Texto

roneneldan/TinyStories

Dataset em destaque no Hugging Face — 79.6 mil downloads. Dataset containing synthetically generated (by GPT-3.

Hugging Face · Datasets ·roneneldan · ·↓ 79624 ·♥ 1042

O dataset roneneldan/TinyStories está entre os destaques do Hugging Face — dados que alimentam o treinamento e a avaliação dos modelos do momento.

Ficha do dataset

  • Tarefas: geração de texto
  • Idiomas: inglês
  • Licença: CDLA-SHARING-1.0
  • Downloads: 79.6 mil · Curtidas: 1.0 mil

Sobre o dataset

Dataset containing synthetically generated (by GPT-3.

Como carregar

Use a biblioteca datasets do Hugging Face:

pip install -U datasets

from datasets import load_dataset

ds = load_dataset("roneneldan/TinyStories")
print(ds)
print(ds["train"][0])

Tags

text-generation

Explorar o dataset no Hugging Face →

compartilhar: