Dataset Áudio & Voz

google/WaxalNLP

Dataset em destaque no Hugging Face — 32.1 mil downloads. Waxal Datasets The WAXAL dataset is a large-scale multilingual speech corpus for African languages, introduced in the paper WAXAL: A Large-Scale Multi…

Hugging Face · Datasets ·google · ·↓ 32148 ·♥ 244

O dataset google/WaxalNLP está entre os destaques do Hugging Face — dados que alimentam o treinamento e a avaliação dos modelos do momento.

Ficha do dataset

  • Tarefas: reconhecimento de fala, síntese de voz
  • Formato/modalidade: áudio
  • Idiomas: ach, aka, amh, bau, dag, dga, …
  • Licença: CC BY-SA 4.0
  • Downloads: 32.1 mil · Curtidas: 244

Sobre o dataset

Waxal Datasets The WAXAL dataset is a large-scale multilingual speech corpus for African languages, introduced in the paper WAXAL: A Large-Scale Multilingual African Language Speech Corpus.

Como carregar

Use a biblioteca datasets do Hugging Face:

pip install -U datasets

from datasets import load_dataset

ds = load_dataset("google/WaxalNLP")
print(ds)
print(ds["train"][0])

Tags

automatic-speech-recognition text-to-speech audio

Explorar o dataset no Hugging Face →

compartilhar: