Dataset Áudio & Voz

google/WaxalNLP

Dataset em destaque no Hugging Face — 32.1 mil downloads. Waxal Datasets The WAXAL dataset is a large-scale multilingual speech corpus for African languages, introduced in the paper WAXAL: A Large-Scale Multi…

Hugging Face · Datasets ·google · 11 de janeiro de 2026 ·↓ 32148 ·♥ 244

O dataset google/WaxalNLP está entre os destaques do Hugging Face — dados que alimentam o treinamento e a avaliação dos modelos do momento.

Ficha do dataset

Tarefas: reconhecimento de fala, síntese de voz
Formato/modalidade: áudio
Idiomas: ach, aka, amh, bau, dag, dga, …
Licença: CC BY-SA 4.0
Downloads: 32.1 mil · Curtidas: 244

Sobre o dataset

Waxal Datasets The WAXAL dataset is a large-scale multilingual speech corpus for African languages, introduced in the paper WAXAL: A Large-Scale Multilingual African Language Speech Corpus.

Como carregar

Use a biblioteca datasets do Hugging Face:

pip install -U datasets

from datasets import load_dataset

ds = load_dataset("google/WaxalNLP")
print(ds)
print(ds["train"][0])

google/WaxalNLP

Ficha do dataset

Sobre o dataset

Como carregar

Tags

Leia também

Canary-Qwen: a fórmula da NVIDIA que reescreveu o topo da transcrição de voz aberta

Benchmark de Compreensão de Documentos de Escritório

DRL-CLBA: A Clean Label Backdoor Attack for Speech Classification via DDPG Reinforcement Learning

From Monolingual to Multilingual: Evaluating Mamba for ASR in South African Languages