Dataset
Áudio & Voz
google/WaxalNLP
Dataset em destaque no Hugging Face — 32.1 mil downloads. Waxal Datasets The WAXAL dataset is a large-scale multilingual speech corpus for African languages, introduced in the paper WAXAL: A Large-Scale Multi…
Hugging Face · Datasets
·google
·
·↓ 32148
·♥ 244
O dataset google/WaxalNLP está entre os destaques do Hugging Face — dados que alimentam o treinamento e a avaliação dos modelos do momento.
Ficha do dataset
- Tarefas: reconhecimento de fala, síntese de voz
- Formato/modalidade: áudio
- Idiomas: ach, aka, amh, bau, dag, dga, …
- Licença: CC BY-SA 4.0
- Downloads: 32.1 mil · Curtidas: 244
Sobre o dataset
Waxal Datasets The WAXAL dataset is a large-scale multilingual speech corpus for African languages, introduced in the paper WAXAL: A Large-Scale Multilingual African Language Speech Corpus.
Como carregar
Use a biblioteca datasets do Hugging Face:
pip install -U datasets
from datasets import load_dataset
ds = load_dataset("google/WaxalNLP")
print(ds)
print(ds["train"][0])Tags
automatic-speech-recognition text-to-speech audio
// relacionados
Leia também
Editorial
Canary-Qwen: a fórmula da NVIDIA que reescreveu o topo da transcrição de voz aberta
Blog
Benchmark de Compreensão de Documentos de Escritório
Blog
DRL-CLBA: A Clean Label Backdoor Attack for Speech Classification via DDPG Reinforcement Learning
Blog