Modelo
Áudio & Voz
FuzzPuppy/LTX-2.3-Foley-LoRA
Modelo de modelo — 876 downloads e 38 curtidas no Hugging Face.
Hugging Face · Modelos
·FuzzPuppy
·
·↓ 876
·♥ 38
O modelo FuzzPuppy/LTX-2.3-Foley-LoRA aparece entre os mais comentados do Hugging Face — um termômetro do que a comunidade está realmente usando agora na tarefa de modelo.
Ficha técnica
- Tarefa: modelo
- Biblioteca:
diffusers - Formatos: safetensors
- Licença: proprietária / outra
- Downloads: 876 · Curtidas: 38
Como rodar localmente
Use a biblioteca diffusers para gerar imagens:
pip install -U diffusers transformers accelerate torch
from diffusers import DiffusionPipeline
import torch
pipe = DiffusionPipeline.from_pretrained(
"FuzzPuppy/LTX-2.3-Foley-LoRA", torch_dtype=torch.float16
).to("cuda")
image = pipe("um gato astronauta, cinematográfico").images[0]
image.save("saida.png")Tags
diffusers ltx ltx-2.3 video-to-audio foley sound-effects lora safetensors
// relacionados
Leia também
Editorial
O modelo de voz da NVIDIA que troca precisão por velocidade — de propósito
Editorial
Canary-Qwen: a fórmula da NVIDIA que reescreveu o topo da transcrição de voz aberta
Blog
Benchmark de Compreensão de Documentos de Escritório
Blog