Modelo Áudio & Voz

FuzzPuppy/LTX-2.3-Foley-LoRA

Modelo de modelo — 876 downloads e 38 curtidas no Hugging Face.

Hugging Face · Modelos ·FuzzPuppy · 30 de janeiro de 2026 ·↓ 876 ·♥ 38

O modelo FuzzPuppy/LTX-2.3-Foley-LoRA aparece entre os mais comentados do Hugging Face — um termômetro do que a comunidade está realmente usando agora na tarefa de modelo.

Ficha técnica

Tarefa: modelo
Biblioteca: diffusers
Formatos: safetensors
Licença: proprietária / outra
Downloads: 876 · Curtidas: 38

Como rodar localmente

Use a biblioteca diffusers para gerar imagens:

pip install -U diffusers transformers accelerate torch

from diffusers import DiffusionPipeline
import torch

pipe = DiffusionPipeline.from_pretrained(
    "FuzzPuppy/LTX-2.3-Foley-LoRA", torch_dtype=torch.float16
).to("cuda")

image = pipe("um gato astronauta, cinematográfico").images[0]
image.save("saida.png")

FuzzPuppy/LTX-2.3-Foley-LoRA

Ficha técnica

Como rodar localmente

Tags

Leia também

O modelo de voz da NVIDIA que troca precisão por velocidade — de propósito

Canary-Qwen: a fórmula da NVIDIA que reescreveu o topo da transcrição de voz aberta

Benchmark de Compreensão de Documentos de Escritório

DRL-CLBA: A Clean Label Backdoor Attack for Speech Classification via DDPG Reinforcement Learning