nvidia/Nemotron-TwoTower-30B-A3B-Base-BF16
Modelo de geração de texto · 30 B de parâmetros · MoE — 7.6 mil downloads e 41 curtidas no Hugging Face.
O modelo nvidia/Nemotron-TwoTower-30B-A3B-Base-BF16 aparece entre os mais comentados do Hugging Face — um termômetro do que a comunidade está realmente usando agora na tarefa de geração de texto.
Ficha técnica
- Tarefa: geração de texto
- Parâmetros: 30 B (arquitetura MoE)
- Biblioteca:
transformers - Formatos: safetensors
- Licença: proprietária / outra
- Downloads: 7.6 mil · Curtidas: 41
Hardware recomendado
Estimativa de VRAM só para carregar os pesos (com ~20% de folga para ativações). Contextos longos consomem memória adicional para o cache de atenção (KV cache).
- Precisão original (16-bit): ~72 GB de VRAM — 1 GPU de data center (80 GB, ex. A100/H100)
- Quantizado 8-bit: ~36 GB de VRAM — 1 GPU profissional (48 GB, ex. A6000) ou 2× 24 GB
- Quantizado 4-bit: ~18 GB de VRAM — 1 GPU high-end (24 GB, ex. RTX 3090/4090)
Por ser um modelo MoE (mixture-of-experts), todos os pesos precisam caber na memória, mas só uma fração é ativada por token — a inferência roda mais rápido do que o tamanho total sugere.
Como rodar localmente
Carregue com a transformers usando o template de chat:
pip install -U transformers accelerate torch
from transformers import AutoModelForCausalLM, AutoTokenizer
model_id = "nvidia/Nemotron-TwoTower-30B-A3B-Base-BF16"
tok = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
model_id, torch_dtype="auto", device_map="auto"
)
msgs = [{"role": "user", "content": "Explique o que é entropia."}]
inputs = tok.apply_chat_template(
msgs, add_generation_prompt=True, return_tensors="pt"
).to(model.device)
out = model.generate(inputs, max_new_tokens=256)
print(tok.decode(out[0][inputs.shape[-1]:], skip_special_tokens=True))Para servir como API (recomendado para modelos grandes), use o vLLM:
pip install vllm
vllm serve nvidia/Nemotron-TwoTower-30B-A3B-Base-BF16Tags
transformers safetensors nvidia pytorch two-tower diffusion mamba text-generation
Leia também
The US military used AI to pick thousands of targets but missed a note saying one was a school