Modelo
LLMs & Texto
nvidia/MiniMax-M3-NVFP4
Modelo de geração de texto — 32.4 mil downloads e 44 curtidas no Hugging Face.
Hugging Face · Modelos
·nvidia
·
·↓ 32379
·♥ 44
O modelo nvidia/MiniMax-M3-NVFP4 aparece entre os mais comentados do Hugging Face — um termômetro do que a comunidade está realmente usando agora na tarefa de geração de texto.
Ficha técnica
- Tarefa: geração de texto
- Formatos: safetensors, NVFP4
- Licença: proprietária / outra
- Downloads: 32.4 mil · Curtidas: 44
Como rodar localmente
Carregue com a transformers usando o template de chat:
pip install -U transformers accelerate torch
from transformers import AutoModelForCausalLM, AutoTokenizer
model_id = "nvidia/MiniMax-M3-NVFP4"
tok = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
model_id, torch_dtype="auto", device_map="auto"
)
msgs = [{"role": "user", "content": "Explique o que é entropia."}]
inputs = tok.apply_chat_template(
msgs, add_generation_prompt=True, return_tensors="pt"
).to(model.device)
out = model.generate(inputs, max_new_tokens=256)
print(tok.decode(out[0][inputs.shape[-1]:], skip_special_tokens=True))Para servir como API (recomendado para modelos grandes), use o vLLM:
pip install vllm
vllm serve nvidia/MiniMax-M3-NVFP4Tags
safetensors minimax_m3_vl nvidia ModelOpt MiniMax-M3 quantized NVFP4 text-generation
// relacionados
Leia também
Modelo
nvidia/Nemotron-Labs-TwoTower-30B-A3B-Base-BF16
Blog
OpenClaw is finally available on Android and iOS
Blog
Claude Science is Anthropic’s newest flagship product
Blog