Modelo LLMs & Texto

LiquidAI/LFM2.5-230M

Modelo de geração de texto · 230 M de parâmetros — 9.8 mil downloads e 128 curtidas no Hugging Face.

Hugging Face · Modelos ·LiquidAI · ·↓ 9791 ·♥ 128

O modelo LiquidAI/LFM2.5-230M aparece entre os mais comentados do Hugging Face — um termômetro do que a comunidade está realmente usando agora na tarefa de geração de texto.

Ficha técnica

  • Tarefa: geração de texto
  • Parâmetros: 230 M
  • Biblioteca: transformers
  • Formatos: safetensors
  • Licença: proprietária / outra
  • Downloads: 9.8 mil · Curtidas: 128

Hardware recomendado

Estimativa de VRAM só para carregar os pesos (com ~20% de folga para ativações). Contextos longos consomem memória adicional para o cache de atenção (KV cache).

  • Precisão original (16-bit): ~0.6 GB de VRAM — roda em CPU ou GPU de notebook
  • Quantizado 8-bit: ~0.3 GB de VRAM — roda em CPU ou GPU de notebook
  • Quantizado 4-bit: ~0.1 GB de VRAM — roda em CPU ou GPU de notebook

Como rodar localmente

Carregue com a transformers usando o template de chat:

pip install -U transformers accelerate torch

from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "LiquidAI/LFM2.5-230M"
tok = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
    model_id, torch_dtype="auto", device_map="auto"
)

msgs = [{"role": "user", "content": "Explique o que é entropia."}]
inputs = tok.apply_chat_template(
    msgs, add_generation_prompt=True, return_tensors="pt"
).to(model.device)

out = model.generate(inputs, max_new_tokens=256)
print(tok.decode(out[0][inputs.shape[-1]:], skip_special_tokens=True))

Para servir como API (recomendado para modelos grandes), use o vLLM:

pip install vllm
vllm serve LiquidAI/LFM2.5-230M

Tags

transformers safetensors lfm2 text-generation liquid lfm2.5 edge conversational

Abrir o modelo no Hugging Face →

compartilhar: