Modelo LLMs & Texto

deepreinforce-ai/Ornith-1.0-35B-GGUF

Modelo de geração de texto · 35 B de parâmetros — 20.3 mil downloads e 315 curtidas no Hugging Face.

Hugging Face · Modelos ·deepreinforce-ai · 25 de janeiro de 2026 ·↓ 20266 ·♥ 315

O modelo deepreinforce-ai/Ornith-1.0-35B-GGUF aparece entre os mais comentados do Hugging Face — um termômetro do que a comunidade está realmente usando agora na tarefa de geração de texto.

Ficha técnica

Tarefa: geração de texto
Parâmetros: 35 B
Biblioteca: transformers
Formatos: GGUF
Licença: MIT
Downloads: 20.3 mil · Curtidas: 315

Hardware recomendado

Estimativa de VRAM só para carregar os pesos (com ~20% de folga para ativações). Contextos longos consomem memória adicional para o cache de atenção (KV cache).

Precisão original (16-bit): ~84 GB de VRAM — 1 GPU de data center (80 GB, ex. A100/H100)
Quantizado 8-bit: ~42 GB de VRAM — 1 GPU profissional (48 GB, ex. A6000) ou 2× 24 GB
Quantizado 4-bit: ~21 GB de VRAM — 1 GPU high-end (24 GB, ex. RTX 3090/4090)

Como rodar localmente

Os pesos estão em GGUF, prontos para rodar na CPU ou GPU com Ollama, llama.cpp ou LM Studio — sem Python.

# Ollama
ollama run hf.co/deepreinforce-ai/Ornith-1.0-35B-GGUF

# ou llama.cpp
llama-cli -hf deepreinforce-ai/Ornith-1.0-35B-GGUF -p "Explique o que é entropia."

deepreinforce-ai/Ornith-1.0-35B-GGUF

Ficha técnica

Hardware recomendado

Como rodar localmente

Tags

Leia também

Meddies/meddies-persona-vie

SoftBank’s CEO isn’t the only one with questions about Elon Musk’s orbital data center hype

Anthropic's Fable 5 could return within days as Trump administration prepares to lift restrictions

Apple Vision Pro exec is reportedly leaving for OpenAI