Modelo
LLMs & Texto
huihui-ai/Huihui-Qwythos-9B-Claude-Mythos-5-1M-abliterated-GGUF
Modelo de geração de texto · 9 B de parâmetros — 27.7 mil downloads e 46 curtidas no Hugging Face.
Hugging Face · Modelos
·huihui-ai
·
·↓ 27654
·♥ 46
O modelo huihui-ai/Huihui-Qwythos-9B-Claude-Mythos-5-1M-abliterated-GGUF aparece entre os mais comentados do Hugging Face — um termômetro do que a comunidade está realmente usando agora na tarefa de geração de texto.
Ficha técnica
- Tarefa: geração de texto
- Parâmetros: 9 B
- Biblioteca:
transformers - Formatos: GGUF
- Licença: Apache 2.0
- Downloads: 27.7 mil · Curtidas: 46
Hardware recomendado
Estimativa de VRAM só para carregar os pesos (com ~20% de folga para ativações). Contextos longos consomem memória adicional para o cache de atenção (KV cache).
- Precisão original (16-bit): ~22 GB de VRAM — 1 GPU high-end (24 GB, ex. RTX 3090/4090)
- Quantizado 8-bit: ~11 GB de VRAM — 1 GPU de consumo (12 GB, ex. RTX 3060/4070)
- Quantizado 4-bit: ~5.4 GB de VRAM — 1 GPU de consumo (≥ 8 GB, ex. RTX 3060)
Como rodar localmente
Os pesos estão em GGUF, prontos para rodar na CPU ou GPU com Ollama, llama.cpp ou LM Studio — sem Python.
# Ollama
ollama run hf.co/huihui-ai/Huihui-Qwythos-9B-Claude-Mythos-5-1M-abliterated-GGUF
# ou llama.cpp
llama-cli -hf huihui-ai/Huihui-Qwythos-9B-Claude-Mythos-5-1M-abliterated-GGUF -p "Explique o que é entropia."Tags
transformers gguf qwen3.5 reasoning uncensored long-context 1M-context function-calling
// relacionados
Leia também
Modelo
nvidia/Nemotron-Labs-TwoTower-30B-A3B-Base-BF16
Blog
OpenClaw is finally available on Android and iOS
Blog
Claude Science is Anthropic’s newest flagship product
Blog