Modelo LLMs & Texto

HauhauCS/Qwen3.5-9B-Uncensored-HauhauCS-Aggressive

Modelo de modelo · 9 B de parâmetros — 515.7 mil downloads e 1.7 mil curtidas no Hugging Face.

Hugging Face · Modelos ·HauhauCS · ·↓ 515682 ·♥ 1654

O modelo HauhauCS/Qwen3.5-9B-Uncensored-HauhauCS-Aggressive aparece entre os mais comentados do Hugging Face — um termômetro do que a comunidade está realmente usando agora na tarefa de modelo.

Ficha técnica

  • Tarefa: modelo
  • Parâmetros: 9 B
  • Formatos: GGUF
  • Licença: Apache 2.0
  • Downloads: 515.7 mil · Curtidas: 1.7 mil

Hardware recomendado

Estimativa de VRAM só para carregar os pesos (com ~20% de folga para ativações). Contextos longos consomem memória adicional para o cache de atenção (KV cache).

  • Precisão original (16-bit): ~22 GB de VRAM — 1 GPU high-end (24 GB, ex. RTX 3090/4090)
  • Quantizado 8-bit: ~11 GB de VRAM — 1 GPU de consumo (12 GB, ex. RTX 3060/4070)
  • Quantizado 4-bit: ~5.4 GB de VRAM — 1 GPU de consumo (≥ 8 GB, ex. RTX 3060)

Como rodar localmente

Os pesos estão em GGUF, prontos para rodar na CPU ou GPU com Ollama, llama.cpp ou LM Studio — sem Python.

# Ollama
ollama run hf.co/HauhauCS/Qwen3.5-9B-Uncensored-HauhauCS-Aggressive

# ou llama.cpp
llama-cli -hf HauhauCS/Qwen3.5-9B-Uncensored-HauhauCS-Aggressive -p "Explique o que é entropia."

Tags

gguf uncensored qwen3.5 qwen en zh multilingual conversational

Abrir o modelo no Hugging Face →

compartilhar: