Sobre

Qwen3-235B-A22B is a 235B parameter mixture-of-experts (MoE) model developed by Qwen, activating 22B parameters per forward pass. It supports seamless switching between a "thinking" mode for complex reasoning, math, and code tasks, and a "non-thinking" mode for general conversational efficiency. The model demonstrates strong reasoning ability, multilingual support (100+ languages and dialects), advanced instruction-following, and agent tool-calling capabilities. It natively handles a 32K token context window and extends up to 131K tokens using YaRN-based scaling.

Família do Modelo

Qwen3.5 9B (Reasoning)2026-03-02 Qwen3.5 9B (Non-reasoning)2026-03-02 Qwen3.5 4B (Reasoning)2026-03-02 Qwen3.5 4B (Non-reasoning)2026-03-02 Qwen3.5 2B (Reasoning)2026-03-02 Qwen3.5 2B (Non-reasoning)2026-03-02 Qwen3.5 0.8B (Reasoning)2026-03-02 Qwen3.5 0.8B (Non-reasoning)2026-03-02

Open Source

HuggingFace

apache-2.0235BGGUF / GPTQ / AWQ

Downloads (30d)

740.8K

Curtidas

1.1K

VRAM (FP16)

Multi-GPU

GPU

8x A100 / H100

Qwen: Qwen3 235B A22B

Sobre

Família do Modelo

Preços

Calculadora de Custo

vs. Modelos Similares

Desempenho

Open Source

Comparação Rápida

Modelos Similares