Loading...
Loading...
Qwen3-Coder-30B-A3B-Instruct is a 30.5B parameter Mixture-of-Experts (MoE) model with 128 experts (8 active per forward pass), designed for advanced code generation, repository-scale understanding, and agentic tool use. Built on the Qwen3 architecture, it supports a native context length of 256K tokens (extendable to 1M with Yarn) and performs strongly in tasks involving function calls, browser use, and structured code completion. This model is optimized for instruction-following without “thinking mode”, and integrates well with OpenAI-compatible tool-use formats.
Índice de Qualidade
20.0
186th de 442
Top 43%
Índice de Código
19.4
152nd de 352
Top 43%
Índice de Matemática
29.0
187th de 268
Top 70%
Preço/1M
$0.90
473rd mais barato
190% acima da mediana
Top 70%
Velocidade
26 tok/s
Top 60%
TTFT
1.44s
Janela de Contexto
160K
144th maior
Top 41%
Entrada
$0.45
por 1M tokens
Saída
$2.25
por 1M tokens
Combinado
$0.90
por 1M tokens
Mais barato que 30% dos modelos. Preço mediano é $0.31/1M tokens.
Diário
$0.90
Mensal
$27.00
26
tokens/seg
Mais rápido que 40% dos modelos
1.44
segundos
Mais rápido que 18% dos modelos
1.44
segundos
Mais rápido que 31% dos modelos
Mediana do Mercado
46 tok/s
42% mais lento
TTFT Mediano
0.42s
243% mais lento
Vazão/Dólar
29
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
160K
tokens
Maior que 59% dos modelos
Saída Máxima
33K
tokens
20% do contexto
1.0M
981
24-48 GB
A6000 / M3 Ultra