Loading...
Loading...
The Qwen3.5 122B-A10B native vision-language model is built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency. In terms of overall performance, this model is second only to Qwen3.5-397B-A17B. Its text capabilities significantly outperform those of Qwen3-235B-2507, and its visual capabilities surpass those of Qwen3-VL-235B.
Índice de Qualidade
41.6
36th de 442
Top 8%
Índice de Código
34.7
50th de 352
Top 14%
Preço/1M
$1.10
492nd mais barato
255% acima da mediana
Top 73%
Velocidade
156 tok/s
Top 12%
TTFT
0.98s
Janela de Contexto
262K
61st maior
Top 25%
Entrada
$0.40
por 1M tokens
Saída
$3.20
por 1M tokens
Combinado
$1.10
por 1M tokens
Mais barato que 27% dos modelos. Preço mediano é $0.31/1M tokens.
Diário
$1.10
Mensal
$33.00
156
tokens/seg
Mais rápido que 88% dos modelos
0.98
segundos
Mais rápido que 30% dos modelos
13.80
segundos
Mais rápido que 19% dos modelos
Mediana do Mercado
46 tok/s
242% mais rápido
TTFT Mediano
0.42s
134% mais lento
Vazão/Dólar
142
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
262K
tokens
Maior que 75% dos modelos
Saída Máxima
66K
tokens
25% do contexto
611.8K
452
Multi-GPU
8x A100 / H100