Loading...
Loading...
The Qwen3.5 Series 35B-A3B is a native vision-language model designed with a hybrid architecture that integrates linear attention mechanisms and a sparse mixture-of-experts model, achieving higher inference efficiency. Its overall performance is comparable to that of the Qwen3.5-27B.
Índice de Qualidade
37.1
60th de 442
Top 14%
Índice de Código
30.3
78th de 352
Top 22%
Preço/1M
$0.69
418th mais barato
122% acima da mediana
Top 62%
Velocidade
124 tok/s
Top 22%
TTFT
1.05s
Janela de Contexto
262K
61st maior
Top 25%
Entrada
$0.25
por 1M tokens
Saída
$2.00
por 1M tokens
Combinado
$0.69
por 1M tokens
Mais barato que 38% dos modelos. Preço mediano é $0.31/1M tokens.
Diário
$0.69
Mensal
$20.64
124
tokens/seg
Mais rápido que 78% dos modelos
1.05
segundos
Mais rápido que 27% dos modelos
17.22
segundos
Mais rápido que 15% dos modelos
Mediana do Mercado
46 tok/s
171% mais rápido
TTFT Mediano
0.42s
150% mais lento
Vazão/Dólar
180
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
262K
tokens
Maior que 75% dos modelos
Saída Máxima
66K
tokens
25% do contexto
2.4M
1.2K
48-80 GB
A100 80GB