Loading...
Loading...
GLM-4.5-Air is the lightweight variant of our latest flagship model family, also purpose-built for agent-centric applications. Like GLM-4.5, it adopts the Mixture-of-Experts (MoE) architecture but with a more compact parameter size. GLM-4.5-Air also supports hybrid inference modes, offering a "thinking mode" for advanced reasoning and tool use, and a "non-thinking mode" for real-time interaction. Users can control the reasoning behaviour with the `reasoning` `enabled` boolean. [Learn more in our docs](https://openrouter.ai/docs/use-cases/reasoning-tokens#enable-reasoning-with-default-config)
Índice de Qualidade
23.2
159th de 442
Top 36%
Índice de Código
23.8
121st de 352
Top 34%
Índice de Matemática
80.7
61st de 268
Top 23%
Preço/1M
$0.42
371st mais barato
37% acima da mediana
Top 55%
Velocidade
101 tok/s
Top 27%
TTFT
0.63s
Janela de Contexto
131K
145th maior
Top 63%
Entrada
$0.20
por 1M tokens
Saída
$1.10
por 1M tokens
Combinado
$0.42
por 1M tokens
Mais barato que 45% dos modelos. Preço mediano é $0.31/1M tokens.
Diário
$0.42
Mensal
$12.75
101
tokens/seg
Mais rápido que 73% dos modelos
0.63
segundos
Mais rápido que 40% dos modelos
20.36
segundos
Mais rápido que 13% dos modelos
Mediana do Mercado
46 tok/s
122% mais rápido
TTFT Mediano
0.42s
51% mais lento
Vazão/Dólar
239
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
131K
tokens
Maior que 37% dos modelos
Saída Máxima
98K
tokens
75% do contexto