Loading...
Loading...
Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance across common benchmarks compared to earlier Flash models. By default, "thinking" (i.e. multi-pass reasoning) is disabled to prioritize speed, but developers can enable it via the [Reasoning API parameter](https://openrouter.ai/docs/use-cases/reasoning-tokens) to selectively trade off cost for intelligence.
Índice de Qualidade
12.7
312th de 442
Top 71%
Índice de Código
7.4
290th de 352
Top 83%
Índice de Matemática
35.3
172nd de 268
Top 65%
Preço/1M
$0.17
277th mais barato
44% abaixo da mediana
Top 42%
Velocidade
244 tok/s
Top 3%
TTFT
0.34s
Janela de Contexto
1.0M
8th maior
Top 6%
Entrada
$0.10
por 1M tokens
Saída
$0.40
por 1M tokens
Combinado
$0.17
por 1M tokens
Mais barato que 58% dos modelos. Preço mediano é $0.31/1M tokens.
Diário
$0.17
Mensal
$5.25
244
tokens/seg
Mais rápido que 97% dos modelos
0.34
segundos
Mais rápido que 57% dos modelos
0.34
segundos
Mais rápido que 58% dos modelos
Mediana do Mercado
46 tok/s
435% mais rápido
TTFT Mediano
0.42s
20% mais rápido
Vazão/Dólar
1395
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
1.0M
tokens
Maior que 94% dos modelos
Saída Máxima
66K
tokens
6% do contexto