Loading...
Loading...
Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance across common benchmarks compared to earlier Flash models. By default, "thinking" (i.e. multi-pass reasoning) is disabled to prioritize speed, but developers can enable it via the [Reasoning API parameter](https://openrouter.ai/docs/use-cases/reasoning-tokens) to selectively trade off cost for intelligence.
Índice de Qualidade
19.4
194th de 442
Top 44%
Índice de Código
14.5
196th de 352
Top 57%
Índice de Matemática
46.7
144th de 268
Top 54%
Preço/1M
$0.17
277th mais barato
44% abaixo da mediana
Top 42%
Velocidade
330 tok/s
Top 2%
TTFT
0.41s
Janela de Contexto
1.0M
8th maior
Top 6%
Entrada
$0.10
por 1M tokens
Saída
$0.40
por 1M tokens
Combinado
$0.17
por 1M tokens
Mais barato que 58% dos modelos. Preço mediano é $0.31/1M tokens.
Diário
$0.17
Mensal
$5.25
330
tokens/seg
Mais rápido que 98% dos modelos
0.41
segundos
Mais rápido que 51% dos modelos
0.41
segundos
Mais rápido que 52% dos modelos
Mediana do Mercado
46 tok/s
623% mais rápido
TTFT Mediano
0.42s
1% mais rápido
Vazão/Dólar
1884
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
1.0M
tokens
Maior que 94% dos modelos
Saída Máxima
66K
tokens
6% do contexto