Loading...
Loading...
For tasks that demand low latency, GPT‑4.1 nano is the fastest and cheapest model in the GPT-4.1 series. It delivers exceptional performance at a small size with its 1 million token context window, and scores 80.1% on MMLU, 50.3% on GPQA, and 9.8% on Aider polyglot coding – even higher than GPT‑4o mini. It’s ideal for tasks like classification or autocompletion.
Índice de Qualidade
13.0
306th de 442
Top 69%
Índice de Código
11.2
244th de 352
Top 70%
Índice de Matemática
24.0
199th de 268
Top 75%
Preço/1M
$0.17
277th mais barato
44% abaixo da mediana
Top 42%
Velocidade
149 tok/s
Top 14%
TTFT
0.36s
Janela de Contexto
1.0M
23rd maior
Top 7%
Entrada
$0.10
por 1M tokens
Saída
$0.40
por 1M tokens
Combinado
$0.17
por 1M tokens
Mais barato que 58% dos modelos. Preço mediano é $0.31/1M tokens.
Diário
$0.17
Mensal
$5.25
149
tokens/seg
Mais rápido que 86% dos modelos
0.36
segundos
Mais rápido que 55% dos modelos
0.36
segundos
Mais rápido que 57% dos modelos
Mediana do Mercado
46 tok/s
226% mais rápido
TTFT Mediano
0.42s
13% mais rápido
Vazão/Dólar
849
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
1.0M
tokens
Maior que 93% dos modelos
Saída Máxima
33K
tokens
3% do contexto