Loading...
Loading...
gpt-oss-20b is an open-weight 21B parameter model released by OpenAI under the Apache 2.0 license. It uses a Mixture-of-Experts (MoE) architecture with 3.6B active parameters per forward pass, optimized for lower-latency inference and deployability on consumer or single-GPU hardware. The model is trained in OpenAI’s Harmony response format and supports reasoning level configuration, fine-tuning, and agentic capabilities including function calling, tool use, and structured outputs.
Índice de Qualidade
24.5
144th de 442
Top 33%
Índice de Código
18.5
158th de 352
Top 45%
Índice de Matemática
89.3
29th de 268
Top 12%
Preço/1M
$0.09
222nd mais barato
70% abaixo da mediana
Top 33%
Velocidade
304 tok/s
Top 2%
TTFT
0.45s
Janela de Contexto
131K
145th maior
Top 63%
Entrada
$0.06
por 1M tokens
Saída
$0.20
por 1M tokens
Combinado
$0.09
por 1M tokens
Mais barato que 67% dos modelos. Preço mediano é $0.31/1M tokens.
Diário
$0.09
Mensal
$2.82
304
tokens/seg
Mais rápido que 98% dos modelos
0.45
segundos
Mais rápido que 48% dos modelos
7.02
segundos
Mais rápido que 23% dos modelos
Mediana do Mercado
46 tok/s
567% mais rápido
TTFT Mediano
0.42s
6% mais lento
Vazão/Dólar
3238
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
131K
tokens
Maior que 37% dos modelos
Saída Máxima
131K
tokens
100% do contexto
7.1M
4.5K
24-48 GB
A6000 / M3 Ultra