Inception: Mercury

Inception·Lançado em 2025-06-26

128K ctx

Sobre

Mercury is the first diffusion large language model (dLLM). Applying a breakthrough discrete diffusion approach, the model runs 5-10x faster than even speed optimized models like GPT-4.1 Nano and Claude 3.5 Haiku while matching their performance. Mercury's speed enables developers to provide responsive user experiences, including with voice agents, search interfaces, and chatbots. Read more in the [blog post] (https://www.inceptionlabs.ai/blog/introducing-mercury) here.

Família do Modelo

Mercury 22026-02-20 Inception: Mercury Coder2025-04-30

Preço/1M

$0.38

357th mais barato

21% acima da mediana

Top 53%

Janela de Contexto

128K

225th maior

Top 75%

Preços

Entrada

$0.25

por 1M tokens

Saída

$0.75

por 1M tokens

Combinado

$0.38

por 1M tokens

Mais barato que 47% dos modelos. Preço mediano é $0.31/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.38

Mensal

$11.25

vs. Modelos Similares

Mercury 2

$0.380%

Inception: Mercury Coder

$0.380%

Kwaipilot: KAT-Coder-Pro V1

$0.36-3%

Qwen: Qwen Plus 0728

$0.39+4%

Desempenho

Janela de Contexto

128K

tokens

Maior que 25% dos modelos

Saída Máxima

32K

tokens

25% do contexto

Comparação de Janela de Contexto

Mercury 2

128KIgual

Sonar Reasoning Pro

128KIgual

GPT-4o (Aug '24)

128KIgual

Comparação Rápida

Modelos Similares

Mercury 2

Inception

Q: 32.8$0.38/1M128K ctx

Inception: Mercury Coder

Inception

$0.38/1M128K ctx

GPT-5.4 (xhigh)

OpenAI

Q: 57.2$5.63/1M1.1M ctx

Mais caro: 1400%Janela de Contexto: 8x maior

Gemini 3.1 Pro Preview

Google

Q: 57.2$4.50/1M1.0M ctx

Mais caro: 1100%Janela de Contexto: 8x maior

GPT-5.3 Codex (xhigh)

OpenAI

Q: 54.0$4.81/1M400K ctx

Mais caro: 1183%Janela de Contexto: 3x maior

Claude Opus 4.6 (Adaptive Reasoning, Max Effort)

Anthropic

Q: 53.0$10.00/1M

Mais caro: 2567%

Comparar todos os 7 modelos