Ir para o conteúdo principal

Comparar Rankings Análises

Loading...

Compare modelos LLM por qualidade, velocidade e preço. Encontre o modelo certo para seu caso de uso.

Produto

Explorar Modelos
Comparar
Rankings
Seletor de LLM
Calculadora de Custo
Buscar Provedor

Recursos

Análises
FAQ
Sobre
Metodologia

Fontes de Dados

Dados obtidos via APIs públicas de Artificial Analysis, OpenRouter e HuggingFace. FindLLM é um agregador independente, sem afiliação com esses provedores.

© 2026 FindLLM. Todos os direitos reservados.

Privacidade Termos

Meituan: LongCat Flash Chat — Meituan | FindLLM

Início
Explorar
Meituan: LongCat Flash Chat

Voltar para Explorar

Meituan: LongCat Flash Chat

Meituan·Lançado em 2025-09-09

131K ctx

Comparar Testar via OpenRouter

Sobre

LongCat-Flash-Chat is a large-scale Mixture-of-Experts (MoE) model with 560B total parameters, of which 18.6B–31.3B (≈27B on average) are dynamically activated per input. It introduces a shortcut-connected MoE design to reduce communication overhead and achieve high throughput while maintaining training stability through advanced scaling strategies such as hyperparameter transfer, deterministic computation, and multi-stage optimization. This release, LongCat-Flash-Chat, is a non-thinking foundation model optimized for conversational and agentic tasks. It supports long context windows up to 128K tokens and shows competitive performance across reasoning, coding, instruction following, and domain benchmarks, with particular strengths in tool use and complex multi-step interactions.

Preço/1M

$0.35

346th mais barato

13% acima da mediana

Top 52%

Janela de Contexto

131K

145th maior

Top 63%

Preços

Entrada

$0.20

por 1M tokens

Saída

$0.80

por 1M tokens

Combinado

$0.35

por 1M tokens

Mais barato que 48% dos modelos. Preço mediano é $0.31/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.35

Mensal

$10.50

vs. Modelos Similares

Grok 3 mini Reasoning (high)

$0.350%

Qwen3 VL 30B A3B Instruct

$0.350%

Qwen3 30B A3B 2507 Instruct

$0.350%

Qwen3 30B A3B (Non-reasoning)

$0.350%

Desempenho

Janela de Contexto

131K

tokens

Maior que 37% dos modelos

Saída Máxima

131K

tokens

100% do contexto

Comparação de Janela de Contexto

Kimi K2 Thinking

131KIgual

gpt-oss-120B (high)

131KIgual

Kimi K2 0905

131KIgual

Comparação Rápida

Modelos Similares

GPT-5.4 (xhigh)

OpenAI

Q: 57.2$5.63/1M1.1M ctx

Mais caro: 1507%Janela de Contexto: 8x maior

Gemini 3.1 Pro Preview

Google

Q: 57.2$4.50/1M1.0M ctx

Mais caro: 1186%Janela de Contexto: 8x maior

GPT-5.3 Codex (xhigh)

OpenAI

Q: 54.0$4.81/1M400K ctx

Mais caro: 1275%Janela de Contexto: 3x maior

Claude Opus 4.6 (Adaptive Reasoning, Max Effort)

Anthropic

Q: 53.0$10.00/1M

Mais caro: 2757%

Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)

Anthropic

Q: 51.7$6.00/1M

Mais caro: 1614%

GPT-5.2 (xhigh)

OpenAI

Q: 51.3$4.81/1M400K ctx

Mais caro: 1275%Janela de Contexto: 3x maior

Comparar todos os 7 modelos