Sobre

MiMo-V2-Omni is a frontier omni-modal model that natively processes image, video, and audio inputs within a unified architecture. It combines strong multimodal perception with agentic capability - visual grounding, multi-step planning, tool use, and code execution - making it well-suited for complex real-world tasks that span modalities. 256K context window.

Família do Modelo

MiMo-V2-Pro2026-03-18 MiMo-V2-Flash (Feb 2026)2025-12-16 MiMo-V2-Flash (Reasoning)2025-12-16 MiMo-V2-Flash (Non-reasoning)2025-12-16

Benchmarks

MMLU-ProNão avaliado

GPQA Diamond

82.8%

HLE

19.9%

LiveCodeBenchNão avaliado

SciCode

36.7%

TerminalBench Hard

34.8%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025Não avaliado

IFBench

53.5%

Long Context Recall

66.7%

Tau2

91.2%

Média do MercadoMelhor Score

mimo-v2-omni

Sobre

Família do Modelo

Posição no Mercado

Preços

Calculadora de Custo

vs. Modelos Similares

Desempenho

Benchmarks

Comparação Rápida

Modelos Similares