模型

能力对比

按 Benchmark 评测和价格横向对比各模型。点表头排序,缺数据用 占位。 绿色 低价 / 红色 高价。

模型 ↕ 厂商 ↕ MMLU ↕ GPQA ↕ HumanEval ↕ Math ↕ 标准输入价 ↕ 上下文 ↕ 参数 (总/激活) 开源
Claude 3.5 Sonnet Anthropic $3 200K 闭源 闭源
Claude 3 Opus Anthropic $15 200K 闭源 闭源
DeepSeek-V3 DeepSeek ¥1 128K 671B(37B激活,MoE) / 49B 开源
DeepSeek-R1 DeepSeek ¥4 160K 671B(37B激活,MoE) / 49B 开源
示例 Qwen2.5-7B 示例通义千问 ¥0.5 128K 7B 开源
Gemini 1.5 Pro Google $2.5 2M 闭源 闭源
GLM-4-Flash 智谱AI ¥0 128K 9B 开源
Gemini 2.0 Flash Google $0.1 1M 闭源 闭源
GLM-4 智谱AI ¥0.1 128K 闭源 闭源
GPT-4o mini OpenAI $0.15 128K 闭源
GPT-4o OpenAI $2.5 128K 闭源
Llama 3.1 70B (Groq极速) Groq $0.59 128K 70B 开源
Llama 3.1 70B Meta 128K 70B 开源
Llama 3.1 8B Meta 128K 8B 开源
Llama 3.2 1B Meta 128K 1B 开源
Moonshot-v1 月之暗面 ¥12 128K 闭源 闭源
Meta: Llama 4 Scout Meta $0.11 10M 17B激活/109B(MoE) 开源
o1 OpenAI $15 200K 闭源
Microsoft: Phi 4 microsoft $0.07 16K 14B 开源
Qwen-Max 阿里通义千问 ¥20 32K 闭源 闭源
Qwen2.5-7B-Instruct 阿里通义千问 $0.04 128K 7.6B 开源
Qwen2-VL-7B 阿里通义千问 128K 7B 开源
Qwen: Qwen3 32B 阿里通义千问 $0.104 128K 32B 开源
DeepSeek-V3 (硅基流动) 硅基流动 ¥1 64K 671B 开源
Stable Diffusion XL Stability AI 3.5B 开源
Qwen2.5-72B-Instruct 阿里通义千问 $0.38 128K 72B 开源
Whisper-Large-v3 OpenAI 30秒/段 1.5B(1550M) 开源
Qwen2.5-3B-Instruct 阿里通义千问 128K 3B 开源
Anthropic Claude Sonnet Latest Anthropic $3 1M 闭源
Google: Gemini 2.5 Pro Google $1.25 1024K 闭源
Z.ai: GLM 5.1 智谱AI $0.975 198K 开源
xAI: Grok 4.20 x-ai $1.25 2M 闭源
MoonshotAI Kimi Latest 月之暗面 $0.55 256K 1T(32B激活,MoE) 开源
BGE-M3 智源研究院 8K 568M 开源
ChatTTS 2noise (ChatTTS) ~0.4B 开源
CosyVoice 阿里通义千问 ~0.5B 开源
CogVideoX 智谱AI 5B 开源
FLUX.1-dev Black Forest Labs 12B 开源