能力对比
按 Benchmark 评测和价格横向对比各模型。点表头排序,缺数据用 — 占位。 绿色 低价 / 红色 高价。
| 模型 ↕ | 厂商 ↕ | MMLU ↕ | GPQA ↕ | HumanEval ↕ | Math ↕ | 标准输入价 ↕ | 上下文 ↕ | 参数 (总/激活) | 开源 |
|---|---|---|---|---|---|---|---|---|---|
| Claude 3.5 Sonnet | Anthropic | $3 | 200K | 闭源 | 闭源 | ||||
| Claude 3 Opus | Anthropic | $15 | 200K | 闭源 | 闭源 | ||||
| DeepSeek-V3 | DeepSeek | ¥1 | 128K | 671B(37B激活,MoE) / 49B | 开源 | ||||
| DeepSeek-R1 | DeepSeek | ¥4 | 160K | 671B(37B激活,MoE) / 49B | 开源 | ||||
| 示例 Qwen2.5-7B | 示例通义千问 | ¥0.5 | 128K | 7B | 开源 | ||||
| Gemini 1.5 Pro | $2.5 | 2M | 闭源 | 闭源 | |||||
| GLM-4-Flash | 智谱AI | ¥0 | 128K | 9B | 开源 | ||||
| Gemini 2.0 Flash | $0.1 | 1M | 闭源 | 闭源 | |||||
| GLM-4 | 智谱AI | ¥0.1 | 128K | 闭源 | 闭源 | ||||
| GPT-4o mini | OpenAI | $0.15 | 128K | — | 闭源 | ||||
| GPT-4o | OpenAI | $2.5 | 128K | — | 闭源 | ||||
| Llama 3.1 70B (Groq极速) | Groq | $0.59 | 128K | 70B | 开源 | ||||
| Llama 3.1 70B | Meta | — | 128K | 70B | 开源 | ||||
| Llama 3.1 8B | Meta | — | 128K | 8B | 开源 | ||||
| Llama 3.2 1B | Meta | — | 128K | 1B | 开源 | ||||
| Moonshot-v1 | 月之暗面 | ¥12 | 128K | 闭源 | 闭源 | ||||
| Meta: Llama 4 Scout | Meta | $0.11 | 10M | 17B激活/109B(MoE) | 开源 | ||||
| o1 | OpenAI | $15 | 200K | — | 闭源 | ||||
| Microsoft: Phi 4 | microsoft | $0.07 | 16K | 14B | 开源 | ||||
| Qwen-Max | 阿里通义千问 | ¥20 | 32K | 闭源 | 闭源 | ||||
| Qwen2.5-7B-Instruct | 阿里通义千问 | $0.04 | 128K | 7.6B | 开源 | ||||
| Qwen2-VL-7B | 阿里通义千问 | — | 128K | 7B | 开源 | ||||
| Qwen: Qwen3 32B | 阿里通义千问 | $0.104 | 128K | 32B | 开源 | ||||
| DeepSeek-V3 (硅基流动) | 硅基流动 | ¥1 | 64K | 671B | 开源 | ||||
| Stable Diffusion XL | Stability AI | — | — | 3.5B | 开源 | ||||
| Qwen2.5-72B-Instruct | 阿里通义千问 | $0.38 | 128K | 72B | 开源 | ||||
| Whisper-Large-v3 | OpenAI | — | 30秒/段 | 1.5B(1550M) | 开源 | ||||
| Qwen2.5-3B-Instruct | 阿里通义千问 | — | 128K | 3B | 开源 | ||||
| Anthropic Claude Sonnet Latest | Anthropic | $3 | 1M | — | 闭源 | ||||
| Google: Gemini 2.5 Pro | $1.25 | 1024K | — | 闭源 | |||||
| Z.ai: GLM 5.1 | 智谱AI | $0.975 | 198K | — | 开源 | ||||
| xAI: Grok 4.20 | x-ai | $1.25 | 2M | — | 闭源 | ||||
| MoonshotAI Kimi Latest | 月之暗面 | $0.55 | 256K | 1T(32B激活,MoE) | 开源 | ||||
| BGE-M3 | 智源研究院 | — | 8K | 568M | 开源 | ||||
| ChatTTS | 2noise (ChatTTS) | — | — | ~0.4B | 开源 | ||||
| CosyVoice | 阿里通义千问 | — | — | ~0.5B | 开源 | ||||
| CogVideoX | 智谱AI | — | — | 5B | 开源 | ||||
| FLUX.1-dev | Black Forest Labs | — | — | 12B | 开源 |