模型

Qwen2.5-72B-Instruct

API+本地 开源 可商用
阿里通义千问 · Qwen2.5 · Apache-2.0 · 72B · 上下文 128K
能做什么
复杂知识编程数学企业级RAG长文档
部署门槛
多卡
≥ ~50GB(Q4,多卡)
API 价格
$0.38 /百万
输入/标准档 · 全站比价 →
上下文
128K
token 窗口
参数
72B
Qwen2.5

01基础参数

参数规模
72B
上下文窗口
128K
输入模态
text / code / vision
可生成
text
模型系列
Qwen2.5
开源许可
Apache-2.0
主要语言
zh

02推荐部署方案

推荐 Q4_K_M ollama/vllm

03部署门槛详情

硬件等级 多卡 · 最低显存 ~50GB(Q4,多卡)
代码数学知识问答企业

04Benchmark 评测

待补充

05适用场景

✓ 适用
复杂编程、数学推理、企业知识库、高质量长文档处理
✗ 不适用
单24GB卡(放不下)、轻量任务(用更小)、成本敏感API

06详细介绍

Qwen2.5-72B 是 Qwen 开源旗舰,能力对标顶尖闭源。

OpenRouter Provider 比价

共 2 家 provider(2026-06-30 采集),按输入价升序:

Provider输入(USD/1M)输出(USD/1M)量化上下文
DeepInfra0.360.4fp832768
Novita0.380.4bf1632K

代表价(满血最低):Novita 输入 0.38 / 输出 0.4 USD/1M。按 provider 选择可进一步降本。

07官方资源

08API 定价 全站比价 →

标准 输入 0.38 / 输出 0.4 USD/百万token
预算估算器
USD ≈ 可输入 百万 token

09部署教程

Linux 用 vLLM 部署 Qwen2.5-72B(高并发)

10同类模型