大模型导航 · 本地部署知识库

Qwen2.5-72B-Instruct

API+本地开源可商用

阿里通义千问 · Qwen2.5 · Apache-2.0 · 72B · 上下文 128K

能做什么

复杂知识编程数学企业级RAG长文档

部署门槛

多卡

≥ ~50GB(Q4,多卡)

API 价格

$0.38 /百万

输入/标准档 · 全站比价 →

上下文

128K

token 窗口

参数

72B

Qwen2.5

01基础参数

参数规模: 72B
上下文窗口: 128K
输入模态: text / code / vision
可生成: text
模型系列: Qwen2.5
开源许可: Apache-2.0
主要语言: zh

02推荐部署方案

03部署门槛详情

硬件等级多卡 · 最低显存 ~50GB(Q4,多卡)

代码数学知识问答企业

04Benchmark 评测

待补充

05适用场景

✓ 适用

复杂编程、数学推理、企业知识库、高质量长文档处理

✗ 不适用

单24GB卡(放不下)、轻量任务(用更小)、成本敏感API

06详细介绍

Qwen2.5-72B 是 Qwen 开源旗舰，能力对标顶尖闭源。

OpenRouter Provider 比价

共 2 家 provider（2026-06-30 采集），按输入价升序：

Provider	输入(USD/1M)	输出(USD/1M)	量化	上下文
DeepInfra	0.36	0.4	fp8	32768
Novita	0.38	0.4	bf16	32K

代表价（满血最低）：Novita 输入 0.38 / 输出 0.4 USD/1M。按 provider 选择可进一步降本。

07官方资源

官网 ↗ API 文档 ↗ 控制台 ↗ HuggingFace ↗

08API 定价全站比价 →

标准输入 0.38 / 输出 0.4 USD/百万token

预算估算器

USD ≈ 可输入 — 百万 token

09部署教程

Linux 用 vLLM 部署 Qwen2.5-72B(高并发)

10同类模型