大模型导航 · 本地部署知识库

Qwen2.5-7B-Instruct

API+本地开源可商用

阿里通义千问 · Qwen2.5 · Apache-2.0 · 7.6B · 上下文 128K

能做什么

聊天问答编程开发知识问答(RAG)中文处理数学推理

部署门槛

消费级 8-12G

≥ 8GB

API 价格

$0.04 /百万

输入/标准档 · 全站比价 →

上下文

128K

token 窗口

参数

7.6B

Qwen2.5

01基础参数

参数规模: 7.6B
上下文窗口: 128K
输入模态: text / code / vision
可生成: text
模型系列: Qwen2.5
开源许可: Apache-2.0
主要语言: zh

02推荐部署方案

推荐 Q4_K_M ollama

03部署门槛详情

硬件等级消费级 8-12G · 最低显存 8GB

中文对话代码RAG多语言

04Benchmark 评测

待补充

05适用场景

✓ 适用

中英双语助手、本地RAG(128K上下文)、编程辅助、消费级显卡本地部署

✗ 不适用

图像理解(选Qwen2.5-VL)、超重推理(选更大模型)、最新知识(受训截止)

06详细介绍

Qwen2.5-7B-Instruct 中文与代码能力突出，单卡可本地部署，是中文本地部署首选。

OpenRouter Provider 比价

共 2 家 provider（2026-06-30 采集），按输入价升序：

Provider	输入(USD/1M)	输出(USD/1M)	量化	上下文
Phala	0.04	0.1	unknown	32768
Together	0.3	0.3	fp8	32768

代表价（满血最低）：Phala 输入 0.04 / 输出 0.1 USD/1M。按 provider 选择可进一步降本。

07官方资源

官网 ↗ API 文档 ↗ 控制台 ↗ HuggingFace ↗ ModelScope ↗

08API 定价全站比价 →

缓存命中输入 0.1 / 输出 2 CNY/百万token

标准输入 0.04 / 输出 0.1 USD/百万token

标准输入 0.5 / 输出 2 CNY/百万token · 新用户赠送

预算估算器

USD ≈ 可输入 — 百万 token

09部署教程

Windows 用 Ollama 一键部署 Qwen2.5-7B

10真实评测

Qwen2.5-7B-Instruct 本地部署评测 Qwen2.5-7B 本地部署实测：中文单卡首选

11同类模型

7B · 中端 16-24G

Qwen2.5-72B-Instruct

Qwen2.5-3B-Instruct

3B · CPU 可跑