模型

Qwen2.5-7B-Instruct

API+本地 开源 可商用
阿里通义千问 · Qwen2.5 · Apache-2.0 · 7.6B · 上下文 128K
能做什么
聊天问答编程开发知识问答(RAG)中文处理数学推理
部署门槛
消费级 8-12G
≥ 8GB
API 价格
$0.04 /百万
输入/标准档 · 全站比价 →
上下文
128K
token 窗口
参数
7.6B
Qwen2.5

01基础参数

参数规模
7.6B
上下文窗口
128K
输入模态
text / code / vision
可生成
text
模型系列
Qwen2.5
开源许可
Apache-2.0
主要语言
zh

02推荐部署方案

推荐 Q4_K_M ollama

03部署门槛详情

硬件等级 消费级 8-12G · 最低显存 8GB
中文对话代码RAG多语言

04Benchmark 评测

待补充

05适用场景

✓ 适用
中英双语助手、本地RAG(128K上下文)、编程辅助、消费级显卡本地部署
✗ 不适用
图像理解(选Qwen2.5-VL)、超重推理(选更大模型)、最新知识(受训截止)

06详细介绍

Qwen2.5-7B-Instruct 中文与代码能力突出,单卡可本地部署,是中文本地部署首选。

OpenRouter Provider 比价

共 2 家 provider(2026-06-30 采集),按输入价升序:

Provider输入(USD/1M)输出(USD/1M)量化上下文
Phala0.040.1unknown32768
Together0.30.3fp832768

代表价(满血最低):Phala 输入 0.04 / 输出 0.1 USD/1M。按 provider 选择可进一步降本。

07官方资源

08API 定价 全站比价 →

缓存命中 输入 0.1 / 输出 2 CNY/百万token
标准 输入 0.04 / 输出 0.1 USD/百万token
标准 输入 0.5 / 输出 2 CNY/百万token · 新用户赠送
预算估算器
USD ≈ 可输入 百万 token

09部署教程

Windows 用 Ollama 一键部署 Qwen2.5-7B

10真实评测

Qwen2.5-7B-Instruct 本地部署评测Qwen2.5-7B 本地部署实测:中文单卡首选

11同类模型