大模型导航 · 本地部署知识库

Qwen2-VL-7B

API+本地开源可商用

阿里通义千问 · Qwen2.5 · Apache-2.0 · 7B · 上下文 128K

能做什么

图像理解OCR识别

部署门槛

中端 16-24G

≥ 12GB

API 价格

—

输入/标准档 · 全站比价 →

上下文

128K

token 窗口

参数

7B

Qwen2.5

01基础参数

参数规模: 7B
上下文窗口: 128K
输入模态: text / vision
可生成: text
模型系列: Qwen2.5
开源许可: Apache-2.0
主要语言: zh

02推荐部署方案

推荐 Q4_K_M ollama

03部署门槛详情

硬件等级中端 16-24G · 最低显存 12GB

看图理解视觉问答OCR

04Benchmark 评测

待补充

05详细介绍

Qwen2-VL-7B 是开源视觉语言模型，擅长看图理解/OCR/视觉问答（注意：是”理解图像”，不是生成图）。

06官方资源

官网 ↗ API 文档 ↗ 控制台 ↗

07同类模型

Qwen2.5-7B-Instruct

7.6B · 消费级 8-12G

Qwen2.5-72B-Instruct

Qwen2.5-3B-Instruct

3B · CPU 可跑