模型

Qwen: Qwen3 32B

仅 API 开源
阿里通义千问 · Qwen3 · — · 32B · 上下文 128K
能做什么
推理数学编程通用对话Agent(thinking)
部署门槛
高端 24G+
≥ ~20GB(Q4,需24GB+卡)
API 价格
$0.104 /百万
输入/标准档 · 全站比价 →
上下文
128K
token 窗口
参数
32B
Qwen3

01基础参数

参数规模
32B
上下文窗口
128K
输入模态
text
可生成
text
模型系列
Qwen3
开源许可
主要语言

02推荐部署方案

推荐 Q4_K_M ollama

03部署门槛详情

硬件等级 高端 24G+ · 最低显存 ~20GB(Q4,需24GB+卡)
推理数学编程通用助手

04Benchmark 评测

待补充

05适用场景

✓ 适用
数学推理、编程、需深思的多步任务、单24GB卡部署
✗ 不适用
极致低延迟(thinking慢)、超大规模多模态

06详细介绍

来源:OpenRouter API(scraper 采集,2026-06-30)

Qwen3-32B is a dense 32.8B parameter causal language model from the Qwen3 series, optimized for both complex reasoning and efficient dialogue. It supports seamless switching between a “thinking” mode for…

OpenRouter Provider 比价

共 6 家 provider(2026-06-30 采集),按输入价升序:

Provider输入(USD/1M)输出(USD/1M)量化上下文
DeepInfra0.080.28fp840960
Nebius0.10.3fp840960
AtlasCloud0.11.2fp840960
Alibaba0.1040.416unknown131072
SiliconFlow0.140.57fp8131072
Groq0.290.59unknown131072

代表价(满血最低):Alibaba 输入 0.104 / 输出 0.416 USD/1M。按 provider 选择可进一步降本。

07官方资源

08API 定价 全站比价 →

标准 输入 0.104 / 输出 0.416 USD/百万token
预算估算器
USD ≈ 可输入 百万 token

09同类模型