模型全景
按你的情况和目标,找到适合本地部署的模型。点场景卡快速筛选。
Claude 3.5 Sonnet api
闭源 · multi
价格$3/M
编码写作分析
生成: text
Claude 3 Opus api
闭源 · multi
价格$15/M
复杂分析创作
生成: text
DeepSeek-V3 多卡
671B(37B激活,MoE) · 中文友好 · 可商用
价格免费
通用助手代码推理Agent
生成: text
DeepSeek-R1 多卡
671B(37B激活,MoE) · 中文友好 · 可商用
价格¥4/M
推理数学编程研究
生成: text
示例 Qwen2.5-7B both
7B ·
价格¥0.5/M
Gemini 1.5 Pro api
闭源 · multi
价格$2.5/M
超长文档视频理解
生成: text
GLM-4-Flash 消费级8-12G
9B · 中文友好 · 可商用
价格免费
低成本高并发
生成: text
Gemini 2.0 Flash api
闭源 · multi
价格$0.1/M
高并发实时
生成: text
GLM-4 高端24G+
闭源 · 中文友好
价格¥0.1/M
Agent中文应用
生成: text
GPT-4o mini api
— · multi
价格$0.15/M
通用助手成本敏感轻量多模态
生成: text
GPT-4o api
— · multi
价格$2.5/M
多模态通用助手实时语音
生成: text / audio
Llama 3.1 70B (Groq极速) api
70B · 英文 · 可商用
价格免费
实时对话低延迟
生成: text
Llama 3.1 70B 多卡
70B · 英文 · 可商用
本地部署英文场景微调
生成: text
Llama 3.1 8B 消费级8-12G
8B · 英文 · 可商用
本地部署英文场景
生成: text
Llama 3.2 1B CPU可跑
1B · 英文 · 可商用
CPU轻量边缘设备入门
生成: text
Moonshot-v1 api
闭源 · 中文友好
价格¥12/M
长文档分析
生成: text
Meta: Llama 4 Scout 多卡
17B激活/109B(MoE) ·
价格$0.11/M
超长上下文多模态通用助手代码
生成: text
o1 api
— · multi
价格$15/M
推理数学编程研究
生成: text
Microsoft: Phi 4 消费级8-12G
14B ·
价格$0.07/M
推理数学编程端侧部署
生成: text
Qwen-Max api
闭源 · 中文友好
价格¥20/M
企业应用中文
生成: text
Qwen2.5-7B-Instruct 消费级8-12G
7.6B · 中文友好 · 可商用
价格$0.04/M
中文对话代码RAG多语言
生成: text
Qwen2-VL-7B 中端16-24G
7B · 中文友好 · 可商用
看图理解视觉问答OCR
生成: text
Qwen: Qwen3 32B 高端24G+
32B ·
价格$0.104/M
推理数学编程通用助手
生成: text
DeepSeek-V3 (硅基流动) api
671B · 中文友好 · 可商用
价格免费
国内API免运维
生成: text
Stable Diffusion XL 中端16-24G
3.5B · multi · 可商用
出图图像生成设计
生成: image
Qwen2.5-72B-Instruct 多卡
72B · 中文友好 · 可商用
价格$0.38/M
代码数学知识问答企业
生成: text
Whisper-Large-v3 消费级8-12G
1.5B(1550M) · · 可商用
语音识别转录字幕
生成: text
Qwen2.5-3B-Instruct CPU可跑
3B · 中文友好 · 可商用
中文对话CPU轻量入门
生成: text
Anthropic Claude Sonnet Latest api
— ·
价格$3/M
编程推理长上下文多模态
生成: text
Google: Gemini 2.5 Pro api
— ·
价格$1.25/M
推理编程多模态长上下文
生成: text
Z.ai: GLM 5.1 api
— ·
价格$0.975/M
Agent编程推理工程自动化
生成: text
xAI: Grok 4.20 api
— ·
价格$1.25/M
推理Agent实时信息多模态
生成: text
MoonshotAI Kimi Latest api
1T(32B激活,MoE) ·
价格$0.55/M
Agent编程长上下文多模态
生成: text
BGE-M3 CPU可跑
568M · · 可商用
RAG搜索嵌入
生成: embedding
ChatTTS CPU可跑
~0.4B ·
语音合成对话
生成: audio
CosyVoice 消费级8-12G
~0.5B · · 可商用
语音合成配音
生成: audio
CogVideoX 高端24G+
5B ·
视频生成创作
生成: video
FLUX.1-dev 高端24G+
12B ·
图像生成设计创作
生成: image