模型

Meta: Llama 4 Scout

仅 API 开源
Meta · Llama 4 · — · 17B激活/109B(MoE) · 上下文 10M
能做什么
长文档理解图文多模态通用对话代码辅助超长RAG
部署门槛
多卡
≥ ~64GB(Q4,多卡)
API 价格
$0.11 /百万
输入/标准档 · 全站比价 →
上下文
10M
token 窗口
参数
17B激活/109B(MoE)
Llama 4

01基础参数

参数规模
17B激活/109B(MoE)
上下文窗口
10M
输入模态
image / text
可生成
text
模型系列
Llama 4
开源许可
主要语言

02MoE 架构说明

MoE 混合专家 总参 17B激活/109B(MoE) · 激活
部署门槛按「激活参数」计算,不等同于总参数量——这是 MoE 模型更易部署的关键。

03推荐部署方案

推荐 FP8/Q4(多卡) vllm/ollama

04部署门槛详情

硬件等级 多卡 · 最低显存 ~64GB(Q4,多卡)
超长上下文多模态通用助手代码

05Benchmark 评测

待补充

06适用场景

✓ 适用
超长文档/代码库分析(10M)、图文多模态任务、需较新知识的对话
✗ 不适用
单消费卡满血部署(需多卡)、纯音频场景、视频生成

07详细介绍

来源:OpenRouter API(scraper 采集,2026-06-30)

Llama 4 Scout 17B Instruct (16E) is a mixture-of-experts (MoE) language model developed by Meta, activating 17 billion parameters out of a total of 109B. It supports native multimodal input…

OpenRouter Provider 比价

共 4 家 provider(2026-06-30 采集),按输入价升序:

Provider输入(USD/1M)输出(USD/1M)量化上下文
DeepInfra0.10.3fp8327680
Groq0.110.34unknown131072
Novita0.180.59bf16131072
Google0.250.7unknown1310720

代表价(满血最低):Groq 输入 0.11 / 输出 0.34 USD/1M。按 provider 选择可进一步降本。

08官方资源

09API 定价 全站比价 →

标准 输入 0.11 / 输出 0.34 USD/百万token
预算估算器
USD ≈ 可输入 百万 token

10同类模型