◆
模型
舱
首页
模型全景
选型助手
能力对比
定价查询
厂商
知识库
搜索
大模型导航 · 本地部署知识库
菜单
≡
首页
模型全景
选型助手
能力对比
定价查询
厂商
知识库
首页
›
知识库
›
Linux 用 vLLM 部署 Qwen2.5-72B(高并发)
Linux 用 vLLM 部署 Qwen2.5-72B(高并发)
查看模型详情 →
vLLM
难度:高级
耗时:2 小时
linux
前置条件:
多卡 A100/H100、CUDA 12+
vLLM 部署 Qwen2.5-72B,高并发推理。