软件开发与交付 · 开源项目

vllm

vllm 是一个面向「软件开发与交付」的开源项目，重点覆盖知识检索、知识库问答；Doramagic 已整理安装入口、说明书、上下文包和风险边界，方便先判断再试用。

知识检索知识库问答长期记忆节点式流程编排本地优先

最适合谁需要软件开发与交付能力，并使用本地 CLI的用户

判断自己是不是目标用户。

能做什么vllm 是一个面向「软件开发与交付」的开源项目，重点覆盖知识检索、知识库问答；Doramagic 已整理安装入口、说明书、上下文包和风险边界，方便先判断再试用。

查看可带走的能力路径。

继续前发布到 Doramagic.ai 项目页面

未完成验证前保持审慎。

GitHub 快照80k 星标

17k 分叉 · 2.6k 贡献者

官方quick start 阅读项目说明书源仓库

快速判断 · 2026-05-13

vllm 项目是什么？

vllm 是一个面向「软件开发与交付」的开源项目，重点覆盖知识检索、知识库问答；Doramagic 已整理安装入口、说明书、上下文包和风险边界，方便先判断再试用。
适合：需要软件开发与交付能力，并使用本地 CLI的用户
它给 AI 增加的能力：mcp_config、使用配方、宿主说明、评估规则、预检清单
证据基础：https://github.com/vllm-project/vllm、https://github.com/vllm-project/vllm、https://github.com/vllm-project/vllm#readme
限制：发布到 Doramagic.ai 项目页面

一眼判断

先判断自己是否是目标用户，再决定是否继续。

最适合谁需要软件开发与交付能力，并使用本地 CLI的用户

判断自己是不是目标用户。

核心价值需要继续补证

先理解能力边界，再决定是否继续。

继续前发布到 Doramagic.ai 项目页面

未完成验证前保持审慎。

它能做什么

把项目翻译成用户能判断的具体能力，而不是 Doramagic 的使用流程。

知识检索

继续阅读项目说明书确认具体能力边界。

ability-1

知识库问答

帮助用户判断这个项目适合什么工作，而不是只看技术名词。

ability-2

长期记忆

说明输入、输出、失败模式和继续前需要复核的边界。

ability-3

节点式流程编排

沉淀为 Prompt、说明书、上下文包或预检清单等可带走资产。

ability-4

来源：https://github.com/vllm-project/vllm、Human Manual、项目命中包和下游验证。这里只回答“它能帮我做什么”。

项目温度与外部声音

GitHub API 快照，非实时质量证明；用于开工前背景判断。

星标80k

分叉17k

贡献者2.6k

许可证未知

状态可发布

社区讨论

已收录 12 条来源

下面是已采集到的项目级社区讨论来源，来源平台：github。这些外部声音用于帮助判断真实使用反馈，不单独作为质量证明。

01
[Bug]: vLLM v1 with prefix caching: first request differs from subsequen
github / github_issue
02
[AMD][CI Failure][Tracker] Static dashboard tracker for current CI failu
github / github_issue
03
[Usage]: How to proactively clear CPU-resident memory left behind by unl
github / github_issue
04
[Feature]: Qwen3.5-Moe LoRA Support (experts)
github / github_issue
05
[Bug]: ngram speculative decoding changes greedy output on Qwen3-0.6B /
github / github_issue
06
[Bug]: Qwen3.5-397B-NVFP4 Disagg accuracy gsm8k collapses with async sch
github / github_issue
07
v0.20.2
github / github_release
08
v0.20.1
github / github_release
09
v0.20.0
github / github_release
10
v0.19.1
github / github_release
11
v0.19.0
github / github_release
12
v0.18.1
github / github_release

怎么开始使用

先试、再读项目说明书、再带给 AI，最后按官方quick start验证。

先试 Prompt

不安装项目，先体验能力节奏。

预览

读项目说明书

理解输入、输出、失败模式和边界。

说明书

带给 AI

把上下文交给你的宿主 AI 继续工作。

上下文

沙箱验证

进入主力环境前先完成安装入口与风险边界验证。

验证

Python / pip · 官方安装入口pip install vllm

来源：https://github.com/vllm-project/vllm#readme。验证：已通过。

项目说明书

每个项目结构不同，Doramagic 保留原项目解释结构，并补充边界与踩坑日志。

草稿 · 项目说明书

vllm 说明书

生成时间：2026-05-11 03:40:03 UTC

打开完整说明书

https://github.com/vllm-project/vllm 项目说明书
目录
项目介绍
相关页面
1 项目概述
1.1 核心价值主张
1.2 版本信息

带给 AI 的上下文包

决定继续后，把项目上下文带给你的宿主 AI。

标准项目包 + 用户可带走资产

这不是营销摘要。它是用户决定继续后，可交给 Claude Code、Codex、Gemini、Cursor 等宿主 AI 的开工前上下文。

下载完整包阅读项目说明书

完整包完整项目包资产带给 AI 的上下文包资产边界与风险卡资产项目说明书资产踩坑日志资产安装前试用 Prompt资产官方quick start清单PROJECT_PACK.json

继续前检查

在复制命令、导入 AI、安装插件前，看清还不能相信什么。

检查 1

不要把试用当真实运行

试用 Prompt 只展示流程，不证明项目已安装或运行。

检查 2

确认宿主兼容

本地 CLI

检查 3

先隔离验证

发布到 Doramagic.ai 项目页面

发布到 Doramagic.ai 项目页面

踩坑日志与复核重点

Doramagic 记录的高风险项优先显示，避免用户把候选能力当成已验证能力。

medium · 安装坑

来源证据：[Bug]: Qwen3.5-397B-NVFP4 Disagg accuracy gsm8k collapses with async scheduling

GitHub 社区证据显示该项目存在一个安装相关的待验证问题：[Bug]: Qwen3.5-397B-NVFP4 Disagg accuracy gsm8k collapses with async scheduling

可能增加新用户试用和生产接入成本。

medium · 安装坑

来源证据：[Bug]: vLLM v1 with prefix caching: first request differs from subsequent identical requests at temperature=0

GitHub 社区证据显示该项目存在一个安装相关的待验证问题：[Bug]: vLLM v1 with prefix caching: first request differs from subsequent identical requests at temperature=0

可能增加新用户试用和生产接入成本。

medium · 安装坑

来源证据：[Usage]: How to proactively clear CPU-resident memory left behind by unloaded LoRA adapters after calling `/v1/unload_l…

GitHub 社区证据显示该项目存在一个安装相关的待验证问题：[Usage]: How to proactively clear CPU-resident memory left behind by unloaded LoRA adapters after calling `/v1/unload_lora_adapter`?

可能增加新用户试用和生产接入成本。

medium · 安装坑

来源证据：v0.18.1

GitHub 社区证据显示该项目存在一个安装相关的待验证问题：v0.18.1

可能增加新用户试用和生产接入成本。

medium · 能力坑

来源证据：[Feature]: Qwen3.5-Moe LoRA Support (experts)

GitHub 社区证据显示该项目存在一个能力理解相关的待验证问题：[Feature]: Qwen3.5-Moe LoRA Support (experts)

可能增加新用户试用和生产接入成本。

medium · 能力坑

能力判断依赖假设

README / 文档足够支持第一次验证，但仍需继续核对。

假设不成立时，用户拿不到承诺的能力。

medium · 运行坑

来源证据：v0.20.2

GitHub 社区证据显示该项目存在一个运行相关的待验证问题：v0.20.2

可能增加新用户试用和生产接入成本。

medium · 维护坑

维护活跃度未知

未记录 last_activity_observed。

新项目、停更项目和活跃项目会被混在一起，推荐信任度下降。

medium · 安全/权限坑

下游验证发现风险项

缺少可复核演示

下游已经要求复核，不能在页面中弱化。

medium · 安全/权限坑

存在安全注意事项

需要继续复核。

用户安装前需要知道权限边界和敏感操作。

medium · 安全/权限坑

存在评分风险

缺少可复核演示

风险会影响是否适合普通用户安装。

medium · 安全/权限坑

来源证据：[Bug]: ngram speculative decoding changes greedy output on Qwen3-0.6B / A100

GitHub 社区证据显示该项目存在一个安全/权限相关的待验证问题：[Bug]: ngram speculative decoding changes greedy output on Qwen3-0.6B / A100

可能影响授权、密钥配置或安全边界。

下一步：发布到 Doramagic.ai 项目页面。

vllm

vllm 项目 是什么？

一眼判断

它能做什么

知识检索

知识库问答

长期记忆

节点式流程编排

项目温度与外部声音

社区讨论

怎么开始使用

先试 Prompt

读项目说明书

带给 AI

沙箱验证

项目说明书

vllm 说明书

带给 AI 的上下文包

标准项目包 + 用户可带走资产

继续前检查

不要把试用当真实运行

确认宿主兼容

先隔离验证

踩坑日志与复核重点

来源证据：[Bug]: Qwen3.5-397B-NVFP4 Disagg accuracy gsm8k collapses with async scheduling

来源证据：[Bug]: vLLM v1 with prefix caching: first request differs from subsequent identical requests at temperature=0

来源证据：[Usage]: How to proactively clear CPU-resident memory left behind by unloaded LoRA adapters after calling `/v1/unload_l…

来源证据：v0.18.1

来源证据：[Feature]: Qwen3.5-Moe LoRA Support (experts)

能力判断依赖假设

来源证据：v0.20.2

维护活跃度未知

下游验证发现风险项

存在安全注意事项

存在评分风险

来源证据：[Bug]: ngram speculative decoding changes greedy output on Qwen3-0.6B / A100

vllm 项目是什么？