# lightrag-webui - Doramagic AI Context Pack

> 定位：安装前体验与判断资产。它帮助宿主 AI 有一个好的开始，但不代表已经安装、执行或验证目标项目。

## 充分原则

- **充分原则，不是压缩原则**：AI Context Pack 应该充分到让宿主 AI 在开工前理解项目价值、能力边界、使用入口、风险和证据来源；它可以分层组织，但不以最短摘要为目标。
- **压缩策略**：只压缩噪声和重复内容，不压缩会影响判断和开工质量的上下文。

## 给宿主 AI 的使用方式

你正在读取 Doramagic 为 lightrag-webui 编译的 AI Context Pack。请把它当作开工前上下文：帮助用户理解适合谁、能做什么、如何开始、哪些必须安装后验证、风险在哪里。不要声称你已经安装、运行或执行了目标项目。

## Claim 消费规则

- **事实来源**：Repo Evidence + Claim/Evidence Graph；Human Wiki 只提供显著性、术语和叙事结构。
- **事实最低状态**：`supported`
- `supported`：可以作为项目事实使用，但回答中必须引用 claim_id 和证据路径。
- `weak`：只能作为低置信度线索，必须要求用户继续核实。
- `inferred`：只能用于风险提示或待确认问题，不能包装成项目事实。
- `unverified`：不得作为事实使用，应明确说证据不足。
- `contradicted`：必须展示冲突来源，不得替用户强行选择一个版本。

## 它最适合谁

- **AI 研究者或研究型 Agent 构建者**：README 明确围绕研究、实验或论文工作流展开。 证据：`README.md` Claim：`clm_0021` supported 0.86
- **正在使用 Claude/Codex/Cursor/Gemini 等宿主 AI 的开发者**：README 或插件配置提到多个宿主 AI。 证据：`README.md` Claim：`clm_0022` supported 0.86

## 它能做什么

- **Knowledge Graph-Enhanced RAG**（需要安装后验证）：LightRAG implements retrieval-augmented generation with graph-based knowledge representation, extracting entities and relationships to enable multi-mode querying (local, global, hybrid, mix, naive). 证据：`AGENTS.md`, `docs/Algorithm.md` Claim：`clm_0001` supported 0.86, `clm_0003` supported 0.86, `clm_0004` supported 0.86, `clm_0005` supported 0.86 等
- **Multimodal Document Processing**（需要安装后验证）：LightRAG supports multimodal document parsing for PDFs, Office documents, images, tables, and equations via external MinerU/Docling services, with VLM-based analysis capability. 证据：`README.md`, `docs/FileProcessingPipeline.md`, `docs/AdvancedFeatures.md` Claim：`clm_0002` supported 0.86, `clm_0005` supported 0.86, `clm_0006` supported 0.86, `clm_0008` supported 0.86 等
- **Multi-Backend Storage Architecture**（可做安装前预览）：LightRAG supports 4 storage types (vector, KV, graph, doc-status) with multiple backend implementations including Neo4j, PostgreSQL, Redis, Milvus, Qdrant, MongoDB, Memgraph, OpenSearch, NetworkX, and Faiss. 证据：`AGENTS.md`, `k8s-deploy/README.md`, `docs/MilvusConfigurationGuide.md` Claim：`clm_0001` supported 0.86, `clm_0003` supported 0.86, `clm_0004` supported 0.86, `clm_0005` supported 0.86 等
- **Multi-Provider LLM/Embedding Support**（需要安装后验证）：LightRAG supports multiple LLM providers (OpenAI, Ollama, Azure, Gemini, Bedrock, Anthropic, Lollms) and embedding providers (OpenAI, Ollama, Jina, Gemini, VoyageAI) with async and caching support. 证据：`docs/LightRAG-API-Server.md`, `AGENTS.md` Claim：`clm_0001` supported 0.86, `clm_0003` supported 0.86, `clm_0004` supported 0.86, `clm_0005` supported 0.86 等
- **Role-Based LLM Configuration**（需要安装后验证）：LightRAG v1.5+ supports role-specific LLM configuration with 4 distinct roles (EXTRACT, QUERY, KEYWORDS, VLM) and independent LLM settings per role. 证据：`README.md`, `AGENTS.md` Claim：`clm_0001` supported 0.86, `clm_0002` supported 0.86, `clm_0003` supported 0.86, `clm_0004` supported 0.86 等
- **Multiple Text Chunking Strategies**（可做安装前预览）：LightRAG provides 4 selectable text chunking methods: Fix (token-size), Recursive (character-based), Vector (semantic), and Paragraph (semantic paragraph splitting). 证据：`README.md`, `AGENTS.md`, `docs/FileProcessingPipeline.md` Claim：`clm_0001` supported 0.86, `clm_0002` supported 0.86, `clm_0003` supported 0.86, `clm_0004` supported 0.86 等
- **Asymmetric Embedding Support**（可做安装前预览）：LightRAG supports query/document asymmetric embeddings with configurable prefixes and provider-specific task parameters (Jina, Gemini, VoyageAI). 证据：`docs/AsymmetricEmbedding.md` Claim：`clm_0007` supported 0.86
- **Reranking Support**（需要安装后验证）：LightRAG supports reranking to boost performance for mixed queries, with Cohere reranker as the default query mode in v1.5+. 证据：`README.md`, `docs/DockerDeployment.md` Claim：`clm_0002` supported 0.86, `clm_0005` supported 0.86, `clm_0006` supported 0.86, `clm_0008` supported 0.86 等
- **3D Knowledge Graph Visualization**（可做安装前预览）：LightRAG includes an interactive 3D graph viewer using ModernGL for visualizing RAG knowledge graphs with multiple layout algorithms and community detection. 证据：`lightrag/tools/lightrag_visualizer/README.md` Claim：`clm_0009` supported 0.86
- **FastAPI REST API Server**（需要安装后验证）：LightRAG provides a FastAPI-based REST server with Ollama-compatible interface for integration with AI chat bots like Open WebUI. 证据：`AGENTS.md`, `docs/LightRAG-API-Server.md` Claim：`clm_0001` supported 0.86, `clm_0003` supported 0.86, `clm_0004` supported 0.86, `clm_0005` supported 0.86 等
- **React WebUI**（可做安装前预览）：LightRAG includes a React-based web interface for document indexing, knowledge graph exploration, and RAG querying with Bun/Vite/Tailwind stack. 证据：`lightrag_webui/README.md`, `docs/FrontendBuildGuide.md` Claim：`clm_0011` supported 0.86
- **Token Usage Tracking**（可做安装前预览）：LightRAG provides a TokenTracker utility to monitor token consumption from LLM providers for cost control and performance optimization. 证据：`docs/AdvancedFeatures.md` Claim：`clm_0002` supported 0.86, `clm_0012` supported 0.86
- **RAGAS Evaluation Support**（可做安装前预览）：LightRAG integrates RAGAS framework for evaluating RAG quality, returning retrieved contexts alongside query results for precision metrics. 证据：`README.md`, `lightrag/evaluation/sample_documents/README.md` Claim：`clm_0002` supported 0.86, `clm_0005` supported 0.86, `clm_0006` supported 0.86, `clm_0008` supported 0.86 等
- **Kubernetes Deployment**（可做安装前预览）：LightRAG provides Helm charts for Kubernetes deployment supporting both lightweight (local storage) and production (PostgreSQL, Neo4j) configurations. 证据：`k8s-deploy/README.md`, `k8s-deploy/databases/README.md` Claim：`clm_0003` supported 0.86, `clm_0014` supported 0.86
- **Docker Compose Deployment**（可做安装前预览）：LightRAG supports Docker-based deployment with Docker Compose for local development and testing, including local vLLM embedding/reranking services. 证据：`docs/DockerDeployment.md`, `docs/InteractiveSetup.md` Claim：`clm_0008` supported 0.86, `clm_0015` supported 0.86, `clm_0016` supported 0.86
- **Interactive Setup Wizard**（可做安装前预览）：LightRAG provides an interactive CLI wizard (via make targets) to configure LLM, embedding, storage, and server settings with validation and security checks. 证据：`docs/InteractiveSetup.md` Claim：`clm_0015` supported 0.86, `clm_0016` supported 0.86
- **Document Deletion with KG Regeneration**（可做安装前预览）：LightRAG v1.5+ supports deleting documents with automatic knowledge graph regeneration to maintain consistency. 证据：`README.md` Claim：`clm_0002` supported 0.86, `clm_0005` supported 0.86, `clm_0006` supported 0.86, `clm_0008` supported 0.86 等
- **Multi-Site Deployment with Reverse Proxy**（可做安装前预览）：LightRAG supports running multiple isolated instances behind a reverse proxy with shared WebUI using runtime-config-injected prefixes. 证据：`docs/MultiSiteDeployment.md` Claim：`clm_0018` supported 0.86
- **OpenSearch Storage Backend**（可做安装前预览）：LightRAG v1.5+ integrates OpenSearch as a unified storage backend providing comprehensive support for all four LightRAG storage types. 证据：`README.md` Claim：`clm_0002` supported 0.86, `clm_0005` supported 0.86, `clm_0006` supported 0.86, `clm_0008` supported 0.86 等
- **Large-Scale Dataset Support**（可做安装前预览）：LightRAG v1.5+ eliminated processing bottlenecks to efficiently support large-scale datasets with improved scalability. 证据：`README.md` Claim：`clm_0002` supported 0.86, `clm_0005` supported 0.86, `clm_0006` supported 0.86, `clm_0008` supported 0.86 等

## 怎么开始

- `uv tool install "lightrag-hku[api]"` 证据：`README.md` Claim：`clm_0023` supported 0.86
- `git clone https://github.com/HKUDS/LightRAG.git` 证据：`README.md` Claim：`clm_0024` supported 0.86
- `curl https://raw.githubusercontent.com/gusye1234/nano-graphrag/main/tests/mock_data.txt > ./book.txt` 证据：`README.md` Claim：`clm_0025` supported 0.86

## 继续前判断卡

- **当前建议**：先做角色匹配试用
- **为什么**：这个项目更像角色库，核心风险是选错角色或把角色文案当执行能力；先用 Prompt Preview 试角色匹配，再决定是否沙盒导入。

### 30 秒判断

- **现在怎么做**：先做角色匹配试用
- **最小安全下一步**：先用 Prompt Preview 试角色匹配；满意后再隔离导入
- **先别相信**：角色质量和任务匹配不能直接相信。
- **继续会触碰**：角色选择偏差、命令执行、宿主 AI 配置

### 现在可以相信

- **适合人群线索：AI 研究者或研究型 Agent 构建者**（supported）：有 supported claim 或项目证据支撑，但仍不等于真实安装效果。 证据：`README.md` Claim：`clm_0021` supported 0.86
- **适合人群线索：正在使用 Claude/Codex/Cursor/Gemini 等宿主 AI 的开发者**（supported）：有 supported claim 或项目证据支撑，但仍不等于真实安装效果。 证据：`README.md` Claim：`clm_0022` supported 0.86
- **能力存在：Knowledge Graph-Enhanced RAG**（supported）：可以相信项目包含这类能力线索；是否适合你的具体任务仍要试用或安装后验证。 证据：`AGENTS.md`, `docs/Algorithm.md` Claim：`clm_0001` supported 0.86, `clm_0003` supported 0.86, `clm_0004` supported 0.86, `clm_0005` supported 0.86
- **能力存在：Multimodal Document Processing**（supported）：可以相信项目包含这类能力线索；是否适合你的具体任务仍要试用或安装后验证。 证据：`README.md`, `docs/FileProcessingPipeline.md`, `docs/AdvancedFeatures.md` Claim：`clm_0002` supported 0.86, `clm_0005` supported 0.86, `clm_0006` supported 0.86, `clm_0008` supported 0.86
- **能力存在：Multi-Backend Storage Architecture**（supported）：可以相信项目包含这类能力线索；是否适合你的具体任务仍要试用或安装后验证。 证据：`AGENTS.md`, `k8s-deploy/README.md`, `docs/MilvusConfigurationGuide.md` Claim：`clm_0001` supported 0.86, `clm_0003` supported 0.86, `clm_0004` supported 0.86, `clm_0005` supported 0.86
- **能力存在：Multi-Provider LLM/Embedding Support**（supported）：可以相信项目包含这类能力线索；是否适合你的具体任务仍要试用或安装后验证。 证据：`docs/LightRAG-API-Server.md`, `AGENTS.md` Claim：`clm_0001` supported 0.86, `clm_0003` supported 0.86, `clm_0004` supported 0.86, `clm_0005` supported 0.86

### 现在还不能相信

- **角色质量和任务匹配不能直接相信。**（unverified）：角色库证明有很多角色，不证明每个角色都适合你的具体任务，也不证明角色能产生高质量结果。
- **不能把角色文案当成真实执行能力。**（unverified）：安装前只能判断角色描述和任务画像是否匹配，不能证明它能在宿主 AI 里完成任务。
- **真实输出质量不能在安装前相信。**（unverified）：Prompt Preview 只能展示引导方式，不能证明真实项目中的结果质量。
- **宿主 AI 版本兼容性不能在安装前相信。**（unverified）：Claude、Cursor、Codex、Gemini 等宿主加载规则和版本差异必须在真实环境验证。
- **不会污染现有宿主 AI 行为，不能直接相信。**（inferred）：Skill、plugin、AGENTS/CLAUDE/GEMINI 指令可能改变宿主 AI 的默认行为。 证据：`AGENTS.md`, `CLAUDE.md`
- **可安全回滚不能默认相信。**（unverified）：除非项目明确提供卸载和恢复说明，否则必须先在隔离环境验证。
- **真实安装后是否与用户当前宿主 AI 版本兼容？**（unverified）：兼容性只能通过实际宿主环境验证。
- **项目输出质量是否满足用户具体任务？**（unverified）：安装前预览只能展示流程和边界，不能替代真实评测。

### 继续会触碰什么

- **角色选择偏差**：用户对任务应该由哪个专家角色处理的判断。 原因：选错角色会让 AI 从错误专业视角回答，浪费时间或误导决策。
- **命令执行**：包管理器、网络下载、本地插件目录、项目配置或用户主目录。 原因：运行第一条命令就可能产生环境改动；必须先判断是否值得跑。 证据：`README.md`
- **宿主 AI 配置**：Claude/Codex/Cursor/Gemini/OpenCode 等宿主的 plugin、Skill 或规则加载配置。 原因：宿主配置会改变 AI 后续工作方式，可能和用户已有规则冲突。 证据：`AGENTS.md`, `CLAUDE.md`
- **本地环境或项目文件**：安装结果、插件缓存、项目配置或本地依赖目录。 原因：安装前无法证明写入范围和回滚方式，需要隔离验证。 证据：`AGENTS.md`, `README.md`, `docs/AdvancedFeatures.md`, `docs/Algorithm.md` 等
- **宿主 AI 上下文**：AI Context Pack、Prompt Preview、Skill 路由、风险规则和项目事实。 原因：导入上下文会影响宿主 AI 后续判断，必须避免把未验证项包装成事实。

### 最小安全下一步

- **先跑 Prompt Preview**：先用交互式试用验证任务画像和角色匹配，不要先导入整套角色库。（适用：任何项目都适用，尤其是输出质量未知时。）
- **只在隔离目录或测试账号试装**：避免安装命令污染主力宿主 AI、真实项目或用户主目录。（适用：存在命令执行、插件配置或本地写入线索时。）
- **先备份宿主 AI 配置**：Skill、plugin、规则文件可能改变 Claude/Cursor/Codex 的默认行为。（适用：存在插件 manifest、Skill 或宿主规则入口时。）
- **安装后只验证一个最小任务**：先验证加载、兼容、输出质量和回滚，再决定是否深用。（适用：准备从试用进入真实工作流时。）

### 退出方式

- **保留安装前状态**：记录原始宿主配置和项目状态，后续才能判断是否可恢复。
- **准备移除宿主 plugin / Skill / 规则入口**：如果试装后行为异常，可以把宿主 AI 恢复到试装前状态。
- **保留原始角色选择记录**：如果输出偏题，可以回到任务画像阶段重新选择角色，而不是继续沿着错误角色推进。
- **记录安装命令和写入路径**：没有明确卸载说明时，至少要知道哪些目录或配置需要手动清理。
- **如果没有回滚路径，不进入主力环境**：不可回滚是继续前阻断项，不应靠信任或运气继续。

## 哪些只能预览

- 解释项目适合谁和能做什么
- 基于项目文档演示典型对话流程
- 帮助用户判断是否值得安装或继续研究

## 哪些必须安装后验证

- 真实安装 Skill、插件或 CLI
- 执行脚本、修改本地文件或访问外部服务
- 验证真实输出质量、性能和兼容性

## 边界与风险判断卡

- **把安装前预览误认为真实运行**：用户可能高估项目已经完成的配置、权限和兼容性验证。 处理方式：明确区分 prompt_preview_can_do 与 runtime_required。 Claim：`clm_0026` inferred 0.45
- **命令执行会修改本地环境**：安装命令可能写入用户主目录、宿主插件目录或项目配置。 处理方式：先在隔离环境或测试账号中运行。 证据：`README.md` Claim：`clm_0027` supported 0.86
- **风险**： 处理方式：
- **风险**： 处理方式：
- **风险**： 处理方式：
- **风险**： 处理方式：
- **待确认**：真实安装后是否与用户当前宿主 AI 版本兼容？。原因：兼容性只能通过实际宿主环境验证。
- **待确认**：项目输出质量是否满足用户具体任务？。原因：安装前预览只能展示流程和边界，不能替代真实评测。
- **待确认**：安装命令是否需要网络、权限或全局写入？。原因：这影响企业环境和个人环境的安装风险。

## 开工前工作上下文

### 加载顺序

- 先读取 how_to_use.host_ai_instruction，建立安装前判断资产的边界。
- 读取 claim_graph_summary，确认事实来自 Claim/Evidence Graph，而不是 Human Wiki 叙事。
- 再读取 intended_users、capabilities 和 quick_start_candidates，判断用户是否匹配。
- 需要执行具体任务时，优先查 role_skill_index，再查 evidence_index。
- 遇到真实安装、文件修改、网络访问、性能或兼容性问题时，转入 risk_card 和 boundaries.runtime_required。

### 任务路由

- **Knowledge Graph-Enhanced RAG**：先说明这是安装后验证能力，再给出安装前检查清单。 边界：必须真实安装或运行后验证。 证据：`AGENTS.md`, `docs/Algorithm.md` Claim：`clm_0001` supported 0.86, `clm_0003` supported 0.86, `clm_0004` supported 0.86, `clm_0005` supported 0.86 等
- **Multimodal Document Processing**：先说明这是安装后验证能力，再给出安装前检查清单。 边界：必须真实安装或运行后验证。 证据：`README.md`, `docs/FileProcessingPipeline.md`, `docs/AdvancedFeatures.md` Claim：`clm_0002` supported 0.86, `clm_0005` supported 0.86, `clm_0006` supported 0.86, `clm_0008` supported 0.86 等
- **Multi-Backend Storage Architecture**：先基于 role_skill_index / evidence_index 帮用户挑选可用角色、Skill 或工作流。 边界：可做安装前 Prompt 体验。 证据：`AGENTS.md`, `k8s-deploy/README.md`, `docs/MilvusConfigurationGuide.md` Claim：`clm_0001` supported 0.86, `clm_0003` supported 0.86, `clm_0004` supported 0.86, `clm_0005` supported 0.86 等
- **Multi-Provider LLM/Embedding Support**：先说明这是安装后验证能力，再给出安装前检查清单。 边界：必须真实安装或运行后验证。 证据：`docs/LightRAG-API-Server.md`, `AGENTS.md` Claim：`clm_0001` supported 0.86, `clm_0003` supported 0.86, `clm_0004` supported 0.86, `clm_0005` supported 0.86 等
- **Role-Based LLM Configuration**：先说明这是安装后验证能力，再给出安装前检查清单。 边界：必须真实安装或运行后验证。 证据：`README.md`, `AGENTS.md` Claim：`clm_0001` supported 0.86, `clm_0002` supported 0.86, `clm_0003` supported 0.86, `clm_0004` supported 0.86 等
- **Multiple Text Chunking Strategies**：先基于 role_skill_index / evidence_index 帮用户挑选可用角色、Skill 或工作流。 边界：可做安装前 Prompt 体验。 证据：`README.md`, `AGENTS.md`, `docs/FileProcessingPipeline.md` Claim：`clm_0001` supported 0.86, `clm_0002` supported 0.86, `clm_0003` supported 0.86, `clm_0004` supported 0.86 等
- **Asymmetric Embedding Support**：先基于 role_skill_index / evidence_index 帮用户挑选可用角色、Skill 或工作流。 边界：可做安装前 Prompt 体验。 证据：`docs/AsymmetricEmbedding.md` Claim：`clm_0007` supported 0.86
- **Reranking Support**：先说明这是安装后验证能力，再给出安装前检查清单。 边界：必须真实安装或运行后验证。 证据：`README.md`, `docs/DockerDeployment.md` Claim：`clm_0002` supported 0.86, `clm_0005` supported 0.86, `clm_0006` supported 0.86, `clm_0008` supported 0.86 等
- **3D Knowledge Graph Visualization**：先基于 role_skill_index / evidence_index 帮用户挑选可用角色、Skill 或工作流。 边界：可做安装前 Prompt 体验。 证据：`lightrag/tools/lightrag_visualizer/README.md` Claim：`clm_0009` supported 0.86
- **FastAPI REST API Server**：先说明这是安装后验证能力，再给出安装前检查清单。 边界：必须真实安装或运行后验证。 证据：`AGENTS.md`, `docs/LightRAG-API-Server.md` Claim：`clm_0001` supported 0.86, `clm_0003` supported 0.86, `clm_0004` supported 0.86, `clm_0005` supported 0.86 等
- **React WebUI**：先基于 role_skill_index / evidence_index 帮用户挑选可用角色、Skill 或工作流。 边界：可做安装前 Prompt 体验。 证据：`lightrag_webui/README.md`, `docs/FrontendBuildGuide.md` Claim：`clm_0011` supported 0.86
- **Token Usage Tracking**：先基于 role_skill_index / evidence_index 帮用户挑选可用角色、Skill 或工作流。 边界：可做安装前 Prompt 体验。 证据：`docs/AdvancedFeatures.md` Claim：`clm_0002` supported 0.86, `clm_0012` supported 0.86
- **RAGAS Evaluation Support**：先基于 role_skill_index / evidence_index 帮用户挑选可用角色、Skill 或工作流。 边界：可做安装前 Prompt 体验。 证据：`README.md`, `lightrag/evaluation/sample_documents/README.md` Claim：`clm_0002` supported 0.86, `clm_0005` supported 0.86, `clm_0006` supported 0.86, `clm_0008` supported 0.86 等
- **Kubernetes Deployment**：先基于 role_skill_index / evidence_index 帮用户挑选可用角色、Skill 或工作流。 边界：可做安装前 Prompt 体验。 证据：`k8s-deploy/README.md`, `k8s-deploy/databases/README.md` Claim：`clm_0003` supported 0.86, `clm_0014` supported 0.86
- **Docker Compose Deployment**：先基于 role_skill_index / evidence_index 帮用户挑选可用角色、Skill 或工作流。 边界：可做安装前 Prompt 体验。 证据：`docs/DockerDeployment.md`, `docs/InteractiveSetup.md` Claim：`clm_0008` supported 0.86, `clm_0015` supported 0.86, `clm_0016` supported 0.86
- **Interactive Setup Wizard**：先基于 role_skill_index / evidence_index 帮用户挑选可用角色、Skill 或工作流。 边界：可做安装前 Prompt 体验。 证据：`docs/InteractiveSetup.md` Claim：`clm_0015` supported 0.86, `clm_0016` supported 0.86
- **Document Deletion with KG Regeneration**：先基于 role_skill_index / evidence_index 帮用户挑选可用角色、Skill 或工作流。 边界：可做安装前 Prompt 体验。 证据：`README.md` Claim：`clm_0002` supported 0.86, `clm_0005` supported 0.86, `clm_0006` supported 0.86, `clm_0008` supported 0.86 等
- **Multi-Site Deployment with Reverse Proxy**：先基于 role_skill_index / evidence_index 帮用户挑选可用角色、Skill 或工作流。 边界：可做安装前 Prompt 体验。 证据：`docs/MultiSiteDeployment.md` Claim：`clm_0018` supported 0.86
- **OpenSearch Storage Backend**：先基于 role_skill_index / evidence_index 帮用户挑选可用角色、Skill 或工作流。 边界：可做安装前 Prompt 体验。 证据：`README.md` Claim：`clm_0002` supported 0.86, `clm_0005` supported 0.86, `clm_0006` supported 0.86, `clm_0008` supported 0.86 等
- **Large-Scale Dataset Support**：先基于 role_skill_index / evidence_index 帮用户挑选可用角色、Skill 或工作流。 边界：可做安装前 Prompt 体验。 证据：`README.md` Claim：`clm_0002` supported 0.86, `clm_0005` supported 0.86, `clm_0006` supported 0.86, `clm_0008` supported 0.86 等

### 上下文规模

- 文件总数：415
- 重要文件覆盖：40/415
- 证据索引条目：77
- 角色 / Skill 条目：32

### 证据不足时的处理

- **missing_evidence**：说明证据不足，要求用户提供目标文件、README 段落或安装后验证记录；不要补全事实。
- **out_of_scope_request**：说明该任务超出当前 AI Context Pack 证据范围，并建议用户先查看 Human Manual 或真实安装后验证。
- **runtime_request**：给出安装前检查清单和命令来源，但不要替用户执行命令或声称已执行。
- **source_conflict**：同时展示冲突来源，标记为待核实，不要强行选择一个版本。

## Prompt Recipes

### 适配判断

- 目标：判断这个项目是否适合用户当前任务。
- 预期输出：适配结论、关键理由、证据引用、安装前可预览内容、必须安装后验证内容、下一步建议。

```text
请基于 lightrag-webui 的 AI Context Pack，先问我 3 个必要问题，然后判断它是否适合我的任务。回答必须包含：适合谁、能做什么、不能做什么、是否值得安装、证据来自哪里。所有项目事实必须引用 evidence_refs、source_paths 或 claim_id。
```

### 安装前体验

- 目标：让用户在安装前感受核心工作流，同时避免把预览包装成真实能力或营销承诺。
- 预期输出：一段带边界标签的体验剧本、安装后验证清单和谨慎建议；不含真实运行承诺或强营销表述。

```text
请把 lightrag-webui 当作安装前体验资产，而不是已安装工具或真实运行环境。

请严格输出四段：
1. 先问我 3 个必要问题。
2. 给出一段“体验剧本”：用 [安装前可预览]、[必须安装后验证]、[证据不足] 三种标签展示它可能如何引导工作流。
3. 给出安装后验证清单：列出哪些能力只有真实安装、真实宿主加载、真实项目运行后才能确认。
4. 给出谨慎建议：只能说“值得继续研究/试装”“先补充信息后再判断”或“不建议继续”，不得替项目背书。

硬性边界：
- 不要声称已经安装、运行、执行测试、修改文件或产生真实结果。
- 不要写“自动适配”“确保通过”“完美适配”“强烈建议安装”等承诺性表达。
- 如果描述安装后的工作方式，必须使用“如果安装成功且宿主正确加载 Skill，它可能会……”这种条件句。
- 体验剧本只能写成“示例台词/假设流程”：使用“可能会询问/可能会建议/可能会展示”，不要写“已写入、已生成、已通过、正在运行、正在生成”。
- Prompt Preview 不负责给安装命令；如用户准备试装，只能提示先阅读 Quick Start 和 Risk Card，并在隔离环境验证。
- 所有项目事实必须来自 supported claim、evidence_refs 或 source_paths；inferred/unverified 只能作风险或待确认项。

```

### 角色 / Skill 选择

- 目标：从项目里的角色或 Skill 中挑选最匹配的资产。
- 预期输出：候选角色或 Skill 列表，每项包含适用场景、证据路径、风险边界和是否需要安装后验证。

```text
请读取 role_skill_index，根据我的目标任务推荐 3-5 个最相关的角色或 Skill。每个推荐都要说明适用场景、可能输出、风险边界和 evidence_refs。
```

### 风险预检

- 目标：安装或引入前识别环境、权限、规则冲突和质量风险。
- 预期输出：环境、权限、依赖、许可、宿主冲突、质量风险和未知项的检查清单。

```text
请基于 risk_card、boundaries 和 quick_start_candidates，给我一份安装前风险预检清单。不要替我执行命令，只说明我应该检查什么、为什么检查、失败会有什么影响。
```

### 宿主 AI 开工指令

- 目标：把项目上下文转成一次对话开始前的宿主 AI 指令。
- 预期输出：一段边界明确、证据引用明确、适合复制给宿主 AI 的开工前指令。

```text
请基于 lightrag-webui 的 AI Context Pack，生成一段我可以粘贴给宿主 AI 的开工前指令。这段指令必须遵守 not_runtime=true，不能声称项目已经安装、运行或产生真实结果。
```


## 角色 / Skill 索引

- 共索引 32 个角色 / Skill / 项目文档条目。

- **🚀 LightRAG: Simple and Fast Retrieval-Augmented Generation**（project_doc）：🚀 LightRAG: Simple and Fast Retrieval-Augmented Generation 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`README.md`
- **LightRAG Helm Chart**（project_doc）：This is the Helm chart for LightRAG, used to deploy LightRAG services on a Kubernetes cluster. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`k8s-deploy/README.md`
- **LightRAG WebUI**（project_doc）：LightRAG WebUI is a React-based web interface for interacting with the LightRAG system. It provides a user-friendly interface for querying, managing, and exploring LightRAG's functionalities. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`lightrag_webui/README.md`
- **Using KubeBlocks to Deploy and Manage Databases**（project_doc）：Using KubeBlocks to Deploy and Manage Databases 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`k8s-deploy/databases/README.md`
- **Sample Documents for Evaluation**（project_doc）：These markdown files correspond to test questions in ../sample dataset.json . 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`lightrag/evaluation/sample_documents/README.md`
- **LightRAG 3D Graph Viewer**（project_doc）：An interactive 3D graph visualization tool included in the LightRAG package for visualizing and analyzing RAG Retrieval-Augmented Generation graphs and other graph structures. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`lightrag/tools/lightrag_visualizer/README.md`
- **Repository Guidelines**（project_doc）：LightRAG is a Retrieval-Augmented Generation RAG framework that uses graph-based knowledge representation for enhanced information retrieval. The system extracts entities and relationships from documents, builds a knowledge graph, and uses multiple retrieval modes local , global , hybrid , mix , naive for queries. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`AGENTS.md`
- **Claude**（project_doc）：Strictly follow the rules in ./AGENTS.md 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`CLAUDE.md`
- **Advanced Features**（project_doc）：LightRAG Server includes a multimodal document pipeline for text, images, tables, and equations. Document parsing is handled through external MinerU or Docling services configured by endpoint, so the server no longer needs to install or import the raganything package locally. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/AdvancedFeatures.md`
- **Algorithm**（project_doc）：! LightRAG Indexing Flowchart https://learnopencv.com/wp-content/uploads/2024/11/LightRAG-VectorDB-Json-KV-Store-Indexing-Flowchart-scaled.jpg Figure 1: LightRAG Indexing Flowchart - Img Caption : Source https://learnopencv.com/lightrag/ ! LightRAG Retrieval and Querying Flowchart https://learnopencv.com/wp-content/uploads/2024/11/LightRAG-Querying-Flowchart-Dual-Level-Retrieval-Generation-Knowledge-Graphs-scaled.jp… 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/Algorithm.md`
- **Asymmetric Embedding Configuration**（project_doc）：LightRAG keeps embedding behavior symmetric by default. Query/document asymmetric embedding is enabled only when EMBEDDING ASYMMETRIC=true is explicitly set. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/AsymmetricEmbedding.md`
- **LightRAG Docker Deployment**（project_doc）：A lightweight Knowledge Graph Retrieval-Augmented Generation system with multiple LLM backend support. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/DockerDeployment.md`
- **File Processing Pipeline Specification**（project_doc）：File Processing Pipeline Specification 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/FileProcessingPipeline.md`
- **Frontend Build Guide**（project_doc）：The LightRAG project includes a React-based WebUI frontend. This guide explains how frontend building works in different scenarios. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/FrontendBuildGuide.md`
- **Interactive Setup Guide**（project_doc）：Use the interactive setup wizard when you want LightRAG to guide you through the configuration instead of editing .env by hand. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/InteractiveSetup.md`
- **LightRAG Server and WebUI**（project_doc）：The LightRAG Server is designed to provide a Web UI and API support. The Web UI facilitates document indexing, knowledge graph exploration, and a simple RAG query interface. LightRAG Server also provides an Ollama-compatible interface, aiming to emulate LightRAG as an Ollama chat model. This allows AI chat bots, such as Open WebUI, to access LightRAG easily. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/LightRAG-API-Server.md`
- **Milvus Configuration via vector db storage cls kwargs**（project_doc）：Milvus Configuration via vector db storage cls kwargs 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/MilvusConfigurationGuide.md`
- **Single-Server Multi-Site Deployment**（project_doc）：Single-Server Multi-Site Deployment 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/MultiSiteDeployment.md`
- **LightRAG Offline Deployment Guide**（project_doc）：This guide provides comprehensive instructions for deploying LightRAG in offline environments where internet access is limited or unavailable. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/OfflineDeployment.md`
- **Paragraph Semantic Chunking Strategy**（project_doc）：Paragraph Semantic Chunking Strategy 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/ParagraphSemanticChunking.md`
- **Programming With LightRAG Core**（project_doc）：If you want to integrate LightRAG into your project, we recommend using the REST API provided by the LightRAG Server. LightRAG Core is intended for embedded applications or researchers conducting studies and evaluations. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/ProgramingWithCore.md`
- **Role-Specific LLM/VLM Configuration Guide**（project_doc）：Role-Specific LLM/VLM Configuration Guide 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/RoleSpecificLLMConfiguration.md`
- **文件处理流水线工作方式说明**（project_doc）：从版本 v1.5.0 （目前在dev分支）开始，LightRAG的文件处理流水线进行了重大的升级： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/FileProcessingPipeline-zh.md`
- **LightRAG 服务器和 WebUI**（project_doc）：LightRAG 服务器旨在提供 Web 界面和 API 支持。Web 界面便于文档索引、知识图谱探索和简单的 RAG 查询界面。LightRAG 服务器还提供了与 Ollama 兼容的接口，旨在将 LightRAG 模拟为 Ollama 聊天模型。这使得 AI 聊天机器人（如 Open WebUI）可以轻松访问 LightRAG。 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/LightRAG-API-Server-zh.md`
- **LightRAG Sidecar 文件格式说明**（project_doc）：本文介绍内解析引擎输出的 LightRAG Sidecar 文件格式。LightRAG 在使用native/mineru/docling这些支持多模态内容解析引擎提取文件内容的时候，会把"正文 + 多模态对象 + 解析元数据"拆开写到一个 .parsed/ 目录中，目录内的每个 JSON / JSONL 文件统称为 sidecar 文件。Sidecar 是后续流水线（多模态分析 → 多模态 chunk 构造 → 实体抽取 → 文档删除时的缓存清理）唯一可靠的依据。Sidecar的文件格式是LightRAG内置的通用文件交换格式，新的多模态内容提取引擎都需要遵循这个格式。公开 LightRAG Sidecar 文件格式的目的是给社区开发者编写字节的内容解析引擎提供方便。 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/LightRAGSidecarFormat-zh.md`
- **LightRAG Sidecar File Format Specification**（project_doc）：LightRAG Sidecar File Format Specification 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/LightRAGSidecarFormat.md`
- **Paragraph Semantic 分块策略**（project_doc）：Paragraph Semantic Chunking（下文简称 P 策略 ）面向 DOCX 等具有清晰章节结构的文档。其核心目标是： 让分块边界尽可能对齐文档原生的语义边界 （标题、段落、表格行），而不是仅由 token 长度计数决定切点。 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/ParagraphSemanticChunking-zh.md`
- **Parser CLI Debuger使用指南**（project_doc）：本工具用于本地调试 LightRAG 的三个内容解析引擎（ native / mineru / docling ），针对 单个文件 触发 LightRAG.parse 生产代码路径，并把解析产物（sidecar 与 raw 缓存）输出到一个 扁平目录布局 ——与生产入库目录相比，区别仅在于： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/ParserDebugCLI-zh.md`
- **Parser CLI Debugger Guide**（project_doc）：This tool is used to locally debug LightRAG's three content parsing engines native / mineru / docling . It triggers the LightRAG.parse production code path for a single file and outputs the parsing artifacts sidecar and raw cache into a flat directory layout . Compared with the production ingestion directory, the only differences are: 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/ParserDebugCLI.md`
- **Evaluation Result Reproduce**（project_doc）：The dataset used in LightRAG can be downloaded from TommyChien/UltraDomain https://huggingface.co/datasets/TommyChien/UltraDomain . 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/Reproduce.md`
- **基于角色的 LLM/VLM 配置指南**（project_doc）：LightRAG 支持为不同处理阶段配置不同的 LLM 或 VLM。这个机制适合把低成本模型用于抽取，把更强模型用于最终回答，或为多模态分析单独指定视觉语言模型。 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/RoleSpecificLLMConfiguration-zh.md`
- **uv.lock Update Guide**（project_doc）：uv.lock is uv's lock file. It captures the exact version of every dependency, including transitive ones, much like: - Node.js package-lock.json - Rust Cargo.lock - Python Poetry poetry.lock 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/UV_LOCK_GUIDE.md`

## 证据索引

- 共索引 77 条证据。

- **🚀 LightRAG: Simple and Fast Retrieval-Augmented Generation**（documentation）：🚀 LightRAG: Simple and Fast Retrieval-Augmented Generation 证据：`README.md`
- **LightRAG Helm Chart**（documentation）：This is the Helm chart for LightRAG, used to deploy LightRAG services on a Kubernetes cluster. 证据：`k8s-deploy/README.md`
- **LightRAG WebUI**（documentation）：LightRAG WebUI is a React-based web interface for interacting with the LightRAG system. It provides a user-friendly interface for querying, managing, and exploring LightRAG's functionalities. 证据：`lightrag_webui/README.md`
- **Using KubeBlocks to Deploy and Manage Databases**（documentation）：Using KubeBlocks to Deploy and Manage Databases 证据：`k8s-deploy/databases/README.md`
- **Sample Documents for Evaluation**（documentation）：These markdown files correspond to test questions in ../sample dataset.json . 证据：`lightrag/evaluation/sample_documents/README.md`
- **LightRAG 3D Graph Viewer**（documentation）：An interactive 3D graph visualization tool included in the LightRAG package for visualizing and analyzing RAG Retrieval-Augmented Generation graphs and other graph structures. 证据：`lightrag/tools/lightrag_visualizer/README.md`
- **Repository Guidelines**（documentation）：LightRAG is a Retrieval-Augmented Generation RAG framework that uses graph-based knowledge representation for enhanced information retrieval. The system extracts entities and relationships from documents, builds a knowledge graph, and uses multiple retrieval modes local , global , hybrid , mix , naive for queries. 证据：`AGENTS.md`
- **Claude**（documentation）：Strictly follow the rules in ./AGENTS.md 证据：`CLAUDE.md`
- **Advanced Features**（documentation）：LightRAG Server includes a multimodal document pipeline for text, images, tables, and equations. Document parsing is handled through external MinerU or Docling services configured by endpoint, so the server no longer needs to install or import the raganything package locally. 证据：`docs/AdvancedFeatures.md`
- **Algorithm**（documentation）：! LightRAG Indexing Flowchart https://learnopencv.com/wp-content/uploads/2024/11/LightRAG-VectorDB-Json-KV-Store-Indexing-Flowchart-scaled.jpg Figure 1: LightRAG Indexing Flowchart - Img Caption : Source https://learnopencv.com/lightrag/ ! LightRAG Retrieval and Querying Flowchart https://learnopencv.com/wp-content/uploads/2024/11/LightRAG-Querying-Flowchart-Dual-Level-Retrieval-Generation-Knowledge-Graphs-scaled.jpg Figure 2: LightRAG Retrieval and Querying Flowchart - Img Caption : Source https://learnopencv.com/lightrag/ 证据：`docs/Algorithm.md`
- **Asymmetric Embedding Configuration**（documentation）：LightRAG keeps embedding behavior symmetric by default. Query/document asymmetric embedding is enabled only when EMBEDDING ASYMMETRIC=true is explicitly set. 证据：`docs/AsymmetricEmbedding.md`
- **LightRAG Docker Deployment**（documentation）：A lightweight Knowledge Graph Retrieval-Augmented Generation system with multiple LLM backend support. 证据：`docs/DockerDeployment.md`
- **File Processing Pipeline Specification**（documentation）：File Processing Pipeline Specification 证据：`docs/FileProcessingPipeline.md`
- **Frontend Build Guide**（documentation）：The LightRAG project includes a React-based WebUI frontend. This guide explains how frontend building works in different scenarios. 证据：`docs/FrontendBuildGuide.md`
- **Interactive Setup Guide**（documentation）：Use the interactive setup wizard when you want LightRAG to guide you through the configuration instead of editing .env by hand. 证据：`docs/InteractiveSetup.md`
- **LightRAG Server and WebUI**（documentation）：The LightRAG Server is designed to provide a Web UI and API support. The Web UI facilitates document indexing, knowledge graph exploration, and a simple RAG query interface. LightRAG Server also provides an Ollama-compatible interface, aiming to emulate LightRAG as an Ollama chat model. This allows AI chat bots, such as Open WebUI, to access LightRAG easily. 证据：`docs/LightRAG-API-Server.md`
- **Milvus Configuration via vector db storage cls kwargs**（documentation）：Milvus Configuration via vector db storage cls kwargs 证据：`docs/MilvusConfigurationGuide.md`
- **Single-Server Multi-Site Deployment**（documentation）：Single-Server Multi-Site Deployment 证据：`docs/MultiSiteDeployment.md`
- **LightRAG Offline Deployment Guide**（documentation）：This guide provides comprehensive instructions for deploying LightRAG in offline environments where internet access is limited or unavailable. 证据：`docs/OfflineDeployment.md`
- **Paragraph Semantic Chunking Strategy**（documentation）：Paragraph Semantic Chunking Strategy 证据：`docs/ParagraphSemanticChunking.md`
- **Programming With LightRAG Core**（documentation）：If you want to integrate LightRAG into your project, we recommend using the REST API provided by the LightRAG Server. LightRAG Core is intended for embedded applications or researchers conducting studies and evaluations. 证据：`docs/ProgramingWithCore.md`
- **Role-Specific LLM/VLM Configuration Guide**（documentation）：Role-Specific LLM/VLM Configuration Guide 证据：`docs/RoleSpecificLLMConfiguration.md`
- **Package**（package_manifest）：{ "name": "lightrag-webui", "private": true, "version": "0.0.0", "type": "module", "scripts": { "dev": "vite", "build": "vite build", "lint": "eslint .", "preview": "vite preview", "test": "bun test", "test:watch": "bun test --watch", "test:coverage": "bun test --coverage", "dev:bun": "bunx --bun vite", "build:bun": "bunx --bun vite build", "preview:bun": "bunx --bun vite preview" }, "dependencies": { "@faker-js/faker": "^10.4.0", "@radix-ui/react-alert-dialog": "^1.1.15", "@radix-ui/react-checkbox": "^1.3.3", "@radix-ui/react-dialog": "^1.1.15", "@radix-ui/react-popover": "^1.1.15", "@radix-ui/react-progress": "^1.1.8", "@radix-ui/react-scroll-area": "^1.2.10", "@radix-ui/react-select": "^… 证据：`lightrag_webui/package.json`
- **License**（source_file）：Permission is hereby granted, free of charge, to any person obtaining a copy of this software and associated documentation files the "Software" , to deal in the Software without restriction, including without limitation the rights to use, copy, modify, merge, publish, distribute, sublicense, and/or sell copies of the Software, and to permit persons to whom the Software is furnished to do so, subject to the following conditions: 证据：`LICENSE`
- **文件处理流水线工作方式说明**（documentation）：从版本 v1.5.0 （目前在dev分支）开始，LightRAG的文件处理流水线进行了重大的升级： 证据：`docs/FileProcessingPipeline-zh.md`
- **LightRAG 服务器和 WebUI**（documentation）：LightRAG 服务器旨在提供 Web 界面和 API 支持。Web 界面便于文档索引、知识图谱探索和简单的 RAG 查询界面。LightRAG 服务器还提供了与 Ollama 兼容的接口，旨在将 LightRAG 模拟为 Ollama 聊天模型。这使得 AI 聊天机器人（如 Open WebUI）可以轻松访问 LightRAG。 证据：`docs/LightRAG-API-Server-zh.md`
- **LightRAG Sidecar 文件格式说明**（documentation）：本文介绍内解析引擎输出的 LightRAG Sidecar 文件格式。LightRAG 在使用native/mineru/docling这些支持多模态内容解析引擎提取文件内容的时候，会把"正文 + 多模态对象 + 解析元数据"拆开写到一个 .parsed/ 目录中，目录内的每个 JSON / JSONL 文件统称为 sidecar 文件。Sidecar 是后续流水线（多模态分析 → 多模态 chunk 构造 → 实体抽取 → 文档删除时的缓存清理）唯一可靠的依据。Sidecar的文件格式是LightRAG内置的通用文件交换格式，新的多模态内容提取引擎都需要遵循这个格式。公开 LightRAG Sidecar 文件格式的目的是给社区开发者编写字节的内容解析引擎提供方便。 证据：`docs/LightRAGSidecarFormat-zh.md`
- **LightRAG Sidecar File Format Specification**（documentation）：LightRAG Sidecar File Format Specification 证据：`docs/LightRAGSidecarFormat.md`
- **Paragraph Semantic 分块策略**（documentation）：Paragraph Semantic Chunking（下文简称 P 策略 ）面向 DOCX 等具有清晰章节结构的文档。其核心目标是： 让分块边界尽可能对齐文档原生的语义边界 （标题、段落、表格行），而不是仅由 token 长度计数决定切点。 证据：`docs/ParagraphSemanticChunking-zh.md`
- **Parser CLI Debuger使用指南**（documentation）：本工具用于本地调试 LightRAG 的三个内容解析引擎（ native / mineru / docling ），针对 单个文件 触发 LightRAG.parse 生产代码路径，并把解析产物（sidecar 与 raw 缓存）输出到一个 扁平目录布局 ——与生产入库目录相比，区别仅在于： 证据：`docs/ParserDebugCLI-zh.md`
- **Parser CLI Debugger Guide**（documentation）：This tool is used to locally debug LightRAG's three content parsing engines native / mineru / docling . It triggers the LightRAG.parse production code path for a single file and outputs the parsing artifacts sidecar and raw cache into a flat directory layout . Compared with the production ingestion directory, the only differences are: 证据：`docs/ParserDebugCLI.md`
- **Evaluation Result Reproduce**（documentation）：The dataset used in LightRAG can be downloaded from TommyChien/UltraDomain https://huggingface.co/datasets/TommyChien/UltraDomain . 证据：`docs/Reproduce.md`
- **基于角色的 LLM/VLM 配置指南**（documentation）：LightRAG 支持为不同处理阶段配置不同的 LLM 或 VLM。这个机制适合把低成本模型用于抽取，把更强模型用于最终回答，或为多模态分析单独指定视觉语言模型。 证据：`docs/RoleSpecificLLMConfiguration-zh.md`
- **uv.lock Update Guide**（documentation）：uv.lock is uv's lock file. It captures the exact version of every dependency, including transitive ones, much like: - Node.js package-lock.json - Rust Cargo.lock - Python Poetry poetry.lock 证据：`docs/UV_LOCK_GUIDE.md`
- **Docker Compose**（source_file）：services: lightrag: image: ghcr.io/hkuds/lightrag:latest build: context: . dockerfile: Dockerfile tags: - ghcr.io/hkuds/lightrag:latest ports: - "${HOST:-0.0.0.0}:${PORT:-9621}:9621" volumes: - ./data/rag storage:/app/data/rag storage - ./data/inputs:/app/data/inputs - ./data/prompts:/app/data/prompts - ./.env:/app/.env deploy: restart policy: condition: on-failure max attempts: 10 extra hosts: - "host.docker.internal:host-gateway" environment: WORKING DIR: "/app/data/rag storage" INPUT DIR: "/app/data/inputs" PROMPT DIR: "/app/data/prompts" HOST: "0.0.0.0" PORT: "9621" 证据：`docker-compose.yml`
- **All configurable environment variable must show up in this sample file in active or comment out status**（source_file）：All configurable environment variable must show up in this sample file in active or comment out status Setup tool make env- uses this file to generate final .env file 证据：`env.example`
- **3. Populate Workspace 2 Corporate**（source_file）：async def embedding func texts: list str - np.ndarray ⋮---- rag = LightRAG ⋮---- async def main ⋮---- rag 1 = None rag 2 = None ⋮---- rag 1 = await initialize rag "rag workspace book" rag 2 = await initialize rag "rag workspace hr" ⋮---- book path = "Data/book-small.txt" ⋮---- 3. Populate Workspace 2 Corporate hr path = "Data/HR policies.txt" ⋮---- 4. Context-Specific Querying ⋮---- res1 = await rag 1.aquery ⋮---- res2 = await rag 2.aquery ⋮---- Finalize storage to safely close DB connections and write buffers 证据：`examples/lightrag_gemini_workspace_demo.py`
- **Init**（source_file）：all = ⋮---- LAZY EXPORTS = {"LightRAG", "QueryParam", "RoleLLMConfig", "RoleSpec", "ROLES"} ⋮---- def getattr name: str - Any ⋮---- values = { value = values name ⋮---- author = "Zirui Guo" url = "https://github.com/HKUDS/LightRAG" 证据：`lightrag/__init__.py`
- **Base**（source_file）：class OllamaServerInfos ⋮---- def init self, name=None, tag=None ⋮---- @property def LIGHTRAG NAME self ⋮---- @LIGHTRAG NAME.setter def LIGHTRAG NAME self, value ⋮---- @property def LIGHTRAG TAG self ⋮---- @LIGHTRAG TAG.setter def LIGHTRAG TAG self, value ⋮---- @property def LIGHTRAG MODEL self ⋮---- class TextChunkSchema TypedDict ⋮---- tokens: int content: str full doc id: str chunk order index: int ⋮---- T = TypeVar "T" ⋮---- @dataclass class QueryParam ⋮---- mode: Literal "local", "global", "hybrid", "naive", "mix", "bypass" = "mix" ⋮---- only need context: bool = False ⋮---- only need prompt: bool = False ⋮---- response type: str = "Multiple Paragraphs" ⋮---- stream: bool = False ⋮----… 证据：`lightrag/base.py`
- **---**（source_file）：httpx = None ⋮---- @final @dataclass class LightRAG RoleLLMMixin, StorageMigrationMixin, PipelineMixin ⋮---- working dir: str = field default="./rag storage" ⋮---- kv storage: str = field default="JsonKVStorage" ⋮---- vector storage: str = field default="NanoVectorDBStorage" ⋮---- graph storage: str = field default="NetworkXStorage" ⋮---- doc status storage: str = field default="JsonDocStatusStorage" ⋮---- workspace: str = field default factory=lambda: os.getenv "WORKSPACE", "" """Workspace for data isolation. Defaults to empty string if WORKSPACE environment variable is not set.""" ⋮---- --- TODO: Deprecated, use setup logger in utils.py instead log level: int None = field default=None log… 证据：`lightrag/lightrag.py`
- **Llm Roles**（source_file）：def optional env int env key: str - int None ⋮---- @dataclass frozen=True class RoleSpec ⋮---- name: str ⋮---- env prefix: str ⋮---- queue name: str ⋮---- ROLES: tuple RoleSpec, ... = ROLE NAMES: frozenset str = frozenset spec.name for spec in ROLES ROLES BY NAME: dict str, RoleSpec = {spec.name: spec for spec in ROLES} ⋮---- @dataclass class RoleLLMConfig ⋮---- func: Callable ..., object None = None kwargs: dict str, Any None = None max async: int None = None timeout: int None = None metadata: dict str, Any None = None ⋮---- @dataclass class RoleLLMState ⋮---- raw func: Callable ..., object kwargs: dict str, Any None max async: int None timeout: int None metadata: dict str, Any = field def… 证据：`lightrag/llm_roles.py`
- **---------------------------------------------------------------------------**（source_file）：logger = logging.getLogger name ⋮---- MM TAG RE = re.compile ⋮---- TABLE CITE RE = re.compile ⋮---- def atomize text: str - list tuple str, str ⋮---- """Split text into kind, content atoms. kind ∈ {"text", "drawing", "equation", "table"} . Concatenating all atom contents reproduces text verbatim. """ atoms: list tuple str, str = pos = 0 ⋮---- tag text = match.group 0 ⋮---- kind = "drawing" ⋮---- kind = "table" ⋮---- kind = "equation" ⋮---- pos = match.end ⋮---- --------------------------------------------------------------------------- Target-tag locators. Each builds a regex that matches a complete tag carrying the requested id attribute, regardless of attribute order. ⋮---- def drawing pa… 证据：`lightrag/multimodal_context.py`
- **Handle empty input**（source_file）：def get relationship vdb timeout seconds global config: dict str, Any - float ⋮---- configured = global config.get "default embedding timeout" ⋮---- base timeout = float configured ⋮---- base timeout = 30.0 ⋮---- def format relation edge label edge key: tuple str, str list str - str ⋮---- """Truncate entity identifiers that exceed the configured length limit.""" ⋮---- display value = identifier :limit preview = identifier :20 Show first 20 characters as preview ⋮---- def truncate vdb content content: str, global config: dict, content label: str - str ⋮---- """Clamp vector-store payload size to stay under embedding limits.""" ⋮---- embedding token limit = global config.get "embedding token l… 证据：`lightrag/operate.py`
- **============================================================**（source_file）：INFLIGHT DOC STATUSES = ⋮---- resolver = owner. resolve source file for parser params = inspect.signature resolver .parameters supports context = "source file name" in params or any ⋮---- CHUNKING METHOD LABELS: dict str, str = { ⋮---- CHUNK LOG KEY ALIASES: dict str, str = { ⋮---- pieces = f"size={chunk size}" ⋮---- short = CHUNK LOG KEY ALIASES.get key, key ⋮---- @dataclass class BatchRunContext ⋮---- """Per-batch shared state for the parse/analyze/process worker pipeline. Bundles the cross-cutting handles pipeline status, locks, queues, semaphore so worker methods accept a single ctx argument instead of ~8 individually plumbed parameters. processed count mutates inside each batch and is… 证据：`lightrag/pipeline.py`
- **Fallback: approximate 1 token ≈ 4 characters**（source_file）：original overlap = overlap tokens ⋮---- overlap tokens = max 0, max tokens - 1 ⋮---- tokenizer = TiktokenTokenizer model name=tokenizer model ⋮---- Fallback: approximate 1 token ≈ 4 characters max chars = max tokens 4 overlap chars = overlap tokens 4 ⋮---- chunked docs = doc indices = ⋮---- Split into overlapping chunks start = 0 ⋮---- end = min start + max chars, len doc chunk = doc start:end ⋮---- start = end - overlap chars ⋮---- Use tokenizer for accurate chunking ⋮---- tokens = tokenizer.encode doc ⋮---- Document fits in one chunk ⋮---- end = min start + max tokens, len tokens chunk tokens = tokens start:end chunk text = tokenizer.decode chunk tokens ⋮---- start = end - overlap tokens… 证据：`lightrag/rerank.py`
- **Hard collision guard same chunk id inside one document .**（source_file）：PLACEHOLDER DOCUMENT SOURCES = {"", "no-file-path", "unknown source"} SIDECAR LOCATION UNKNOWN = "unknown source" ⋮---- chunks: dict str, dict str, Any = {} ⋮---- chunk content = dp.get "content", "" ⋮---- raw chunk id = dp.get "chunk id", "" order = dp.get "chunk order index" ⋮---- chunk key = ⋮---- chunk key = f"{doc id}-chunk-{order:03d}" ⋮---- chunk key = compute mdhash id f"{doc id}:{chunk content}", prefix="chunk-" ⋮---- Hard collision guard same chunk id inside one document . ⋮---- chunk key = compute mdhash id Preserve any pre-populated cache ids on dp multimodal chunks arrive with analysis cache ids already attached so document deletion can find them via the per-chunk llm cache lis… 证据：`lightrag/utils_pipeline.py`
- **Values**（source_file）：version: "8.8.2" mode: single-node replicas: 1 cpu: 1 memory: 2 storage: 5 extra: terminationPolicy: Delete disableExporter: true 证据：`k8s-deploy/databases/elasticsearch/values.yaml`
- **Values**（source_file）：version: 6.0.16 mode: standalone cpu: 1 memory: 1 storage: 20 hostnetwork: "disabled" extra: terminationPolicy: Delete 证据：`k8s-deploy/databases/mongodb/values.yaml`
- **Values**（source_file）：version: 5.26.5 mode: singlealone cpu: 2 memory: 4 storage: 20 replicas: 1 storageClassName: "" extra: terminationPolicy: Delete 证据：`k8s-deploy/databases/neo4j/values.yaml`
- **Values**（source_file）：version: 16.4.0 mode: replication replicas: 2 cpu: 1 memory: 1 storage: 5 terminationPolicy: Delete 证据：`k8s-deploy/databases/postgresql/values.yaml`
- **Values**（source_file）：version: 1.10.0 replicas: 1 cpu: 1 memory: 1 storage: 20 extra: terminationPolicy: Delete 证据：`k8s-deploy/databases/qdrant/values.yaml`
- **Values**（source_file）：version: 7.2.7 mode: standalone replicas: 1 cpu: 0.5 memory: 1 storage: 20 extra: disableExporter: true 证据：`k8s-deploy/databases/redis/values.yaml`
- **Values**（source_file）：replicaCount: 1 image: repository: ghcr.io/hkuds/lightrag tag: latest imagePullSecrets: updateStrategy: type: Recreate service: type: ClusterIP port: 9621 resources: limits: cpu: 1000m memory: 2Gi requests: cpu: 500m memory: 1Gi persistence: enabled: true ragStorage: size: 10Gi inputs: size: 5Gi envFrom: configmaps: secrets: env: HOST: 0.0.0.0 PORT: 9621 WEBUI TITLE: Graph RAG Engine WEBUI DESCRIPTION: Simple and Fast Graph Based RAG System LLM BINDING: openai LLM MODEL: gpt-4o-mini LLM BINDING HOST: LLM BINDING API KEY: EMBEDDING BINDING: openai EMBEDDING MODEL: text-embedding-ada-002 EMBEDDING DIM: 1536 EMBEDDING BINDING API KEY: LIGHTRAG KV STORAGE: PGKVStorage LIGHTRAG VECTOR STORAGE: P… 证据：`k8s-deploy/lightrag/values.yaml`
- **Fixed WebUI mount path. Used as app.mount WEBUI PATH, ... and as the**（source_file）：webui title = os.getenv "WEBUI TITLE" webui description = os.getenv "WEBUI DESCRIPTION" ⋮---- auth configured = bool auth handler.accounts ⋮---- def inject swagger theme html: str, theme: str - str ⋮---- theme = "auto" ⋮---- theme snippet = textwrap.dedent ⋮---- needle = " " ⋮---- Fixed WebUI mount path. Used as app.mount WEBUI PATH, ... and as the in-app component of webuiPrefix injected into window. LIGHTRAG CONFIG which the browser sees as LIGHTRAG API PREFIX + WEBUI PATH + "/" . Not user-configurable: a single mount path simplifies the operator surface and matches how LightRAG is deployed in practice. See docs/MultiSiteDeployment.md. WEBUI PATH = "/webui" ⋮---- def normalize api prefix… 证据：`lightrag/api/lightrag_server.py`
- **Init**（source_file）：all = "OllamaAPI" 证据：`lightrag/api/routers/__init__.py`
- **Init**（source_file）：all = 证据：`lightrag/chunker/__init__.py`
- **---------------------------------------------------------------------------**（source_file）：IDEAL RATIO = 0.75 ⋮---- TABLE MAX RATIO = 0.625 ⋮---- TABLE IDEAL RATIO = 0.375 ⋮---- TABLE MIN LAST RATIO = 0.32 ⋮---- SMALL TAIL RATIO = 0.125 ⋮---- MAX ANCHOR CANDIDATE LENGTH = 100 ⋮---- LEGACY TABLE CHUNK SUFFIX RE = re.compile r"\s \ 表格片段\d+\ \s $" PART SUFFIX RE = re.compile r"\s \ part\s+\d+\ \s $", re.IGNORECASE ⋮---- --------------------------------------------------------------------------- Shared helpers. ⋮---- def count tokens tokenizer: Tokenizer, text: str - int ⋮---- def bounded overlap target max: int, chunk overlap token size: int - int ⋮---- """Return an overlap value safe for recursive-character splitting.""" overlap = max int chunk overlap token size , 0 ⋮---- def stri… 证据：`lightrag/chunker/paragraph_semantic.py`
- **Recursive Character**（source_file）：LANGCHAIN TEXT SPLITTERS AVAILABLE = True ⋮---- LANGCHAIN TEXT SPLITTERS AVAILABLE = False RecursiveCharacterTextSplitter = None ⋮---- SpanPiece = tuple str, int, int ⋮---- matches = list re.finditer separator pattern, text ⋮---- pieces: list SpanPiece = ⋮---- cursor = 0 ⋮---- cursor = match.end ⋮---- first = matches 0 ⋮---- end = ⋮---- chars: list str = char offsets: list int = ⋮---- previous end = pieces index - 1 2 ⋮---- text = "".join chars ⋮---- left = 0 right = len text ⋮---- """Mirror TextSplitter. merge splits while preserving source spans.""" separator len = length function separator docs: list SpanPiece = current doc: list SpanPiece = total = 0 ⋮---- split len = length function sp… 证据：`lightrag/chunker/recursive_character.py`
- **Semantic Vector**（source_file）：SemanticChunkerType = Any ⋮---- LANGCHAIN EXPERIMENTAL AVAILABLE = True ⋮---- LANGCHAIN EXPERIMENTAL AVAILABLE = False Embeddings = object SemanticChunker = None ⋮---- class AsyncEmbeddingFuncAdapter Embeddings ⋮---- def run self, texts: list str , context: str - list list float ⋮---- future = asyncio.run coroutine threadsafe result = future.result ⋮---- def embed documents self, texts: list str - list list float ⋮---- def embed query self, text: str - list float ⋮---- def sentence spans text: str, sentences: list str - list tuple int, int ⋮---- spans: list tuple int, int = cursor = 0 ⋮---- start = text.find sentence, cursor ⋮---- start = text.find sentence ⋮---- start = cursor end = start… 证据：`lightrag/chunker/semantic_vector.py`
- **Token Size**（source_file）：def trimmed span content: str, start: int, end: int - tuple int, int ⋮---- start = max 0, min start, len content end = max start, min end, len content ⋮---- def source span content: str, start: int, end: int - dict str, int None ⋮---- window = tokenizer.decode tokens start token:end token ⋮---- start = anchor char + len tokenizer.decode tokens anchor token:start token ⋮---- start = len tokenizer.decode tokens :start token end = start + len window ⋮---- found = content.find ⋮---- start = found end = found + len window ⋮---- item: dict str, Any = { ⋮---- tokens = tokenizer.encode content results: list dict str, Any = ⋮---- raw chunks = content.split split by character raw spans: list tuple in… 证据：`lightrag/chunker/token_size.py`
- 其余 17 条证据见 `AI_CONTEXT_PACK.json` 或 `EVIDENCE_INDEX.json`。

## 宿主 AI 必须遵守的规则

- **把本资产当作开工前上下文，而不是运行环境。**：AI Context Pack 只包含证据化项目理解，不包含目标项目的可执行状态。 证据：`README.md`, `k8s-deploy/README.md`, `lightrag_webui/README.md`
- **回答用户时区分可预览内容与必须安装后才能验证的内容。**：安装前体验的消费者价值来自降低误装和误判，而不是伪装成真实运行。 证据：`README.md`, `k8s-deploy/README.md`, `lightrag_webui/README.md`

## 用户开工前应该回答的问题

- 你准备在哪个宿主 AI 或本地环境中使用它？
- 你只是想先体验工作流，还是准备真实安装？
- 你最在意的是安装成本、输出质量、还是和现有规则的冲突？

## 验收标准

- 所有能力声明都能回指到 evidence_refs 中的文件路径。
- AI_CONTEXT_PACK.md 没有把预览包装成真实运行。
- 用户能在 3 分钟内看懂适合谁、能做什么、如何开始和风险边界。

---

## Doramagic Context Augmentation

下面内容用于强化 Repomix/AI Context Pack 主体。Human Manual 只提供阅读骨架；踩坑日志会被转成宿主 AI 必须遵守的工作约束。

## Human Manual 骨架

使用规则：这里只是项目阅读路线和显著性信号，不是事实权威。具体事实仍必须回到 repo evidence / Claim Graph。

宿主 AI 硬性规则：
- 不得把页标题、章节顺序、摘要或 importance 当作项目事实证据。
- 解释 Human Manual 骨架时，必须明确说它只是阅读路线/显著性信号。
- 能力、安装、兼容性、运行状态和风险判断必须引用 repo evidence、source path 或 Claim Graph。

- **Introduction to LightRAG**：importance `high`
  - source_paths: README.md, docs/Algorithm.md, lightrag/lightrag.py
- **Installation Guide**：importance `high`
  - source_paths: env.example, docker-compose.yml, Makefile, docs/InteractiveSetup.md
- **System Architecture**：importance `high`
  - source_paths: docs/Algorithm.md, lightrag/lightrag.py, lightrag/operate.py, lightrag/pipeline.py, lightrag/base.py
- **Text Chunking Strategies**：importance `high`
  - source_paths: lightrag/chunker/__init__.py, lightrag/chunker/paragraph_semantic.py, lightrag/chunker/recursive_character.py, lightrag/chunker/semantic_vector.py, lightrag/chunker/token_size.py
- **Storage Backends**：importance `high`
  - source_paths: lightrag/kg/factory.py, lightrag/kg/neo4j_impl.py, lightrag/kg/postgres_impl.py, lightrag/kg/mongo_impl.py, lightrag/kg/opensearch_impl.py
- **API Server**：importance `high`
  - source_paths: lightrag/api/lightrag_server.py, lightrag/api/routers/document_routes.py, lightrag/api/routers/query_routes.py, lightrag/api/routers/graph_routes.py, docs/LightRAG-API-Server.md
- **Programming with LightRAG Core**：importance `high`
  - source_paths: lightrag/lightrag.py, lightrag/llm/openai.py, lightrag/llm/ollama.py, lightrag/llm/gemini.py, lightrag/llm/azure_openai.py
- **Multimodal Document Processing**：importance `high`
  - source_paths: lightrag/parser/__init__.py, lightrag/parser/external/docling/__init__.py, lightrag/parser/external/mineru/__init__.py, lightrag/multimodal_context.py, docs/FileProcessingPipeline.md

## Repo Inspection Evidence / 源码检查证据

- repo_clone_verified: true
- repo_inspection_verified: true
- repo_commit: `3e60422305263fcb2938427bdf80a5d47a81c4a2`
- inspected_files: `pyproject.toml`, `Dockerfile`, `README.md`, `docker-compose.yml`, `uv.lock`, `docs/AdvancedFeatures.md`, `docs/LightRAG-API-Server-zh.md`, `docs/ParagraphSemanticChunking-zh.md`, `docs/InteractiveSetup.md`, `docs/RoleSpecificLLMConfiguration.md`, `docs/ParserDebugCLI.md`, `docs/ParagraphSemanticChunking.md`, `docs/OfflineDeployment.md`, `docs/Reproduce.md`, `docs/FileProcessingPipeline.md`, `docs/FileProcessingPipeline-zh.md`, `docs/ProgramingWithCore.md`, `docs/Algorithm.md`, `docs/MilvusConfigurationGuide.md`, `docs/LightRAG-API-Server.md`

宿主 AI 硬性规则：
- 没有 repo_clone_verified=true 时，不得声称已经读过源码。
- 没有 repo_inspection_verified=true 时，不得把 README/docs/package 文件判断写成事实。
- 没有 quick_start_verified=true 时，不得声称 Quick Start 已跑通。

## Doramagic Pitfall Constraints / 踩坑约束

这些规则来自 Doramagic 发现、验证或编译过程中的项目专属坑点。宿主 AI 必须把它们当作工作约束，而不是普通说明文字。

### Constraint 1: 来源证据：Guidance on Adding Multimodal Support to LightRAG: Wrap with RAG‑Anything or Extend (modify) LightRAGs lightrag‑server?

- Trigger: GitHub 社区证据显示该项目存在一个安装相关的待验证问题：Guidance on Adding Multimodal Support to LightRAG: Wrap with RAG‑Anything or Extend (modify) LightRAGs lightrag‑server?
- Host AI rule: 来源问题仍为 open，Pack Agent 需要复核是否仍影响当前版本。
- Why it matters: 可能影响升级、迁移或版本选择。
- Evidence: community_evidence:github | cevd_9aea67d79c4b46508c4267093ebb19da | https://github.com/HKUDS/LightRAG/issues/2642 | 来源讨论提到 python 相关条件，需在安装/试用前复核。
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 2: 来源证据：[Question]: How to distinguish documents with same name but different content?

- Trigger: GitHub 社区证据显示该项目存在一个安装相关的待验证问题：[Question]: How to distinguish documents with same name but different content?
- Host AI rule: 来源问题仍为 open，Pack Agent 需要复核是否仍影响当前版本。
- Why it matters: 可能增加新用户试用和生产接入成本。
- Evidence: community_evidence:github | cevd_6c7ed97673d041ef92d4ff54a3718289 | https://github.com/HKUDS/LightRAG/issues/3158 | 来源类型 github_issue 暴露的待验证使用条件。
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 3: 失败模式：installation: v1.4.10

- Trigger: Developers should check this installation risk before relying on the project: v1.4.10
- Host AI rule: Before packaging this project, run the relevant install/config/quickstart check for: v1.4.10. Context: Observed when using windows
- Why it matters: Upgrade or migration may change expected behavior: v1.4.10
- Evidence: failure_mode_cluster:github_release | fmev_dceb1b266203b7a89767ff26a0852383 | https://github.com/HKUDS/LightRAG/releases/tag/v1.4.10 | v1.4.10
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 4: 失败模式：configuration: [Bug]: Not working on reverse proxy - sub path

- Trigger: Developers should check this configuration risk before relying on the project: [Bug]: Not working on reverse proxy - sub path
- Host AI rule: Before packaging this project, run the relevant install/config/quickstart check for: [Bug]: Not working on reverse proxy - sub path. Context: Observed when using python
- Why it matters: Developers may misconfigure credentials, environment, or host setup: [Bug]: Not working on reverse proxy - sub path
- Evidence: failure_mode_cluster:github_issue | fmev_13dbaaeb506c72cc5b9ecd91cdabc2a2 | https://github.com/HKUDS/LightRAG/issues/2755 | [Bug]: Not working on reverse proxy - sub path
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 5: 失败模式：configuration: v1.4.11

- Trigger: Developers should check this configuration risk before relying on the project: v1.4.11
- Host AI rule: Before packaging this project, run the relevant install/config/quickstart check for: v1.4.11. Context: Observed when using docker
- Why it matters: Upgrade or migration may change expected behavior: v1.4.11
- Evidence: failure_mode_cluster:github_release | fmev_eda26a0bfd194234d2eb2fa02f9bdae9 | https://github.com/HKUDS/LightRAG/releases/tag/v1.4.11 | v1.4.11
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 6: 失败模式：configuration: v1.4.11rc2

- Trigger: Developers should check this configuration risk before relying on the project: v1.4.11rc2
- Host AI rule: Before packaging this project, run the relevant install/config/quickstart check for: v1.4.11rc2. Context: Observed during installation or first-run setup.
- Why it matters: Upgrade or migration may change expected behavior: v1.4.11rc2
- Evidence: failure_mode_cluster:github_release | fmev_0ff3ca856c8031ac2b0c56ec5eb253ab | https://github.com/HKUDS/LightRAG/releases/tag/v1.4.11rc2 | v1.4.11rc2
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 7: 失败模式：configuration: v1.4.12

- Trigger: Developers should check this configuration risk before relying on the project: v1.4.12
- Host AI rule: Before packaging this project, run the relevant install/config/quickstart check for: v1.4.12. Context: Observed when using python
- Why it matters: Upgrade or migration may change expected behavior: v1.4.12
- Evidence: failure_mode_cluster:github_release | fmev_ded21b8d88cae5cd73ae76e6ec499f47 | https://github.com/HKUDS/LightRAG/releases/tag/v1.4.12 | v1.4.12
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 8: 失败模式：configuration: v1.4.13

- Trigger: Developers should check this configuration risk before relying on the project: v1.4.13
- Host AI rule: Before packaging this project, run the relevant install/config/quickstart check for: v1.4.13. Context: Observed when using node
- Why it matters: Upgrade or migration may change expected behavior: v1.4.13
- Evidence: failure_mode_cluster:github_release | fmev_9e994731fd7834839bbe18111ec634c6 | https://github.com/HKUDS/LightRAG/releases/tag/v1.4.13 | v1.4.13
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 9: 失败模式：configuration: v1.4.14

- Trigger: Developers should check this configuration risk before relying on the project: v1.4.14
- Host AI rule: Before packaging this project, run the relevant install/config/quickstart check for: v1.4.14. Context: Observed when using python, docker
- Why it matters: Upgrade or migration may change expected behavior: v1.4.14
- Evidence: failure_mode_cluster:github_release | fmev_a1044f275fce0a09fbf5f7ff15ce5406 | https://github.com/HKUDS/LightRAG/releases/tag/v1.4.14 | v1.4.14
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 10: 失败模式：configuration: v1.5.0rc3

- Trigger: Developers should check this configuration risk before relying on the project: v1.5.0rc3
- Host AI rule: Before packaging this project, run the relevant install/config/quickstart check for: v1.5.0rc3. Context: Observed when using python
- Why it matters: Upgrade or migration may change expected behavior: v1.5.0rc3
- Evidence: failure_mode_cluster:github_release | fmev_f612aafe1cfe8a3c51740b6487bd93a7 | https://github.com/HKUDS/LightRAG/releases/tag/v1.5.0rc3 | v1.5.0rc3
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。
