# localbrain - Doramagic AI Context Pack

> 定位：安装前体验与判断资产。它帮助宿主 AI 有一个好的开始，但不代表已经安装、执行或验证目标项目。

## 充分原则

- **充分原则，不是压缩原则**：AI Context Pack 应该充分到让宿主 AI 在开工前理解项目价值、能力边界、使用入口、风险和证据来源；它可以分层组织，但不以最短摘要为目标。
- **压缩策略**：只压缩噪声和重复内容，不压缩会影响判断和开工质量的上下文。

## 给宿主 AI 的使用方式

你正在读取 Doramagic 为 localbrain 编译的 AI Context Pack。请把它当作开工前上下文：帮助用户理解适合谁、能做什么、如何开始、哪些必须安装后验证、风险在哪里。不要声称你已经安装、运行或执行了目标项目。

## Claim 消费规则

- **事实来源**：Repo Evidence + Claim/Evidence Graph；Human Wiki 只提供显著性、术语和叙事结构。
- **事实最低状态**：`supported`
- `supported`：可以作为项目事实使用，但回答中必须引用 claim_id 和证据路径。
- `weak`：只能作为低置信度线索，必须要求用户继续核实。
- `inferred`：只能用于风险提示或待确认问题，不能包装成项目事实。
- `unverified`：不得作为事实使用，应明确说证据不足。
- `contradicted`：必须展示冲突来源，不得替用户强行选择一个版本。

## 它最适合谁

- **想在安装前理解开源项目价值和边界的用户**：当前证据主要来自项目文档。 证据：`README.md` Claim：`clm_0002` supported 0.86

## 它能做什么

- **项目知识预览**（可做安装前预览）：项目可被阅读和解释，但当前证据不足以确认可安装能力或运行入口。 证据：`docs/spec/README.md`, `README.md`, `LICENSE`, `CHANGELOG.md` 等 Claim：`clm_0001` supported 0.86

## 怎么开始

- 项目证据中没有稳定 Quick Start 命令；此项应留空，而不是由 Doramagic 编造。

## 继续前判断卡

- **当前建议**：先做 Prompt Preview
- **为什么**：当前信息足以做安装前体验，但真实兼容性、输出质量或风险边界还不能直接相信。

### 30 秒判断

- **现在怎么做**：先做 Prompt Preview
- **最小安全下一步**：先跑 Prompt Preview
- **先别相信**：工具权限边界不能在安装前相信。
- **继续会触碰**：宿主 AI 上下文

### 现在可以相信

- **适合人群线索：想在安装前理解开源项目价值和边界的用户**（supported）：有 supported claim 或项目证据支撑，但仍不等于真实安装效果。 证据：`README.md` Claim：`clm_0002` supported 0.86
- **能力存在：项目知识预览**（supported）：可以相信项目包含这类能力线索；是否适合你的具体任务仍要试用或安装后验证。 证据：`docs/spec/README.md`, `README.md`, `LICENSE`, `CHANGELOG.md` 等 Claim：`clm_0001` supported 0.86

### 现在还不能相信

- **工具权限边界不能在安装前相信。**（unverified）：MCP/tool 类项目通常会触碰文件、网络、浏览器或外部 API，必须真实检查权限和日志。
- **真实输出质量不能在安装前相信。**（unverified）：Prompt Preview 只能展示引导方式，不能证明真实项目中的结果质量。
- **宿主 AI 版本兼容性不能在安装前相信。**（unverified）：Claude、Cursor、Codex、Gemini 等宿主加载规则和版本差异必须在真实环境验证。
- **不会污染现有宿主 AI 行为，不能直接相信。**（inferred）：Skill、plugin、AGENTS/CLAUDE/GEMINI 指令可能改变宿主 AI 的默认行为。
- **可安全回滚不能默认相信。**（unverified）：除非项目明确提供卸载和恢复说明，否则必须先在隔离环境验证。
- **真实安装后是否与用户当前宿主 AI 版本兼容？**（unverified）：兼容性只能通过实际宿主环境验证。
- **项目输出质量是否满足用户具体任务？**（unverified）：安装前预览只能展示流程和边界，不能替代真实评测。

### 继续会触碰什么

- **宿主 AI 上下文**：AI Context Pack、Prompt Preview、Skill 路由、风险规则和项目事实。 原因：导入上下文会影响宿主 AI 后续判断，必须避免把未验证项包装成事实。

### 最小安全下一步

- **先跑 Prompt Preview**：用安装前交互式试用判断工作方式是否匹配，不需要授权或改环境。（适用：任何项目都适用，尤其是输出质量未知时。）
- **安装后只验证一个最小任务**：先验证加载、兼容、输出质量和回滚，再决定是否深用。（适用：准备从试用进入真实工作流时。）

### 退出方式

- **保留安装前状态**：记录原始宿主配置和项目状态，后续才能判断是否可恢复。
- **如果没有回滚路径，不进入主力环境**：不可回滚是继续前阻断项，不应靠信任或运气继续。

## 哪些只能预览

- 解释项目适合谁和能做什么
- 基于项目文档演示典型对话流程
- 帮助用户判断是否值得安装或继续研究

## 哪些必须安装后验证

- 真实安装 Skill、插件或 CLI
- 执行脚本、修改本地文件或访问外部服务
- 验证真实输出质量、性能和兼容性

## 边界与风险判断卡

- **把安装前预览误认为真实运行**：用户可能高估项目已经完成的配置、权限和兼容性验证。 处理方式：明确区分 prompt_preview_can_do 与 runtime_required。 Claim：`clm_0003` inferred 0.45
- **待确认**：真实安装后是否与用户当前宿主 AI 版本兼容？。原因：兼容性只能通过实际宿主环境验证。
- **待确认**：项目输出质量是否满足用户具体任务？。原因：安装前预览只能展示流程和边界，不能替代真实评测。

## 开工前工作上下文

### 加载顺序

- 先读取 how_to_use.host_ai_instruction，建立安装前判断资产的边界。
- 读取 claim_graph_summary，确认事实来自 Claim/Evidence Graph，而不是 Human Wiki 叙事。
- 再读取 intended_users、capabilities 和 quick_start_candidates，判断用户是否匹配。
- 需要执行具体任务时，优先查 role_skill_index，再查 evidence_index。
- 遇到真实安装、文件修改、网络访问、性能或兼容性问题时，转入 risk_card 和 boundaries.runtime_required。

### 任务路由

- **项目知识预览**：先基于 role_skill_index / evidence_index 帮用户挑选可用角色、Skill 或工作流。 边界：可做安装前 Prompt 体验。 证据：`docs/spec/README.md`, `README.md`, `LICENSE`, `CHANGELOG.md` 等 Claim：`clm_0001` supported 0.86

### 上下文规模

- 文件总数：56
- 重要文件覆盖：40/56
- 证据索引条目：42
- 角色 / Skill 条目：7

### 证据不足时的处理

- **missing_evidence**：说明证据不足，要求用户提供目标文件、README 段落或安装后验证记录；不要补全事实。
- **out_of_scope_request**：说明该任务超出当前 AI Context Pack 证据范围，并建议用户先查看 Human Manual 或真实安装后验证。
- **runtime_request**：给出安装前检查清单和命令来源，但不要替用户执行命令或声称已执行。
- **source_conflict**：同时展示冲突来源，标记为待核实，不要强行选择一个版本。

## Prompt Recipes

### 适配判断

- 目标：判断这个项目是否适合用户当前任务。
- 预期输出：适配结论、关键理由、证据引用、安装前可预览内容、必须安装后验证内容、下一步建议。

```text
请基于 localbrain 的 AI Context Pack，先问我 3 个必要问题，然后判断它是否适合我的任务。回答必须包含：适合谁、能做什么、不能做什么、是否值得安装、证据来自哪里。所有项目事实必须引用 evidence_refs、source_paths 或 claim_id。
```

### 安装前体验

- 目标：让用户在安装前感受核心工作流，同时避免把预览包装成真实能力或营销承诺。
- 预期输出：一段带边界标签的体验剧本、安装后验证清单和谨慎建议；不含真实运行承诺或强营销表述。

```text
请把 localbrain 当作安装前体验资产，而不是已安装工具或真实运行环境。

请严格输出四段：
1. 先问我 3 个必要问题。
2. 给出一段“体验剧本”：用 [安装前可预览]、[必须安装后验证]、[证据不足] 三种标签展示它可能如何引导工作流。
3. 给出安装后验证清单：列出哪些能力只有真实安装、真实宿主加载、真实项目运行后才能确认。
4. 给出谨慎建议：只能说“值得继续研究/试装”“先补充信息后再判断”或“不建议继续”，不得替项目背书。

硬性边界：
- 不要声称已经安装、运行、执行测试、修改文件或产生真实结果。
- 不要写“自动适配”“确保通过”“完美适配”“强烈建议安装”等承诺性表达。
- 如果描述安装后的工作方式，必须使用“如果安装成功且宿主正确加载 Skill，它可能会……”这种条件句。
- 体验剧本只能写成“示例台词/假设流程”：使用“可能会询问/可能会建议/可能会展示”，不要写“已写入、已生成、已通过、正在运行、正在生成”。
- Prompt Preview 不负责给安装命令；如用户准备试装，只能提示先阅读 Quick Start 和 Risk Card，并在隔离环境验证。
- 所有项目事实必须来自 supported claim、evidence_refs 或 source_paths；inferred/unverified 只能作风险或待确认项。

```

### 角色 / Skill 选择

- 目标：从项目里的角色或 Skill 中挑选最匹配的资产。
- 预期输出：候选角色或 Skill 列表，每项包含适用场景、证据路径、风险边界和是否需要安装后验证。

```text
请读取 role_skill_index，根据我的目标任务推荐 3-5 个最相关的角色或 Skill。每个推荐都要说明适用场景、可能输出、风险边界和 evidence_refs。
```

### 风险预检

- 目标：安装或引入前识别环境、权限、规则冲突和质量风险。
- 预期输出：环境、权限、依赖、许可、宿主冲突、质量风险和未知项的检查清单。

```text
请基于 risk_card、boundaries 和 quick_start_candidates，给我一份安装前风险预检清单。不要替我执行命令，只说明我应该检查什么、为什么检查、失败会有什么影响。
```

### 宿主 AI 开工指令

- 目标：把项目上下文转成一次对话开始前的宿主 AI 指令。
- 预期输出：一段边界明确、证据引用明确、适合复制给宿主 AI 的开工前指令。

```text
请基于 localbrain 的 AI Context Pack，生成一段我可以粘贴给宿主 AI 的开工前指令。这段指令必须遵守 not_runtime=true，不能声称项目已经安装、运行或产生真实结果。
```

## 角色 / Skill 索引

- 共索引 7 个角色 / Skill / 项目文档条目。

- **localbrain — 범용 로컬 RAG MCP 도구 스펙**（project_doc）：작성일: 2026-05-30 · 성격: 설계/산정 스펙 구현 전 단계 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/spec/README.md`
- **🧠 Localbrain - Find your files using simple meaning**（project_doc）：🧠 Localbrain - Find your files using simple meaning 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`README.md`
- **Changelog**（project_doc）：All notable changes to this project are documented here. Format follows Keep a Changelog https://keepachangelog.com/ ; versioning is SemVer https://semver.org/ . 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`CHANGELOG.md`
- **localbrain — 로드맵 / 남은 작업**（project_doc）：갱신: 2026-05-30 · 현재: PyPI localbrain-rag 0.1.1 배포됨 0.1.0은 망가져 yank 필요 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/ROADMAP.md`
- **localbrain — 아키텍처 & 작업량 산정**（project_doc）：벡터 DB에 두 컬렉션 을 둔다: 문서용 docs / 질의용 queries . 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/spec/architecture.md`
- **Ollama 의존성 제거 방법**（project_doc）：왜 빼고 싶은가 Ollama는 별도 설치·상시 실행이 필요한 외부 프로세스 데몬 다. 배포용 범용 도구가 "먼저 Ollama 깔고 켜세요"를 요구하면 마찰이 크다. 목표: 외부 데몬 없이 임베딩 생성. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/spec/embedding-runtime.md`
- **UI가 들어갈 여지 검토**（project_doc）：결론 먼저 UI를 운영 UI 와 인사이트 UI 둘로 나눠 보면 답이 명확하다. - 운영 UI 소스 추가·수동 인덱싱·진행상황·검색 테스트·모델 교체 — 데이터가 없어도 첫날부터 유용 → 초기 범위에 포함 . - 인사이트 UI 클러스터·FAQ·지식공백 — 질의가 쌓여야 의미 → 나중에 같은 대시보드에 탭 추가 . 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/spec/ui-review.md`

## 证据索引

- 共索引 42 条证据。

- **localbrain — 범용 로컬 RAG MCP 도구 스펙**（documentation）：작성일: 2026-05-30 · 성격: 설계/산정 스펙 구현 전 단계 证据：`docs/spec/README.md`
- **🧠 Localbrain - Find your files using simple meaning**（documentation）：🧠 Localbrain - Find your files using simple meaning 证据：`README.md`
- **License**（source_file）：Copyright c 2026 localbrain authors 证据：`LICENSE`
- **Changelog**（documentation）：All notable changes to this project are documented here. Format follows Keep a Changelog https://keepachangelog.com/ ; versioning is SemVer https://semver.org/ . 证据：`CHANGELOG.md`
- **localbrain — 로드맵 / 남은 작업**（documentation）：갱신: 2026-05-30 · 현재: PyPI localbrain-rag 0.1.1 배포됨 0.1.0은 망가져 yank 필요 证据：`docs/ROADMAP.md`
- **localbrain — 아키텍처 & 작업량 산정**（documentation）：벡터 DB에 두 컬렉션 을 둔다: 문서용 docs / 질의용 queries . 证据：`docs/spec/architecture.md`
- **Ollama 의존성 제거 방법**（documentation）：왜 빼고 싶은가 Ollama는 별도 설치·상시 실행이 필요한 외부 프로세스 데몬 다. 배포용 범용 도구가 "먼저 Ollama 깔고 켜세요"를 요구하면 마찰이 크다. 목표: 외부 데몬 없이 임베딩 생성. 证据：`docs/spec/embedding-runtime.md`
- **UI가 들어갈 여지 검토**（documentation）：결론 먼저 UI를 운영 UI 와 인사이트 UI 둘로 나눠 보면 답이 명확하다. - 운영 UI 소스 추가·수동 인덱싱·진행상황·검색 테스트·모델 교체 — 데이터가 없어도 첫날부터 유용 → 초기 범위에 포함 . - 인사이트 UI 클러스터·FAQ·지식공백 — 질의가 쌓여야 의미 → 나중에 같은 대시보드에 탭 추가 . 证据：`docs/spec/ui-review.md`
- **Init**（source_file）：version = version "localbrain-rag" ⋮---- version = "0.0.0+dev" 证据：`src/localbrain/__init__.py`
- **Cli**（source_file）：def main argv: list str None = None - int ⋮---- parser = argparse.ArgumentParser prog="localbrain", description="로컬 RAG MCP 도구" ⋮---- sub = parser.add subparsers dest="cmd", required=True p add = sub.add parser "add-source", help="폴더/파일 경로 등록" ⋮---- p idx = sub.add parser "index", help="증분 인덱싱 실행" ⋮---- p search = sub.add parser "search", help="의미 검색" ⋮---- p ins = sub.add parser "insights", help="질의 클러스터링 FAQ ·지식공백 리포트" ⋮---- args = parser.parse args argv ctx = AppContext indexing = IndexingService ctx search = SearchService ctx insights = InsightsService ctx ⋮---- src = indexing.add source args.path, tuple args.globs.split "," , not args.no recursive ⋮---- hits = search.search args.query,… 证据：`src/localbrain/adapters/cli.py`
- **Mcp Server**（source_file）：mcp = FastMCP "localbrain" ctx = AppContext indexing = IndexingService ctx search = SearchService ctx insights = InsightsService ctx ⋮---- @mcp.tool def search query: str, k: int = 5, path prefix: str None = None - list dict ⋮---- @mcp.tool def add path path: str, globs: str = " .md, .txt", recursive: bool = True - dict ⋮---- s = indexing.add source path, tuple globs.split "," , recursive ⋮---- @mcp.tool def remove path source id: str - dict ⋮---- @mcp.tool def list sources - list dict ⋮---- @mcp.tool def reindex source id: str None = None, rebuild: bool = False - list dict ⋮---- @mcp.tool def stats - dict ⋮---- @mcp.tool def query insights min similarity: float = 0.80 - dict def main - None 证据：`src/localbrain/adapters/mcp_server.py`
- **Server**（source_file）：app = FastAPI title="localbrain" ctx = AppContext indexing = IndexingService ctx search = SearchService ctx model = ModelService ctx insights = InsightsService ctx STATIC = Path file .parent / "static" ⋮---- @app.get "/" def index page ⋮---- @app.get "/api/fs/list" def fs list path: str = "" ⋮---- base = Path path if path else Path.home ⋮---- items = ⋮---- class SourceIn BaseModel ⋮---- path: str globs: str = " .md, .txt" recursive: bool = True ⋮---- @app.get "/api/sources" def get sources ⋮---- @app.post "/api/sources" def add source body: SourceIn ⋮---- @app.delete "/api/sources/{source id}" def delete source source id: str ⋮---- @app.get "/api/index/stream" def index stream source id: st… 证据：`src/localbrain/adapters/web/server.py`
- **Config**（source_file）：def home - Path ⋮---- override = os.environ.get "LOCALBRAIN HOME" ⋮---- @dataclass class EmbeddingConfig ⋮---- provider: str = "fastembed" model: str = "intfloat/multilingual-e5-large" fp16: bool = False ⋮---- @dataclass class ChunkConfig ⋮---- size: int = 1000 overlap: int = 150 ⋮---- @dataclass class RerankConfig ⋮---- enabled: bool = True provider: str = "cross-encoder" model: str = "BAAI/bge-reranker-v2-m3" candidate k: int = 30 ⋮---- @dataclass class Config ⋮---- home: Path = field default factory= home embedding: EmbeddingConfig = field default factory=EmbeddingConfig chunk: ChunkConfig = field default factory=ChunkConfig rerank: RerankConfig = field default factory=RerankConfig searc… 证据：`src/localbrain/config.py`
- **Context**（source_file）：class AppContext ⋮---- def init self, config: Config None = None - None 证据：`src/localbrain/context.py`
- **Chunking**（source_file）：def chunk text text: str, size: int = 1000, overlap: int = 150 - list str ⋮---- text = text.strip ⋮---- paragraphs = p.strip for p in text.split "\n\n" if p.strip chunks: list str = buf = "" ⋮---- buf = f"{buf}\n\n{p}" if buf else p ⋮---- buf = p else: 한 문단이 size 보다 크면 문자 윈도우로 분할 step = max 1, size - overlap ⋮---- if overlap 0 and len chunks 1: 인접 청크 앞에 이전 꼬리를 덧붙여 문맥 연결 merged = chunks 0 证据：`src/localbrain/core/chunking.py`
- **Clustering**（source_file）：def cluster embeddings vectors: list list float , min similarity: float = 0.80 - list int ⋮---- X = np.asarray vectors, dtype="float32" norms = np.linalg.norm X, axis=1, keepdims=True ⋮---- Xn = X / norms labels: list int = -1 len Xn sums: list np.ndarray = counts: list int = ⋮---- centroid = sums c / counts c n = np.linalg.norm centroid or 1.0 sim = float np.dot v, centroid / n ⋮---- def medoid index vectors: list list float , indices: list int - int ⋮---- X = np.asarray vectors i for i in indices , dtype="float32" ⋮---- sims = Xn @ Xn.T avg = sims.sum axis=1 - 1.0 / len indices - 1 证据：`src/localbrain/core/clustering.py`
- **Db**（source_file）：SCHEMA = """ def connect db path: Path - sqlite3.Connection ⋮---- conn = sqlite3.connect str db path , check same thread=False 证据：`src/localbrain/core/db.py`
- **Base**（source_file）：@runtime checkable class EmbeddingProvider Protocol ⋮---- model id: str dim: int def embed texts self, texts: list str - list list float 证据：`src/localbrain/core/embed/base.py`
- **Ollama Provider**（source_file）：class OllamaProvider ⋮---- @property def dim self - int def embed texts self, texts: list str - list list float ⋮---- out: list list float = ⋮---- req = urllib.request.Request 证据：`src/localbrain/core/embed/ollama_provider.py`
- **Registry**（source_file）：def make provider provider: str, model: str, fp16: bool = False - EmbeddingProvider 证据：`src/localbrain/core/embed/registry.py`
- **Indexer**（source_file）：def path key ap: str - str class Indexer ⋮---- def apply self, source: Source, cs: ChangeSet - Iterator dict ⋮---- targets = cs.new + cs.modified total = len targets + len cs.deleted done = 0 ⋮---- rec = self. fi.get ap ⋮---- old = self. fi.get ap ⋮---- def index file self, ap: str, source id: str - None ⋮---- path = Path ap loader = get loader path ⋮---- st = path.stat chunks = chunk text loader.load path , self. size, self. overlap ⋮---- key = path key ap ids = f"{key}-{i}" for i in range len chunks embeddings = self. provider.embed texts chunks metas = 证据：`src/localbrain/core/indexer.py`
- **Insights**（source_file）：class Insights ⋮---- def init self, conn: sqlite3.Connection, store: VectorStore - None def log query self, text: str, embedding: list float , hits: list SearchHit - None ⋮---- qid = uuid.uuid4 .hex top = hits 0 .score if hits else None ⋮---- total = len ids ⋮---- labels = cluster embeddings vectors, min similarity groups: dict int, list int = {} ⋮---- clusters = ⋮---- rep = medoid index vectors, idxs scores = float metas i .get "top score", 0.0 for i in idxs misses = sum 1 for i in idxs if not metas i .get "hit", True ⋮---- gaps = 证据：`src/localbrain/core/insights.py`
- **Base**（source_file）：@runtime checkable class Loader Protocol ⋮---- def supports self, path: Path - bool def load self, path: Path - str 证据：`src/localbrain/core/loaders/base.py`
- **Registry**（source_file）：LOADERS: list Loader = TextLoader def get loader path: Path - Loader None def is supported path: Path - bool 证据：`src/localbrain/core/loaders/registry.py`
- **Base**（source_file）：@runtime checkable class Reranker Protocol ⋮---- model id: str def rerank self, query: str, docs: list str - list float 证据：`src/localbrain/core/rerank/base.py`
- **Cross Encoder**（source_file）：class CrossEncoderReranker ⋮---- def init self, model: str = "BAAI/bge-reranker-v2-m3", fp16: bool = False - None def ensure self - None def rerank self, query: str, docs: list str - list float ⋮---- scores = self. model.predict query, d for d in docs 证据：`src/localbrain/core/rerank/cross_encoder.py`
- **Registry**（source_file）：def make reranker provider: str, model: str, fp16: bool = False - Reranker 证据：`src/localbrain/core/rerank/registry.py`
- **Search**（source_file）：class Searcher ⋮---- def init self, provider: EmbeddingProvider, store: VectorStore - None def embed query self, query: str - list float ⋮---- fetch = k 3 if path prefix else k hits: list SearchHit = ⋮---- source path = meta.get "source path", "" 证据：`src/localbrain/core/search.py`
- **Source Store**（source_file）：class SourceStore ⋮---- def init self, conn: sqlite3.Connection - None def add self, source: Source - None def remove self, source id: str - None def get self, source id: str - Source None ⋮---- row = self. conn.execute "SELECT FROM sources WHERE source id=?", source id, .fetchone ⋮---- def list self - list Source ⋮---- rows = self. conn.execute "SELECT FROM sources ORDER BY path" .fetchall ⋮---- @staticmethod def to source r: sqlite3.Row - Source 证据：`src/localbrain/core/source_store.py`
- **Store**（source_file）：def safe name: str - str class VectorStore ⋮---- def init self, persist dir: Path, model id: str - None ⋮---- tag = safe model id cosine = {"hnsw:space": "cosine"} ⋮---- def delete documents self, ids: list str - None ⋮---- res = self. docs.query query embeddings= embedding , n results=k, where=where ⋮---- def add query self, qid: str, embedding: list float , text: str, metadata: dict str, Any - None def all queries self - tuple list str , list list float , list str , list dict ⋮---- res = self. queries.get include= "embeddings", "documents", "metadatas" raw = res.get "embeddings" embeddings = list map float, e for e in raw if raw is not None else ⋮---- def count documents self - int 证据：`src/localbrain/core/store.py`
- **Indexing Service**（source_file）：class IndexingService ⋮---- def init self, ctx: AppContext - None ⋮---- src = Source uuid.uuid4 .hex :8 , str path , tuple globs , recursive ⋮---- def remove source self, source id: str - None ⋮---- rec = self. ctx.file index.get ap ⋮---- def list sources self - list Source def run self, source id: str None = None, rebuild: bool = False - Iterator dict ⋮---- sources = self. ctx.sources.get source id if source id else self. ctx.sources.list ⋮---- cs = self. ctx.scanner.scan src 证据：`src/localbrain/services/indexing_service.py`
- **Insights Service**（source_file）：class InsightsService ⋮---- def init self, ctx: AppContext - None def report self, min similarity: float = 0.80, gap score: float = 0.5 - dict 证据：`src/localbrain/services/insights_service.py`
- **Model Service**（source_file）：class ModelService ⋮---- def init self, ctx: AppContext - None def current self - dict def switch self, provider: str, model: str - dict ⋮---- cfg = self. ctx.config 证据：`src/localbrain/services/model_service.py`
- **Search Service**（source_file）：class SearchService ⋮---- def init self, ctx: AppContext - None ⋮---- cfg = self. ctx.config k = k or cfg.search k reranker = self. ctx.reranker if rerank else None fetch = cfg.rerank.candidate k if reranker else k embedding = self. ctx.searcher.embed query query hits = self. ctx.searcher.search by vector embedding, fetch, path prefix ⋮---- scores = reranker.rerank query, h.text for h in hits ⋮---- hits = hits :k self. ctx.insights.log query query, embedding, hits 임베딩 재사용 축 ① ⋮---- def stats self - dict 证据：`src/localbrain/services/search_service.py`
- **.dockerignore**（source_file）：.venv/ / pycache / .pyc dist/ build/ .egg-info/ .git/ .github/ docs/ screenshots/ .db .localbrain/ / .py 证据：`.dockerignore`
- **저장소 내 텍스트는 LF 로 정규화 체크아웃 시 OS 기본에 맞춤**（source_file）：저장소 내 텍스트는 LF 로 정규화 체크아웃 시 OS 기본에 맞춤 text=auto eol=lf 证据：`.gitattributes`
- **Python**（source_file）：Python pycache / .py cod .egg-info/ .eggs/ build/ dist/ .venv/ venv/ 证据：`.gitignore`
- **localbrain — web/MCP 서버용 이미지 옵션, 2차 배포 형태**（source_file）：localbrain — web/MCP 서버용 이미지 옵션, 2차 배포 형태 GPU: 호스트에 NVIDIA 드라이버 + Container Toolkit 필요. docker run --gpus all ... Windows 는 Docker Desktop + WSL2 백엔드에서 --gpus all 지원 주의: 컨테이너는 마운트된 볼륨만 본다 → "임의 로컬 폴더 인덱싱" 대신 호스트 문서 폴더를 /docs 등으로 마운트해 서비스로 운용하는 시나리오에 적합. FROM python:3.11-slim 证据：`Dockerfile`
- **Manifest**（source_file）：include LICENSE include README.md include CHANGELOG.md recursive-include src/localbrain/adapters/web/static 证据：`MANIFEST.in`
- **Docker Compose**（source_file）：services: localbrain-web: build: . ports: - "8765:8765" volumes: - ./ data:/data - ${DOCS DIR:-./docs}:/docs:ro environment: LOCALBRAIN HOST: "0.0.0.0" deploy: resources: reservations: devices: - driver: nvidia count: all capabilities: gpu 证据：`docker-compose.yml`
- **생성 & 실행**（source_file）：LocalBrain — 로컬 LLM · RAG · MCP 정리 :root{ --bg: 0d1117; --bg-soft: 161b22; --bg-card: 1c2230; --border: 2a3240; --fg: e6edf3; --fg-dim: 9aa7b4; --fg-faint: 6b7785; --accent: 58a6ff; --accent2: 7ee787; --accent3: d2a8ff; --warn: f0b429; --pink: ff7b9c; --code-bg: 11161f; --radius:14px; --mono:"Cascadia Code",ui-monospace,SFMono-Regular,Consolas,"Courier New",monospace; --sans:-apple-system,"Segoe UI","Malgun Gothic","Apple SD Gothic Neo",Roboto,sans-serif; } {box-sizing:border-box} html{scroll-behavior:smooth} body{ margin:0;background:var --bg ;color:var --fg ;font-family:var --sans ; line-height:1.75;font-size:16px; background-image:radial-gradient 1200px 600px at 80% -10%,rgba 88,166,255,… 证据：`index.html`
- **기본 deps: fastembed ONNX, 데몬 없음 → 추가 설치 없이 CPU 에서 바로 동작.**（source_file）：project name = "localbrain-rag" version = "0.1.1" description = "Local-first general-purpose RAG with an MCP server, CLI, and web console" readme = "README.md" requires-python = " =3.10" license = { file = "LICENSE" } authors = { email = "jwjy1313@gmail.com" } keywords = "rag", "mcp", "embeddings", "semantic-search", "llm", "local", "vector-search" classifiers = "Development Status :: 4 - Beta", "Intended Audience :: Developers", "License :: OSI Approved :: MIT License", "Operating System :: OS Independent", "Programming Language :: Python :: 3", "Programming Language :: Python :: 3.10", "Programming Language :: Python :: 3.11", "Programming Language :: Python :: 3.12", "Topic :: Scientific… 证据：`pyproject.toml`

## 宿主 AI 必须遵守的规则

- **把本资产当作开工前上下文，而不是运行环境。**：AI Context Pack 只包含证据化项目理解，不包含目标项目的可执行状态。 证据：`docs/spec/README.md`, `README.md`, `LICENSE`
- **回答用户时区分可预览内容与必须安装后才能验证的内容。**：安装前体验的消费者价值来自降低误装和误判，而不是伪装成真实运行。 证据：`docs/spec/README.md`, `README.md`, `LICENSE`

## 用户开工前应该回答的问题

- 你准备在哪个宿主 AI 或本地环境中使用它？
- 你只是想先体验工作流，还是准备真实安装？
- 你最在意的是安装成本、输出质量、还是和现有规则的冲突？

## 验收标准

- 所有能力声明都能回指到 evidence_refs 中的文件路径。
- AI_CONTEXT_PACK.md 没有把预览包装成真实运行。
- 用户能在 3 分钟内看懂适合谁、能做什么、如何开始和风险边界。

---

## Doramagic Context Augmentation

下面内容用于强化 Repomix/AI Context Pack 主体。Human Manual 只提供阅读骨架；踩坑日志会被转成宿主 AI 必须遵守的工作约束。

## Human Manual 骨架

使用规则：这里只是项目阅读路线和显著性信号，不是事实权威。具体事实仍必须回到 repo evidence / Claim Graph。

宿主 AI 硬性规则：
- 不得把页标题、章节顺序、摘要或 importance 当作项目事实证据。
- 解释 Human Manual 骨架时，必须明确说它只是阅读路线/显著性信号。
- 能力、安装、兼容性、运行状态和风险判断必须引用 repo evidence、source path 或 Claim Graph。

- **概述与系统架构**：importance `high`
  - source_paths: README.md, src/localbrain/__init__.py, src/localbrain/context.py, CHANGELOG.md
- **核心引擎：索引与数据管道**：importance `high`
  - source_paths: src/localbrain/core/scanner.py, src/localbrain/core/indexer.py, src/localbrain/core/embed/base.py, src/localbrain/core/embed/registry.py, src/localbrain/core/embed/fastembed_provider.py
- **搜索、重排序与洞察**：importance `high`
  - source_paths: src/localbrain/core/search.py, src/localbrain/core/rerank/base.py, src/localbrain/core/rerank/cross_encoder.py, src/localbrain/core/rerank/registry.py, src/localbrain/core/insights.py
- **适配器、配置与部署**：importance `high`
  - source_paths: src/localbrain/adapters/cli.py, src/localbrain/adapters/mcp_server.py, src/localbrain/adapters/web/server.py, src/localbrain/services/indexing_service.py, src/localbrain/services/model_service.py

## Repo Inspection Evidence / 源码检查证据

- repo_clone_verified: true
- repo_inspection_verified: true
- repo_commit: `927ddbf7b155b364ad30fbb1645270ede5ef8ff0`
- inspected_files: `Dockerfile`, `README.md`, `docker-compose.yml`, `pyproject.toml`, `docs/ROADMAP.md`, `docs/spec/README.md`, `docs/spec/architecture.md`, `docs/spec/embedding-runtime.md`, `docs/spec/ui-review.md`, `src/localbrain/__init__.py`, `src/localbrain/adapters/__init__.py`, `src/localbrain/adapters/cli.py`, `src/localbrain/adapters/mcp_server.py`, `src/localbrain/adapters/web/__init__.py`, `src/localbrain/adapters/web/server.py`, `src/localbrain/config.py`, `src/localbrain/context.py`, `src/localbrain/core/__init__.py`, `src/localbrain/core/chunking.py`, `src/localbrain/core/clustering.py`

宿主 AI 硬性规则：
- 没有 repo_clone_verified=true 时，不得声称已经读过源码。
- 没有 repo_inspection_verified=true 时，不得把 README/docs/package 文件判断写成事实。
- 没有 quick_start_verified=true 时，不得声称 Quick Start 已跑通。

## Doramagic Pitfall Constraints / 踩坑约束

这些规则来自 Doramagic 发现、验证或编译过程中的项目专属坑点。宿主 AI 必须把它们当作工作约束，而不是普通说明文字。

### Constraint 1: 可能修改宿主 AI 配置

- Trigger: 项目面向 Claude/Cursor/Codex/Gemini/OpenCode 等宿主，或安装命令涉及用户配置目录。
- Host AI rule: 列出会写入的配置文件、目录和卸载/回滚步骤。
- Why it matters: 安装可能改变本机 AI 工具行为，用户需要知道写入位置和回滚方法。
- Evidence: capability.host_targets | https://github.com/Tamariskwhisper962/Localbrain | host_targets=mcp_host, claude
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 2: 能力判断依赖假设

- Trigger: README/documentation is current enough for a first validation pass.
- Host AI rule: 将假设转成下游验证清单。
- Why it matters: 假设不成立时，用户拿不到承诺的能力。
- Evidence: capability.assumptions | https://github.com/Tamariskwhisper962/Localbrain | README/documentation is current enough for a first validation pass.
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 3: 维护活跃度未知

- Trigger: 未记录 last_activity_observed。
- Host AI rule: 补 GitHub 最近 commit、release、issue/PR 响应信号。
- Why it matters: 新项目、停更项目和活跃项目会被混在一起，推荐信任度下降。
- Evidence: evidence.maintainer_signals | https://github.com/Tamariskwhisper962/Localbrain | last_activity_observed missing
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

- Trigger: no_demo
- Evidence: downstream_validation.risk_items | https://github.com/Tamariskwhisper962/Localbrain | no_demo; severity=medium
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 5: 存在评分风险

- Trigger: no_demo
- Why it matters: 风险会影响是否适合普通用户安装。
- Evidence: risks.scoring_risks | https://github.com/Tamariskwhisper962/Localbrain | no_demo; severity=medium
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 6: issue/PR 响应质量未知

- Trigger: issue_or_pr_quality=unknown。
- Host AI rule: 抽样最近 issue/PR，判断是否长期无人处理。
- Why it matters: 用户无法判断遇到问题后是否有人维护。
- Evidence: evidence.maintainer_signals | https://github.com/Tamariskwhisper962/Localbrain | issue_or_pr_quality=unknown
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 7: 发布节奏不明确

- Trigger: release_recency=unknown。
- Host AI rule: 确认最近 release/tag 和 README 安装命令是否一致。
- Why it matters: 安装命令和文档可能落后于代码，用户踩坑概率升高。
- Evidence: evidence.maintainer_signals | https://github.com/Tamariskwhisper962/Localbrain | release_recency=unknown
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。
