# korvus - Doramagic AI Context Pack

> 定位：安装前体验与判断资产。它帮助宿主 AI 有一个好的开始，但不代表已经安装、执行或验证目标项目。

## 充分原则

- **充分原则，不是压缩原则**：AI Context Pack 应该充分到让宿主 AI 在开工前理解项目价值、能力边界、使用入口、风险和证据来源；它可以分层组织，但不以最短摘要为目标。
- **压缩策略**：只压缩噪声和重复内容，不压缩会影响判断和开工质量的上下文。

## 给宿主 AI 的使用方式

你正在读取 Doramagic 为 korvus 编译的 AI Context Pack。请把它当作开工前上下文：帮助用户理解适合谁、能做什么、如何开始、哪些必须安装后验证、风险在哪里。不要声称你已经安装、运行或执行了目标项目。

## Claim 消费规则

- **事实来源**：Repo Evidence + Claim/Evidence Graph；Human Wiki 只提供显著性、术语和叙事结构。
- **事实最低状态**：`supported`
- `supported`：可以作为项目事实使用，但回答中必须引用 claim_id 和证据路径。
- `weak`：只能作为低置信度线索，必须要求用户继续核实。
- `inferred`：只能用于风险提示或待确认问题，不能包装成项目事实。
- `unverified`：不得作为事实使用，应明确说证据不足。
- `contradicted`：必须展示冲突来源，不得替用户强行选择一个版本。

## 它最适合谁

- **想在安装前理解开源项目价值和边界的用户**：当前证据主要来自项目文档。 证据：`README.md` Claim：`clm_0002` supported 0.86

## 它能做什么

- **命令行启动或安装流程**（需要安装后验证）：项目文档中存在可执行命令，真实使用需要在本地或宿主环境中运行这些命令。 证据：`README.md` Claim：`clm_0001` supported 0.86

## 怎么开始

- `pip install korvus` 证据：`README.md` Claim：`clm_0003` supported 0.86

## 继续前判断卡

- **当前建议**：仅建议沙盒试装
- **为什么**：项目存在安装命令、宿主配置或本地写入线索，不建议直接进入主力环境，应先在隔离环境试装。

### 30 秒判断

- **现在怎么做**：仅建议沙盒试装
- **最小安全下一步**：先跑 Prompt Preview；若仍要安装，只在隔离环境试装
- **先别相信**：真实输出质量不能在安装前相信。
- **继续会触碰**：命令执行、本地环境或项目文件、宿主 AI 上下文

### 现在可以相信

- **适合人群线索：想在安装前理解开源项目价值和边界的用户**（supported）：有 supported claim 或项目证据支撑，但仍不等于真实安装效果。 证据：`README.md` Claim：`clm_0002` supported 0.86
- **能力存在：命令行启动或安装流程**（supported）：可以相信项目包含这类能力线索；是否适合你的具体任务仍要试用或安装后验证。 证据：`README.md` Claim：`clm_0001` supported 0.86
- **存在 Quick Start / 安装命令线索**（supported）：可以相信项目文档出现过启动或安装入口；不要因此直接在主力环境运行。 证据：`README.md` Claim：`clm_0003` supported 0.86

### 现在还不能相信

- **真实输出质量不能在安装前相信。**（unverified）：Prompt Preview 只能展示引导方式，不能证明真实项目中的结果质量。
- **宿主 AI 版本兼容性不能在安装前相信。**（unverified）：Claude、Cursor、Codex、Gemini 等宿主加载规则和版本差异必须在真实环境验证。
- **不会污染现有宿主 AI 行为，不能直接相信。**（inferred）：Skill、plugin、AGENTS/CLAUDE/GEMINI 指令可能改变宿主 AI 的默认行为。
- **可安全回滚不能默认相信。**（unverified）：除非项目明确提供卸载和恢复说明，否则必须先在隔离环境验证。
- **真实安装后是否与用户当前宿主 AI 版本兼容？**（unverified）：兼容性只能通过实际宿主环境验证。
- **项目输出质量是否满足用户具体任务？**（unverified）：安装前预览只能展示流程和边界，不能替代真实评测。
- **安装命令是否需要网络、权限或全局写入？**（unverified）：这影响企业环境和个人环境的安装风险。 证据：`README.md`

### 继续会触碰什么

- **命令执行**：包管理器、网络下载、本地插件目录、项目配置或用户主目录。 原因：运行第一条命令就可能产生环境改动；必须先判断是否值得跑。 证据：`README.md`
- **本地环境或项目文件**：安装结果、插件缓存、项目配置或本地依赖目录。 原因：安装前无法证明写入范围和回滚方式，需要隔离验证。 证据：`README.md`
- **宿主 AI 上下文**：AI Context Pack、Prompt Preview、Skill 路由、风险规则和项目事实。 原因：导入上下文会影响宿主 AI 后续判断，必须避免把未验证项包装成事实。

### 最小安全下一步

- **先跑 Prompt Preview**：用安装前交互式试用判断工作方式是否匹配，不需要授权或改环境。（适用：任何项目都适用，尤其是输出质量未知时。）
- **只在隔离目录或测试账号试装**：避免安装命令污染主力宿主 AI、真实项目或用户主目录。（适用：存在命令执行、插件配置或本地写入线索时。）
- **安装后只验证一个最小任务**：先验证加载、兼容、输出质量和回滚，再决定是否深用。（适用：准备从试用进入真实工作流时。）

### 退出方式

- **保留安装前状态**：记录原始宿主配置和项目状态，后续才能判断是否可恢复。
- **记录安装命令和写入路径**：没有明确卸载说明时，至少要知道哪些目录或配置需要手动清理。
- **如果没有回滚路径，不进入主力环境**：不可回滚是继续前阻断项，不应靠信任或运气继续。

## 哪些只能预览

- 解释项目适合谁和能做什么
- 基于项目文档演示典型对话流程
- 帮助用户判断是否值得安装或继续研究

## 哪些必须安装后验证

- 真实安装 Skill、插件或 CLI
- 执行脚本、修改本地文件或访问外部服务
- 验证真实输出质量、性能和兼容性

## 边界与风险判断卡

- **把安装前预览误认为真实运行**：用户可能高估项目已经完成的配置、权限和兼容性验证。 处理方式：明确区分 prompt_preview_can_do 与 runtime_required。 Claim：`clm_0004` inferred 0.45
- **命令执行会修改本地环境**：安装命令可能写入用户主目录、宿主插件目录或项目配置。 处理方式：先在隔离环境或测试账号中运行。 证据：`README.md` Claim：`clm_0005` supported 0.86
- **待确认**：真实安装后是否与用户当前宿主 AI 版本兼容？。原因：兼容性只能通过实际宿主环境验证。
- **待确认**：项目输出质量是否满足用户具体任务？。原因：安装前预览只能展示流程和边界，不能替代真实评测。
- **待确认**：安装命令是否需要网络、权限或全局写入？。原因：这影响企业环境和个人环境的安装风险。

## 开工前工作上下文

### 加载顺序

- 先读取 how_to_use.host_ai_instruction，建立安装前判断资产的边界。
- 读取 claim_graph_summary，确认事实来自 Claim/Evidence Graph，而不是 Human Wiki 叙事。
- 再读取 intended_users、capabilities 和 quick_start_candidates，判断用户是否匹配。
- 需要执行具体任务时，优先查 role_skill_index，再查 evidence_index。
- 遇到真实安装、文件修改、网络访问、性能或兼容性问题时，转入 risk_card 和 boundaries.runtime_required。

### 任务路由

- **命令行启动或安装流程**：先说明这是安装后验证能力，再给出安装前检查清单。 边界：必须真实安装或运行后验证。 证据：`README.md` Claim：`clm_0001` supported 0.86

### 上下文规模

- 文件总数：101
- 重要文件覆盖：40/101
- 证据索引条目：43
- 角色 / Skill 条目：10

### 证据不足时的处理

- **missing_evidence**：说明证据不足，要求用户提供目标文件、README 段落或安装后验证记录；不要补全事实。
- **out_of_scope_request**：说明该任务超出当前 AI Context Pack 证据范围，并建议用户先查看 Human Manual 或真实安装后验证。
- **runtime_request**：给出安装前检查清单和命令来源，但不要替用户执行命令或声称已执行。
- **source_conflict**：同时展示冲突来源，标记为待核实，不要强行选择一个版本。

## Prompt Recipes

### 适配判断

- 目标：判断这个项目是否适合用户当前任务。
- 预期输出：适配结论、关键理由、证据引用、安装前可预览内容、必须安装后验证内容、下一步建议。

```text
请基于 korvus 的 AI Context Pack，先问我 3 个必要问题，然后判断它是否适合我的任务。回答必须包含：适合谁、能做什么、不能做什么、是否值得安装、证据来自哪里。所有项目事实必须引用 evidence_refs、source_paths 或 claim_id。
```

### 安装前体验

- 目标：让用户在安装前感受核心工作流，同时避免把预览包装成真实能力或营销承诺。
- 预期输出：一段带边界标签的体验剧本、安装后验证清单和谨慎建议；不含真实运行承诺或强营销表述。

```text
请把 korvus 当作安装前体验资产，而不是已安装工具或真实运行环境。

请严格输出四段：
1. 先问我 3 个必要问题。
2. 给出一段“体验剧本”：用 [安装前可预览]、[必须安装后验证]、[证据不足] 三种标签展示它可能如何引导工作流。
3. 给出安装后验证清单：列出哪些能力只有真实安装、真实宿主加载、真实项目运行后才能确认。
4. 给出谨慎建议：只能说“值得继续研究/试装”“先补充信息后再判断”或“不建议继续”，不得替项目背书。

硬性边界：
- 不要声称已经安装、运行、执行测试、修改文件或产生真实结果。
- 不要写“自动适配”“确保通过”“完美适配”“强烈建议安装”等承诺性表达。
- 如果描述安装后的工作方式，必须使用“如果安装成功且宿主正确加载 Skill，它可能会……”这种条件句。
- 体验剧本只能写成“示例台词/假设流程”：使用“可能会询问/可能会建议/可能会展示”，不要写“已写入、已生成、已通过、正在运行、正在生成”。
- Prompt Preview 不负责给安装命令；如用户准备试装，只能提示先阅读 Quick Start 和 Risk Card，并在隔离环境验证。
- 所有项目事实必须来自 supported claim、evidence_refs 或 source_paths；inferred/unverified 只能作风险或待确认项。

```

### 角色 / Skill 选择

- 目标：从项目里的角色或 Skill 中挑选最匹配的资产。
- 预期输出：候选角色或 Skill 列表，每项包含适用场景、证据路径、风险边界和是否需要安装后验证。

```text
请读取 role_skill_index，根据我的目标任务推荐 3-5 个最相关的角色或 Skill。每个推荐都要说明适用场景、可能输出、风险边界和 evidence_refs。
```

### 风险预检

- 目标：安装或引入前识别环境、权限、规则冲突和质量风险。
- 预期输出：环境、权限、依赖、许可、宿主冲突、质量风险和未知项的检查清单。

```text
请基于 risk_card、boundaries 和 quick_start_candidates，给我一份安装前风险预检清单。不要替我执行命令，只说明我应该检查什么、为什么检查、失败会有什么影响。
```

### 宿主 AI 开工指令

- 目标：把项目上下文转成一次对话开始前的宿主 AI 指令。
- 预期输出：一段边界明确、证据引用明确、适合复制给宿主 AI 的开工前指令。

```text
请基于 korvus 的 AI Context Pack，生成一段我可以粘贴给宿主 AI 的开工前指令。这段指令必须遵守 not_runtime=true，不能声称项目已经安装、运行或产生真实结果。
```

## 角色 / Skill 索引

- 共索引 10 个角色 / Skill / 项目文档条目。

- **🦅 What is Korvus?**（project_doc）：Korvus is a search SDK that unifies the entire RAG pipeline in a single database query. Built on top of Postgres with bindings for Python, JavaScript and Rust, Korvus delivers high-performance, customizable search capabilities with minimal infrastructure concerns. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`README.md`
- **Open Source Alternative for Building End-to-End Vector Search Applications without OpenAI & Pinecone**（project_doc）：Open Source Alternative for Building End-to-End Vector Search Applications without OpenAI & Pinecone 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`korvus/README.md`
- **A Tool for Automatically Translating to Py03 and Neon compatible Rust**（project_doc）：A Tool for Automatically Translating to Py03 and Neon compatible Rust 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`rust-bridge/README.md`
- **Open Source Alternative for Building End-to-End Vector Search Applications without OpenAI & Pinecone**（project_doc）：Open Source Alternative for Building End-to-End Vector Search Applications without OpenAI & Pinecone 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`korvus/javascript/README.md`
- **Examples**（project_doc）：Prerequisites Before running any examples first install dependencies and set the DATABASE URL environment variable: 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`korvus/javascript/examples/README.md`
- **Webpack Demo**（project_doc）：The JavaScript SDK utilizes native node modules as our SDK is written in Rust. To get it working with webpack, we need a loader that is designed to work with native node modules. In this case, we have opted to use the node-loader https://github.com/webpack-contrib/node-loader module. See webpack.config.js ./webpack.config.js for how we configured it. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`korvus/javascript/examples/webpack/README.md`
- **Open Source Alternative for Building End-to-End Vector Search Applications without OpenAI & Pinecone**（project_doc）：Open Source Alternative for Building End-to-End Vector Search Applications without OpenAI & Pinecone 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`korvus/python/README.md`
- **Examples**（project_doc）：Prerequisites Before running any examples first install dependencies and set the DATABASE URL environment variable: 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`korvus/python/examples/README.md`
- **Coming Soon**（project_doc）： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`rust-bridge/examples/README.md`
- **Contributing to Korvus**（project_doc）：We're excited that you're interested in contributing to Korvus! This document provides some basic guidelines for contributors. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`CONTRIBUTING.md`

## 证据索引

- 共索引 43 条证据。

- **🦅 What is Korvus?**（documentation）：Korvus is a search SDK that unifies the entire RAG pipeline in a single database query. Built on top of Postgres with bindings for Python, JavaScript and Rust, Korvus delivers high-performance, customizable search capabilities with minimal infrastructure concerns. 证据：`README.md`
- **Open Source Alternative for Building End-to-End Vector Search Applications without OpenAI & Pinecone**（documentation）：Open Source Alternative for Building End-to-End Vector Search Applications without OpenAI & Pinecone 证据：`korvus/README.md`
- **A Tool for Automatically Translating to Py03 and Neon compatible Rust**（documentation）：A Tool for Automatically Translating to Py03 and Neon compatible Rust 证据：`rust-bridge/README.md`
- **Open Source Alternative for Building End-to-End Vector Search Applications without OpenAI & Pinecone**（documentation）：Open Source Alternative for Building End-to-End Vector Search Applications without OpenAI & Pinecone 证据：`korvus/javascript/README.md`
- **Examples**（documentation）：Prerequisites Before running any examples first install dependencies and set the DATABASE URL environment variable: 证据：`korvus/javascript/examples/README.md`
- **Webpack Demo**（documentation）：The JavaScript SDK utilizes native node modules as our SDK is written in Rust. To get it working with webpack, we need a loader that is designed to work with native node modules. In this case, we have opted to use the node-loader https://github.com/webpack-contrib/node-loader module. See webpack.config.js ./webpack.config.js for how we configured it. 证据：`korvus/javascript/examples/webpack/README.md`
- **Open Source Alternative for Building End-to-End Vector Search Applications without OpenAI & Pinecone**（documentation）：Open Source Alternative for Building End-to-End Vector Search Applications without OpenAI & Pinecone 证据：`korvus/python/README.md`
- **Examples**（documentation）：Prerequisites Before running any examples first install dependencies and set the DATABASE URL environment variable: 证据：`korvus/python/examples/README.md`
- **Coming Soon**（documentation）：Coming Soon 证据：`rust-bridge/examples/README.md`
- **Contributing to Korvus**（documentation）：We're excited that you're interested in contributing to Korvus! This document provides some basic guidelines for contributors. 证据：`CONTRIBUTING.md`
- **Package**（package_manifest）：{ "name": "korvus-cli", "version": "0.10.0", "description": "CLI for PostgresML, the GPU-powered AI application database.", "keywords": "postgres", "machine learning", "vector databases", "embeddings" , "bin": { "korvus": "index.js" }, "author": { "name": "PostgresML", "email": "team@postgresml.org", "url": "https://postgresml.org" }, "repository": { "type": "git", "url": "https://github.com/postgresml/postgresml" }, "license": "MIT", "dependencies": { "korvus": "0.10.0" } } 证据：`korvus/javascript-cli/package.json`
- **Package**（package_manifest）：{ "name": "getting-started", "version": "1.0.0", "description": "", "main": "index.js", "scripts": { "test": "echo \"Error: no test specified\" && exit 1" }, "author": "", "license": "ISC", "dependencies": { "dotenv": "^16.3.1", "korvus": "^1.0.0" } } 证据：`korvus/javascript/examples/package.json`
- **Package**（package_manifest）：{ "name": "webpack", "version": "1.0.0", "description": "", "main": "index.js", "scripts": { "test": "echo \"Error: no test specified\" && exit 1", "build": "webpack" }, "author": "", "license": "ISC", "devDependencies": { "node-loader": "^2.0.0", "webpack": "^5.88.2", "webpack-cli": "^5.1.4" }, "dependencies": { "dotenv": "^16.3.1", "korvus": "^1.0.0" } } 证据：`korvus/javascript/examples/webpack/package.json`
- **Package**（package_manifest）：{ "name": "korvus", "version": "1.1.5", "description": "Open Source Alternative for Building End-to-End Vector Search Applications without OpenAI & Pinecone", "keywords": "postgres", "machine learning", "vector databases", "embeddings" , "main": "index.js", "scripts": { "build": "node build.js", "build-release": "node build.js --release" }, "author": { "name": "PostgresML", "email": "team@postgresml.org", "url": "https://postgresml.org" }, "repository": { "type": "git", "url": "https://github.com/postgresml/korvus" }, "license": "MIT", "devDependencies": { "@types/node": "^20.3.1", "cargo-cp-artifact": "^0.1" }, "dependencies": { "dotenv": "^16.4.4" } } 证据：`korvus/javascript/package.json`
- **Package**（package_manifest）：{ "name": "korvus-tests", "version": "0.1.0", "description": "", "type": "module", "scripts": { "test": "NODE OPTIONS=--experimental-vm-modules jest" }, "devDependencies": { "@types/jest": "^29.5.3", "jest": "^29.6.1", "ts-jest": "^29.1.1", "typescript": "^5.1.6" } } 证据：`korvus/javascript/tests/package.json`
- **License**（source_file）：Permission is hereby granted, free of charge, to any person obtaining a copy of this software and associated documentation files the "Software" , to deal in the Software without restriction, including without limitation the rights to use, copy, modify, merge, publish, distribute, sublicense, and/or sell copies of the Software, and to permit persons to whom the Software is furnished to do so, subject to the following conditions: 证据：`LICENSE`
- **Builtins**（source_file）：use anyhow::Context; use sqlx::Row; use tracing::instrument; ⋮---- pub struct Builtins { ⋮---- impl Builtins { pub fn new database url: Option - Self { ⋮---- pub fn query &self, query: &str - QueryRunner { QueryRunner::new query, self.database url.clone ⋮---- pub async fn transform ⋮---- let pool = get or initialize pool &self.database url .await?; ⋮---- let query = if task.0.is string { query.bind task.0.as str ⋮---- query.bind task.0 ⋮---- let results = query.bind inputs .bind args .fetch all &pool .await?; let results = results.first .unwrap .get:: 0 ; Ok Json results ⋮---- pub async fn embed &self, model: &str, text: &str - anyhow::Result { ⋮---- let result = query.bind model .bind text… 证据：`korvus/src/builtins.rs`
- **cfg attr feature = "rust bridge", derive alias**（source_file）：use anyhow::Context; use indicatif::MultiProgress; use itertools::Itertools; use regex::Regex; use sea query::Alias; ⋮---- use sea query binder::SqlxBinder; ⋮---- use sqlx::PgConnection; ⋮---- use std::borrow::Cow; use std::collections::HashMap; use std::path::Path; use std::time::SystemTime; use std::time::UNIX EPOCH; use tokio::task::JoinSet; ⋮---- use walkdir::WalkDir; use crate::debug sqlx query; use crate::filter builder::FilterBuilder; use crate::pipeline::FieldAction; use crate::rag query builder::build rag query; use crate::search query builder::build search query; use crate::types::GeneralJsonAsyncIterator; use crate::vector search query builder::build vector search query; ⋮---- us… 证据：`korvus/src/collection.rs`
- **C**（source_file）：use futures::stream::Stream; use rust bridge::c::CustomInto; use std::pin::Pin; pub type JsonC = std::ffi::c char; ⋮---- unsafe fn custom into self - Json { let s = std::ffi::CStr::from ptr self .to str .unwrap ; serde json::from str:: s .unwrap .into ⋮---- unsafe fn custom into self - mut JsonC { let s = serde json::to string &self .unwrap ; std::ffi::CString::new s .unwrap .into raw ⋮---- pub struct GeneralJsonIteratorC { ⋮---- unsafe fn custom into self - mut GeneralJsonIteratorC { ⋮---- wrapped: Box::into raw Box::new self.0.peekable , ⋮---- pub unsafe extern "C" fn korvus generaljsoniteratorc done ⋮---- c.wrapped .peek .is none ⋮---- pub unsafe extern "C" fn korvus generaljsoniteratorc… 证据：`korvus/src/languages/c.rs`
- **Mod**（source_file）：pub mod javascript; ⋮---- pub mod python; ⋮---- pub mod c; 证据：`korvus/src/languages/mod.rs`
- **Python**（source_file）：use futures::StreamExt; use pyo3::conversion::IntoPy; ⋮---- use std::sync::Arc; ⋮---- fn into py self, py: Python - PyObject { ⋮---- serde json::Value::Bool x = x.into py py , ⋮---- if x.is f64 { x.as f64 .expect "Error converting to f64 in impl ToPyObject for Json" .into py py ⋮---- x.as i64 .expect "Error converting to i64 in impl ToPyObject for Json" ⋮---- serde json::Value::String x = x.into py py , ⋮---- for v in x.iter { list.append Json v.clone .into py py .unwrap ; ⋮---- list.into py py ⋮---- for k, v in x.iter { dict.set item k, Json v.clone .into py py .unwrap ; ⋮---- dict.into py py ⋮---- serde json::Value::Null = py.None , ⋮---- struct GeneralJsonAsyncIteratorPython { ⋮---- impl… 证据：`korvus/src/languages/python.rs`
- **Lib**（source_file）：use anyhow::Context; use once cell::sync::Lazy; use parking lot::RwLock; ⋮---- use std::env; ⋮---- use tracing::Level; use tracing subscriber::FmtSubscriber; mod builtins; ⋮---- mod cli; mod collection; mod filter builder; mod languages; pub mod migrations; mod model; mod models; mod open source ai; mod order by builder; mod pipeline; mod queries; mod query builder; mod query runner; mod rag query builder; mod remote embeddings; mod search query builder; mod single field pipeline; mod splitter; pub mod transformer pipeline; pub mod types; mod utils; mod vector search query builder; pub use builtins::Builtins; pub use collection::Collection; pub use model::Model; pub use open source ai::Open… 证据：`korvus/src/lib.rs`
- **Mod**（source_file）：use itertools::Itertools; use sqlx::PgPool; use tracing::instrument; use crate::get or initialize pool; type MigrateFn = ⋮---- pub fn migrate - BoxFuture { ⋮---- let pool = get or initialize pool &None .await?; ⋮---- .fetch all &pool ⋮---- dispatch migrations pool, collections .await?; Ok ⋮---- .boxed ⋮---- async fn dispatch migrations pool: PgPool, collections: Vec - anyhow::Result { ⋮---- let mut collections = collections.into iter .into group map ; for version, migration in version migrations.into iter { if let Some collection ids = collections.remove version { let new version = migration pool.clone , collection ids.clone .await?; if let Some new collection ids = collections.get mut &new… 证据：`korvus/src/migrations/mod.rs`
- **Model**（source_file）：use tracing::instrument; ⋮---- use crate::types::JsonPython; ⋮---- use crate::languages::c::JsonC; ⋮---- pub enum ModelRuntime { ⋮---- fn from s: &str - Self { ⋮---- = panic! "Unknown model runtime: {}", s , ⋮---- fn from m: &ModelRuntime - Self { ⋮---- pub crate struct ModelDatabaseData { ⋮---- pub struct Model { ⋮---- impl Default for Model { fn default - Self { ⋮---- impl Model { pub fn new name: Option , source: Option , parameters: Option - Self { let name = name.unwrap or "Alibaba-NLP/gte-base-en-v1.5".to string ; let parameters = parameters.unwrap or Json serde json::json! {} ; let source = source.unwrap or "pgml".to string ; let runtime: ModelRuntime = source.as str .into ; ⋮---- pu… 证据：`korvus/src/model.rs`
- **Models**（source_file）：use sea query::enum def; use serde::Serialize; use sqlx::types::Uuid; use sqlx::FromRow; ⋮---- pub struct Pipeline { ⋮---- pub struct Model { ⋮---- pub struct Splitter { ⋮---- pub struct Document { ⋮---- impl Document { pub fn into user friendly json self - Json { ⋮---- .into ⋮---- pub struct Collection { ⋮---- pub struct Embedding { ⋮---- pub struct Chunk { ⋮---- pub struct TSVector { 证据：`korvus/src/models.rs`
- **Pipeline**（source_file）：use anyhow::Context; use serde::Deserialize; use serde json::json; ⋮---- use std::collections::HashMap; use tracing::instrument; use crate::debug sqlx query; ⋮---- use crate::types::JsonPython; ⋮---- use crate::languages::c::JsonC; type ParsedSchema = HashMap ; ⋮---- struct ValidSplitterAction { ⋮---- struct ValidEmbedAction { ⋮---- pub struct FullTextSearchAction { ⋮---- struct ValidFieldAction { ⋮---- pub struct HNSW { ⋮---- impl Default for HNSW { fn default - Self { ⋮---- type Error = anyhow::Error; fn try from value: Json - anyhow::Result { let m = if !value "m" .is null { ⋮---- .try to u64 .context "hnsw.m must be an integer" ? ⋮---- let ef construction = if !value "ef construction" .… 证据：`korvus/src/pipeline.rs`
- **Single Field Pipeline**（source_file）：use crate::model::Model; use crate::splitter::Splitter; use crate::types::Json; use crate::Pipeline; ⋮---- fn build pipeline ⋮---- let parameters = parameters.unwrap or default ; ⋮---- .as bool .unwrap or default ⋮---- Some schema.into ⋮---- Pipeline::new name, schema .expect "Error converting pipeline into new multifield pipeline" ⋮---- pub fn SingleFieldPipeline ⋮---- let model = model.map m m.wrapped ; let splitter = splitter.map s s.wrapped ; let parameters = parameters.map p p.wrapped ; build pipeline name, model, splitter, parameters ⋮---- pub fn SingleFieldPipeline ⋮---- let name = cx.argument 0 ?; ⋮---- let model = cx.argument opt 1 ; ⋮---- let splitter = cx.argument opt 2 ; ⋮---- l… 证据：`korvus/src/single_field_pipeline.rs`
- **Transformer Pipeline**（source_file）：use anyhow::Context; use sqlx::Row; use tracing::instrument; ⋮---- pub struct TransformerPipeline { ⋮---- impl TransformerPipeline { pub fn new task: &str, model: &str, args: Option , database url: Option - Self { let mut args = args.unwrap or default ; let a = args.as object mut .expect "args must be an object" ; a.insert "task".to string , task.to string .into ; a.insert "model".to string , model.into ; ⋮---- if let Some v = a.remove field { let x: u64 = CustomU64Convertor v .into ; a.insert field.to string , x.into ; ⋮---- pub async fn transform &self, inputs: Vec , args: Option - anyhow::Result { let pool = get or initialize pool &self.database url .await?; ⋮---- let a = args.as object… 证据：`korvus/src/transformer_pipeline.rs`
- **cfg attr feature = "rust bridge", derive alias manual**（source_file）：use anyhow::Context; ⋮---- use itertools::Itertools; use sea query::Iden; ⋮---- use rust bridge::alias manual; ⋮---- pub struct CustomU64Convertor pub Value ; ⋮---- fn from value: u64 - Self { Self json! value ⋮---- fn from value: CustomU64Convertor - Self { if value.0.is f64 { value.0.as f64 .unwrap as u64 } else if value.0.is i64 { value.0.as i64 .unwrap as u64 } else if value.0.is u64 { value.0.as u64 .unwrap ⋮---- panic! "Cannot convert value into u64" ⋮---- pub struct Json pub serde json::Value ; impl Default for Json { fn default - Self { Self serde json::json! {} ⋮---- fn from v: serde json::Value - Self { Self v ⋮---- impl Deref for Json { type Target = serde json::Value; fn deref &… 证据：`korvus/src/types.rs`
- **C**（source_file）：use proc macro2::Ident; ⋮---- use std::str::FromStr; ⋮---- pub fn generate c alias parsed: DeriveInput - proc macro::TokenStream { let name ident = format ident! "{}C", parsed.ident ; ⋮---- let expanded = quote! { ⋮---- pub fn generate c methods ⋮---- Type::Path p = p.path.segments.first .unwrap .ident.clone , = panic! "Error getting struct ident for impl block" , ⋮---- let name ident = format ident! "{}C", wrapped type ident ; ⋮---- let method name = f.sig.ident.to string ; if !attribute args.should alias method &method name, SupportedLanguage::C { ⋮---- method.visit impl item &item ; ⋮---- let method ident = method.method ident.clone ; ⋮---- get method arguments &wrapped type ident, &name… 证据：`rust-bridge/rust-bridge-macros/src/c.rs`
- **Common**（source_file）：pub enum SupportedLanguage { ⋮---- fn from value: &str - Self { ⋮---- = panic! "Cannot convert {value} to SupportedLanguage" , ⋮---- pub struct AttributeArgs { ⋮---- struct Item { ⋮---- enum AdditionalAttribute { ⋮---- fn from value: &ExprAssign - Self { ⋮---- Expr::Path p = p.into token stream .to string , = panic! ⋮---- match a ty.as str { ⋮---- Lit::Str l = l.value .as str .into , ⋮---- panic! ⋮---- = panic! "Currently only skip additional attributes are supported" , ⋮---- impl Parse for Item { fn parse input: syn::parse::ParseStream - syn::Result { let method: Ident = input.parse ?; let lookahead = input.lookahead1 ; if !lookahead.peek token::Paren { Ok Self { method: method.to string ,… 证据：`rust-bridge/rust-bridge-macros/src/common.rs`
- **Lib**（source_file）：mod c; mod common; mod javascript; mod python; mod types; ⋮---- pub fn alias input: proc macro::TokenStream - proc macro::TokenStream { ⋮---- let parsed = parse macro input! input as DeriveInput ; let python tokens = python::generate python alias parsed.clone ; let c tokens = c::generate c alias parsed.clone ; ⋮---- output.extend python tokens ; output.extend c tokens ; output.extend javascript tokens ; ⋮---- pub fn alias methods ⋮---- let mut output = input.clone ; let parsed: ItemImpl = syn::parse input .unwrap ; let python tokens = python::generate python methods parsed.clone , &attribute args ; let c tokens = c::generate c methods parsed.clone , &attribute args ; ⋮---- pub fn alias manu… 证据：`rust-bridge/rust-bridge-macros/src/lib.rs`
- **Python**（source_file）：use std::fs::OpenOptions; ⋮---- pub fn generate alias manual parsed: DeriveInput - proc macro::TokenStream { let name ident = format ident! "{}Python", parsed.ident ; ⋮---- let expanded = quote! { ⋮---- // From Rust to Python ⋮---- pub fn generate python alias parsed: DeriveInput - proc macro::TokenStream { ⋮---- let wrapped type name = wrapped type ident.to string ; // May also want to put a print method here if that works automatically for every CustomDerive struct ⋮---- // This is how we get around the liftime checker ⋮---- pub fn generate python methods ⋮---- Type::Path p = p.path.segments.first .unwrap .ident.clone , = panic! "Error getting struct ident for impl block" , ⋮---- let name… 证据：`rust-bridge/rust-bridge-macros/src/python.rs`
- **Types**（source_file）：use quote::ToTokens; use std::boxed::Box; use std::string::ToString; ⋮---- pub struct ReferenceType { ⋮---- impl ReferenceType { pub fn new ty: SupportedType, mutable: bool - Self { ⋮---- pub enum SupportedType { ⋮---- fn fmt &self, f: &mut std::fmt::Formatter - std::fmt::Result { write! f, "{}", self.to language string &None ⋮---- impl SupportedType { pub fn to type &self, language: Option - syn::Result { syn::parse str &self.to language string &language ⋮---- pub fn to language string &self, language: &Option - String { ⋮---- format! "&mut {}", t.ty.to language string language ⋮---- format! "&{}", t.ty.to language string language ⋮---- SupportedType::str = "str".to string , SupportedType:… 证据：`rust-bridge/rust-bridge-macros/src/types.rs`
- **C**（source_file）：pub unsafe trait CustomInto { ⋮---- pub unsafe trait CustomIntoVec { ⋮---- unsafe fn custom into vec self, size: usize - Vec { let mut result = vec! ; ⋮---- let res = s.custom into ; result.push res ⋮---- unsafe fn custom into self - &'a str { std::ffi::CStr::from ptr self .to str .unwrap ⋮---- unsafe fn custom into self - String { std::ffi::CStr::from ptr self .to str .unwrap .to string ⋮---- unsafe fn custom into self - mut std::ffi::c char { std::ffi::CString::new self .unwrap .into raw ⋮---- unsafe fn custom into self - i32 { ⋮---- unsafe fn custom into self - f64 { ⋮---- unsafe fn custom into self - Option { if self.is null { ⋮---- Some self.custom into ⋮---- unsafe fn custom into self… 证据：`rust-bridge/rust-bridge-traits/src/c.rs`
- **Mod**（source_file）：pub trait IntoJsResult { ⋮---- macro rules! gen into { ⋮---- impl IntoJsResult for { type Output = JsUndefined; fn into js result ⋮---- Ok JsUndefined::new cx ⋮---- gen into! String, JsString ; gen into! bool, JsBoolean ; gen into! i8, JsNumber ; gen into! i16, JsNumber ; gen into! i32, JsNumber ; gen into! u8, JsNumber ; gen into! u16, JsNumber ; gen into! u32, JsNumber ; gen into! f32, JsNumber ; gen into! f64, JsNumber ; gen into! T1 ; 0 , 1 ; gen into! T1, T2 ; 0, 1 , 2 ; gen into! T1, T2, T3 ; 0, 1, 2 , 3 ; gen into! T1, T2, T3, T4 ; 0, 1, 2, 3 , 4 ; gen into! T1, T2, T3, T4, T5 ; 0, 1, 2, 3, 4 , 5 ; gen into! T1, T2, T3, T4, T5, T6 ; 0, 1, 2, 3, 4, 5 , 6 ; impl IntoJsResult for i64 {… 证据：`rust-bridge/rust-bridge-traits/src/javascript/mod.rs`
- **Lib**（source_file）：pub mod c; pub mod javascript; pub mod python; 证据：`rust-bridge/rust-bridge-traits/src/lib.rs`
- **Mod**（source_file）：use std::collections::HashMap; pub trait CustomInto { ⋮---- macro rules! gen custom into { ⋮---- fn custom into self - Option { self.map s s.custom into ⋮---- fn custom into self - Vec { self.into iter .map x x.custom into .collect ⋮---- fn custom into self - HashMap { self.into iter .map k, v k.custom into , v.custom into .collect ⋮---- fn custom into self - &'static str { ⋮---- gen custom into! T1 , TT2 , 0 ; gen custom into! T1, T2 , TT1, TT2 , 0, 1 ; gen custom into! T1, T2, T3 , TT1, TT2, TT3 , 0, 1, 2 ; gen custom into! T1, T2, T3, T4 , TT1, TT2, TT3, TT4 , 0, 1, 2, 3 ; gen custom into! ⋮---- gen custom into! String ; gen custom into! ; gen custom into! bool ; gen custom into! i8 ; ge… 证据：`rust-bridge/rust-bridge-traits/src/python/mod.rs`
- **Byte-compiled / optimized / DLL files**（source_file）：Byte-compiled / optimized / DLL files pycache / .py cod $py.class 证据：`korvus/.gitignore`
- **See more keys and their definitions at https://doc.rust-lang.org/cargo/reference/manifest.html**（source_file）：package name = "korvus" version = "1.1.5" edition = "2021" authors = "PosgresML " homepage = "https://postgresml.org/" repository = "https://github.com/postgresml/korvus" license = "MIT" description = "The official Korvus Rust SDK" keywords = "postgres", "embeddings" 证据：`korvus/Cargo.toml`
- **Build**（source_file）：use std::fs::remove file; use std::fs::OpenOptions; use std::io::Write; ⋮---- fn main { ⋮---- remove file &path .ok ; ⋮---- .create true .append true .open path .unwrap ; file.write all ADDITIONAL DEFAULTS FOR PYTHON .unwrap ; ⋮---- file.write all ADDITIONAL DEFAULTS FOR JAVASCRIPT .unwrap ; 证据：`korvus/build.rs`
- **Pyproject**（source_file）：build-system requires = "maturin =1.0,<2.0", "patchelf" build-backend = "maturin" 证据：`korvus/pyproject.toml`
- **Cargo**（source_file）：workspace members = "rust-bridge", "rust-bridge-traits", "rust-bridge-macros" exclude = "examples" 证据：`rust-bridge/Cargo.toml`

## 宿主 AI 必须遵守的规则

- **把本资产当作开工前上下文，而不是运行环境。**：AI Context Pack 只包含证据化项目理解，不包含目标项目的可执行状态。 证据：`README.md`, `korvus/README.md`, `rust-bridge/README.md`
- **回答用户时区分可预览内容与必须安装后才能验证的内容。**：安装前体验的消费者价值来自降低误装和误判，而不是伪装成真实运行。 证据：`README.md`, `korvus/README.md`, `rust-bridge/README.md`

## 用户开工前应该回答的问题

- 你准备在哪个宿主 AI 或本地环境中使用它？
- 你只是想先体验工作流，还是准备真实安装？
- 你最在意的是安装成本、输出质量、还是和现有规则的冲突？

## 验收标准

- 所有能力声明都能回指到 evidence_refs 中的文件路径。
- AI_CONTEXT_PACK.md 没有把预览包装成真实运行。
- 用户能在 3 分钟内看懂适合谁、能做什么、如何开始和风险边界。

---

## Doramagic Context Augmentation

下面内容用于强化 Repomix/AI Context Pack 主体。Human Manual 只提供阅读骨架；踩坑日志会被转成宿主 AI 必须遵守的工作约束。

## Human Manual 骨架

使用规则：这里只是项目阅读路线和显著性信号，不是事实权威。具体事实仍必须回到 repo evidence / Claim Graph。

宿主 AI 硬性规则：
- 不得把页标题、章节顺序、摘要或 importance 当作项目事实证据。
- 解释 Human Manual 骨架时，必须明确说它只是阅读路线/显著性信号。
- 能力、安装、兼容性、运行状态和风险判断必须引用 repo evidence、source path 或 Claim Graph。

- **Korvus 概览与快速入门**：importance `high`
  - source_paths: README.md, CONTRIBUTING.md, korvus/python/examples/README.md, korvus/javascript/examples/README.md, korvus/src/lib.rs
- **多语言 SDK 绑定与 API 参考**：importance `high`
  - source_paths: korvus/python/korvus/__init__.py, korvus/python/korvus/__main__.py, korvus/python/examples/rag_question_answering.py, korvus/python/examples/semantic_search.py, korvus/javascript/index.js
- **核心管道架构与数据流**：importance `high`
  - source_paths: korvus/src/lib.rs, korvus/src/collection.rs, korvus/src/pipeline.rs, korvus/src/transformer_pipeline.rs, korvus/src/model.rs
- **部署、CLI、扩展与故障排查**：importance `medium`
  - source_paths: korvus/src/cli.rs, korvus/Cargo.toml, korvus/pyproject.toml, korvus/build.rs, korvus/c/cbindgen.toml

## Repo Inspection Evidence / 源码检查证据

- repo_clone_verified: true
- repo_inspection_verified: true
- repo_commit: `7c06035700cf00db2a9f72ac4086f5f258b3b78d`
- inspected_files: `README.md`

宿主 AI 硬性规则：
- 没有 repo_clone_verified=true 时，不得声称已经读过源码。
- 没有 repo_inspection_verified=true 时，不得把 README/docs/package 文件判断写成事实。
- 没有 quick_start_verified=true 时，不得声称 Quick Start 已跑通。

## Doramagic Pitfall Constraints / 踩坑约束

这些规则来自 Doramagic 发现、验证或编译过程中的项目专属坑点。宿主 AI 必须把它们当作工作约束，而不是普通说明文字。

### Constraint 1: 来源证据：Add PHP

- Trigger: GitHub 社区证据显示该项目存在一个安装相关的待验证问题：Add PHP
- Why it matters: 可能增加新用户试用和生产接入成本。
- Evidence: community_evidence:github | https://github.com/postgresml/korvus/issues/9 | 来源类型 github_issue 暴露的待验证使用条件。
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 2: 来源证据：Add documentation

- Trigger: GitHub 社区证据显示该项目存在一个安全/权限相关的待验证问题：Add documentation
- Why it matters: 可能影响授权、密钥配置或安全边界。
- Evidence: community_evidence:github | https://github.com/postgresml/korvus/issues/13 | 来源类型 github_issue 暴露的待验证使用条件。
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 3: 来源证据：6 rows with limit 6 and 0 rows with limit 5

- Trigger: GitHub 社区证据显示该项目存在一个安装相关的待验证问题：6 rows with limit 6 and 0 rows with limit 5
- Why it matters: 可能增加新用户试用和生产接入成本。
- Evidence: community_evidence:github | https://github.com/postgresml/korvus/issues/22 | 来源类型 github_issue 暴露的待验证使用条件。
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 4: 来源证据：Add TypeScript

- Trigger: GitHub 社区证据显示该项目存在一个安装相关的待验证问题：Add TypeScript
- Host AI rule: 来源显示可能已有修复、规避或版本变化，说明书中必须标注适用版本。
- Why it matters: 可能增加新用户试用和生产接入成本。
- Evidence: community_evidence:github | https://github.com/postgresml/korvus/issues/17 | 来源讨论提到 npm 相关条件，需在安装/试用前复核。
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 5: 来源证据：Exception: error returned from database: invalid input value for enum task: "embedding"

- Trigger: GitHub 社区证据显示该项目存在一个安装相关的待验证问题：Exception: error returned from database: invalid input value for enum task: "embedding"
- Host AI rule: 来源显示可能已有修复、规避或版本变化，说明书中必须标注适用版本。
- Why it matters: 可能影响升级、迁移或版本选择。
- Evidence: community_evidence:github | https://github.com/postgresml/korvus/issues/10 | 来源讨论提到 python 相关条件，需在安装/试用前复核。
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 6: 来源证据：Hi! My Korvus Cloud pipeline is stuck with a worker error (os error 11) even after creating a new server. Database: pgm…

- Trigger: GitHub 社区证据显示该项目存在一个安装相关的待验证问题：Hi! My Korvus Cloud pipeline is stuck with a worker error (os error 11) even after creating a new server. Database: pgml_xb9wszjbked8ued — could someone restar…
- Why it matters: 可能增加新用户试用和生产接入成本。
- Evidence: community_evidence:github | https://github.com/postgresml/korvus/issues/23 | 来源类型 github_issue 暴露的待验证使用条件。
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 7: 来源证据：High gpu consumption

- Trigger: GitHub 社区证据显示该项目存在一个安装相关的待验证问题：High gpu consumption
- Host AI rule: 来源显示可能已有修复、规避或版本变化，说明书中必须标注适用版本。
- Why it matters: 可能增加新用户试用和生产接入成本。
- Evidence: community_evidence:github | https://github.com/postgresml/korvus/issues/18 | 来源讨论提到 python 相关条件，需在安装/试用前复核。
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 8: 能力判断依赖假设

- Trigger: README/documentation is current enough for a first validation pass.
- Host AI rule: 将假设转成下游验证清单。
- Why it matters: 假设不成立时，用户拿不到承诺的能力。
- Evidence: capability.assumptions | https://github.com/postgresml/korvus | README/documentation is current enough for a first validation pass.
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 9: 运行可能依赖外部服务

- Trigger: 项目说明出现 external service/cloud/webhook/database 等运行依赖关键词。
- Host AI rule: 确认是否有离线 demo、mock 数据或可替代服务。
- Why it matters: 本地安装成功不等于能力可用，外部服务不可用会阻断体验。
- Evidence: packet_text.keyword_scan | https://github.com/postgresml/korvus | matched external service / cloud / webhook / database keyword
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 10: 维护活跃度未知

- Trigger: 未记录 last_activity_observed。
- Host AI rule: 补 GitHub 最近 commit、release、issue/PR 响应信号。
- Why it matters: 新项目、停更项目和活跃项目会被混在一起，推荐信任度下降。
- Evidence: evidence.maintainer_signals | https://github.com/postgresml/korvus | last_activity_observed missing
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。
