向量检索与 RAG · 开源项目

pgai

向量检索项目，用于验证 embedding 存储、查询语义、RAG 接入、数据边界和回滚路径。

向量数据库RAGEmbedding语义检索数据边界

最适合谁需要把知识库、文档或应用数据接入语义检索/RAG 流程的开发者。

判断自己是不是目标用户。

能做什么向量库接入检查、embedding 维度/模型边界、集合管理、查询验收和数据删除清单

查看可带走的能力路径。

继续前先用小样本公开文本验证建库、查询、删除和回滚，再接入真实数据。

未完成验证前保持审慎。

GitHub 快照5.8k 星标

312 分叉 · 35 贡献者

Doramagic.ai 最后验证日期：2026-06-23 验证方法：来源证据、语义档案、公开页面门禁和静态构建验收。

官方quick start 阅读项目说明书源仓库

快速判断 · 2026-06-23

pgai 项目是什么？

pgai 是向量数据库、检索或 RAG 存储组件，用于把文本、嵌入和相似度检索接入 AI 应用。
最适合：需要把知识库、文档或应用数据接入语义检索/RAG 流程的开发者。
不适合：不适合只需要一次模型 API 调用，或不能隔离索引数据、凭据和持久化目录的用户。
它给 AI 增加的能力：向量库接入检查、embedding 维度/模型边界、集合管理、查询验收和数据删除清单
第一步安全验证：先用小样本公开文本验证建库、查询、删除和回滚，再接入真实数据。
当前验证状态：源码、Quick Start 和沙箱安装检查均记录为已通过。
最大风险：可能增加新用户试用和生产接入成本。
证据基础：https://github.com/timescale/pgai、https://github.com/timescale/pgai#readme、项目说明书、踩坑日志

一眼判断

先判断自己是否是目标用户，再决定是否继续。

最适合谁需要把知识库、文档或应用数据接入语义检索/RAG 流程的开发者。

判断自己是不是目标用户。

核心能力向量库接入检查、embedding 维度/模型边界、集合管理、查询验收和数据删除清单

不适合只需要一次模型 API 调用，或不能隔离索引数据、凭据和持久化目录的用户。

第一步验证先用小样本公开文本验证建库、查询、删除和回滚，再接入真实数据。

未完成验证前保持审慎。

它能做什么

把项目翻译成用户能判断的具体能力，而不是 Doramagic 的使用流程。

知识检索

一套工具集，方便开发者基于 PostgreSQL 更轻松地构建 RAG、语义搜索及其他 AI 应用。

ability-1

知识库问答

帮助用户判断这个项目适合什么工作，而不是只看技术名词。

ability-2

检索增强

说明输入、输出、失败模式和继续前需要复核的边界。

ability-3

可验证工作流

沉淀为 Prompt、说明书、上下文包或预检清单等可带走资产。

ability-4

来源：https://github.com/timescale/pgai、https://github.com/timescale/pgai#readme、项目说明书、踩坑日志。这里只回答“它能帮我做什么”。

项目温度与外部声音

站点快照，非实时质量证明；用于开工前背景判断。

星标5.8k

分叉312

贡献者35

许可证未知

状态可发布

社区讨论

已收录 12 条来源

下面是已采集到的项目级社区讨论来源，来源平台：github。这些外部声音用于帮助判断真实使用反馈，不单独作为质量证明。

01
[Bug]: semantic catalog text to sql stuck in refinement iterations
github / github_issue
02
[Feature]: Use ReRank models (i.e. qwen-reranker) through Ollama
github / github_issue
03
cannot import name 'Worker' from 'pgai'
github / github_issue
04
[Bug]: ollama_embed error on ollama higher 13.3
github / github_issue
05
[Feature]: RaBitQ
github / github_issue
06
HTTP client connection leak in embedders causes file descriptor exhausti
github / github_issue
07
Outdated dependency versions are blocking adoption
github / github_issue
08
[Feature]: OCR for PDF and DOCX
github / github_issue
09
[Feature]: llama.cpp embedding worker integration
github / github_issue
10
extension-0.11.2
github / github_release
11
pgai: v0.12.1
github / github_release
12
pgai: v0.12.0
github / github_release

怎么开始使用

先试、再读项目说明书、再带给 AI，最后按官方quick start验证。

先试 Prompt

不安装项目，先体验能力节奏。

预览

读项目说明书

理解输入、输出、失败模式和边界。

说明书

带给 AI

把上下文交给你的宿主 AI 继续工作。

上下文

沙箱验证

进入主力环境前先完成安装入口与风险边界验证。

验证

Python / pip · 官方安装入口pip install pgai

来源：https://github.com/timescale/pgai#readme。验证：已通过。

项目说明书

每个项目结构不同，Doramagic 保留原项目解释结构，并补充边界与踩坑日志。

草稿 · 项目说明书

pgai 说明书

一套工具集，方便开发者基于 PostgreSQL 更轻松地构建 RAG、语义搜索及其他 AI 应用。

打开完整说明书

https://github.com/timescale/pgai 项目说明书
目录
说明书章节
相关页面
1. 项目概述
2. 核心架构
3. 矢量器流水线

带给 AI 的上下文包

决定继续后，把项目上下文带给你的宿主 AI。

标准项目包 + 用户可带走资产

这不是营销摘要。它是用户决定继续后，可交给 Claude Code、Codex、Gemini、Cursor 等宿主 AI 的开工前上下文。

下载完整包阅读项目说明书

完整包完整项目包资产带给 AI 的上下文包资产边界与风险卡资产项目说明书资产踩坑日志资产安装前试用 Prompt资产官方quick start证据文件REPO_INSPECTION.json

继续前检查

在复制命令、导入 AI、安装插件前，看清还不能相信什么。

检查 1

不要把试用当真实运行

试用 Prompt 只展示流程，不证明项目已安装或运行。

检查 2

确认宿主兼容

本地 CLI

检查 3

先隔离验证

继续完成沙箱验证和证据复核

先用小样本公开文本验证建库、查询、删除和回滚，再接入真实数据。

踩坑日志与复核重点

Doramagic 记录的高风险项优先显示，避免用户把候选能力当成已验证能力。

high · 安装坑

来源证据：[Bug]: semantic catalog text to sql stuck in refinement iterations

GitHub 社区证据显示该项目存在一个安装相关的待验证问题：[Bug]: semantic catalog text to sql stuck in refinement iterations

可能增加新用户试用和生产接入成本。

high · 安全/权限坑

来源证据：Outdated dependency versions are blocking adoption

GitHub 社区证据显示该项目存在一个安全/权限相关的待验证问题：Outdated dependency versions are blocking adoption

可能影响授权、密钥配置或安全边界。

medium · 安装坑

来源证据：[Bug]: ollama_embed error on ollama higher 13.3

GitHub 社区证据显示该项目存在一个安装相关的待验证问题：[Bug]: ollama_embed error on ollama higher 13.3

可能增加新用户试用和生产接入成本。

medium · 安装坑

来源证据：cannot import name 'Worker' from 'pgai'

GitHub 社区证据显示该项目存在一个安装相关的待验证问题：cannot import name 'Worker' from 'pgai'

可能增加新用户试用和生产接入成本。

medium · 能力坑

来源证据：[Feature]: Use ReRank models (i.e. qwen-reranker) through Ollama

GitHub 社区证据显示该项目存在一个能力理解相关的待验证问题：[Feature]: Use ReRank models (i.e. qwen-reranker) through Ollama

可能增加新用户试用和生产接入成本。

medium · 能力坑

能力判断依赖假设

README / 文档足够支持第一次验证，但仍需继续核对。

假设不成立时，用户拿不到承诺的能力。

medium · 运行坑

来源证据：HTTP client connection leak in embedders causes file descriptor exhaustion

GitHub 社区证据显示该项目存在一个运行相关的待验证问题：HTTP client connection leak in embedders causes file descriptor exhaustion

可能增加新用户试用和生产接入成本。

medium · 维护坑

维护活跃度未知

未记录 last_activity_observed。

新项目、停更项目和活跃项目会被混在一起，推荐信任度下降。

medium · 安全/权限坑

存在评分风险

缺少可复核演示

风险会影响是否适合普通用户安装。

medium · 安全/权限坑

来源证据：[Feature]: llama.cpp embedding worker integration

GitHub 社区证据显示该项目存在一个安全/权限相关的待验证问题：[Feature]: llama.cpp embedding worker integration

可能影响授权、密钥配置或安全边界。

low · 维护坑

issue/PR 响应质量未知

Issue / PR 响应质量未知。

用户无法判断遇到问题后是否有人维护。

low · 维护坑

发布节奏不明确

发布活跃度未知。

安装命令和文档可能落后于代码，用户踩坑概率升高。

下一步：先用小样本公开文本验证建库、查询、删除和回滚，再接入真实数据。。

pgai

pgai 项目 是什么？

一眼判断

它能做什么

知识检索

知识库问答

检索增强

可验证工作流

项目温度与外部声音

社区讨论

怎么开始使用

先试 Prompt

读项目说明书

带给 AI

沙箱验证

项目说明书

pgai 说明书

带给 AI 的上下文包

标准项目包 + 用户可带走资产

继续前检查

不要把试用当真实运行

确认宿主兼容

先隔离验证

踩坑日志与复核重点

来源证据：[Bug]: semantic catalog text to sql stuck in refinement iterations

来源证据：Outdated dependency versions are blocking adoption

来源证据：[Bug]: ollama_embed error on ollama higher 13.3

来源证据：cannot import name 'Worker' from 'pgai'

来源证据：[Feature]: Use ReRank models (i.e. qwen-reranker) through Ollama

能力判断依赖假设

来源证据：HTTP client connection leak in embedders causes file descriptor exhaustion

维护活跃度未知

存在评分风险

来源证据：[Feature]: llama.cpp embedding worker integration

issue/PR 响应质量未知

发布节奏不明确

pgai 项目是什么？