# Pitfall Log / 踩坑日志

项目：D-Star-AI/dsRAG

摘要：发现 13 个潜在踩坑项，其中 2 个为 high/blocking；最高优先级：安装坑 - 来源证据：About Performance of Semantic Chunk。

## 1. 安装坑 · 来源证据：About Performance of Semantic Chunk

- 严重度：high
- 证据强度：source_linked
- 发现：GitHub 社区证据显示该项目存在一个安装相关的待验证问题：About Performance of Semantic Chunk
- 对用户的影响：可能增加新用户试用和生产接入成本。
- 证据：community_evidence:github | https://github.com/D-Star-AI/dsRAG/issues/113 | 来源类型 github_issue 暴露的待验证使用条件。

## 2. 配置坑 · 来源证据：raise JSONDecodeError("Extra data", s, end) json.decoder.JSONDecodeError: Extra data: line 1 column 5 (char 4)

- 严重度：high
- 证据强度：source_linked
- 发现：GitHub 社区证据显示该项目存在一个配置相关的待验证问题：raise JSONDecodeError("Extra data", s, end) json.decoder.JSONDecodeError: Extra data: line 1 column 5 (char 4)
- 对用户的影响：可能增加新用户试用和生产接入成本。
- 证据：community_evidence:github | https://github.com/D-Star-AI/dsRAG/issues/117 | 来源讨论提到 python 相关条件，需在安装/试用前复核。

## 3. 安装坑 · 来源证据：Import "dsrag.document_parsing" from the README example couldn't be resolved

- 严重度：medium
- 证据强度：source_linked
- 发现：GitHub 社区证据显示该项目存在一个安装相关的待验证问题：Import "dsrag.document_parsing" from the README example couldn't be resolved
- 对用户的影响：可能增加新用户试用和生产接入成本。
- 证据：community_evidence:github | https://github.com/D-Star-AI/dsRAG/issues/73 | 来源讨论提到 python 相关条件，需在安装/试用前复核。

## 4. 安装坑 · 来源证据：llm.py directly imports google.generativeai instead of using LazyLoader

- 严重度：medium
- 证据强度：source_linked
- 发现：GitHub 社区证据显示该项目存在一个安装相关的待验证问题：llm.py directly imports google.generativeai instead of using LazyLoader
- 对用户的影响：可能增加新用户试用和生产接入成本。
- 证据：community_evidence:github | https://github.com/D-Star-AI/dsRAG/issues/127 | 来源讨论提到 python 相关条件，需在安装/试用前复核。

## 5. 配置坑 · 来源证据：sqlite3.OperationalError: no such column: model_response_status

- 严重度：medium
- 证据强度：source_linked
- 发现：GitHub 社区证据显示该项目存在一个配置相关的待验证问题：sqlite3.OperationalError: no such column: model_response_status
- 对用户的影响：可能增加新用户试用和生产接入成本。
- 证据：community_evidence:github | https://github.com/D-Star-AI/dsRAG/issues/116 | 来源类型 github_issue 暴露的待验证使用条件。

## 6. 能力坑 · 能力判断依赖假设

- 严重度：medium
- 证据强度：source_linked
- 发现：README/documentation is current enough for a first validation pass.
- 对用户的影响：假设不成立时，用户拿不到承诺的能力。
- 证据：capability.assumptions | https://github.com/D-Star-AI/dsRAG | README/documentation is current enough for a first validation pass.

## 7. 运行坑 · 来源证据：A bug at custom_term_mapping?

- 严重度：medium
- 证据强度：source_linked
- 发现：GitHub 社区证据显示该项目存在一个运行相关的待验证问题：A bug at custom_term_mapping?
- 对用户的影响：可能增加新用户试用和生产接入成本。
- 证据：community_evidence:github | https://github.com/D-Star-AI/dsRAG/issues/124 | 来源讨论提到 python 相关条件，需在安装/试用前复核。

## 8. 维护坑 · 维护活跃度未知

- 严重度：medium
- 证据强度：source_linked
- 发现：未记录 last_activity_observed。
- 对用户的影响：新项目、停更项目和活跃项目会被混在一起，推荐信任度下降。
- 证据：evidence.maintainer_signals | https://github.com/D-Star-AI/dsRAG | last_activity_observed missing

- 严重度：medium
- 证据强度：source_linked
- 发现：no_demo
- 证据：downstream_validation.risk_items | https://github.com/D-Star-AI/dsRAG | no_demo; severity=medium

## 10. 安全/权限坑 · 存在评分风险

- 严重度：medium
- 证据强度：source_linked
- 发现：no_demo
- 对用户的影响：风险会影响是否适合普通用户安装。
- 证据：risks.scoring_risks | https://github.com/D-Star-AI/dsRAG | no_demo; severity=medium

## 11. 安全/权限坑 · 来源证据：WeaviateVectorDB fails to connect with Weaviate v4 client - missing grpc_port parameter

- 严重度：medium
- 证据强度：source_linked
- 发现：GitHub 社区证据显示该项目存在一个安全/权限相关的待验证问题：WeaviateVectorDB fails to connect with Weaviate v4 client - missing grpc_port parameter
- 对用户的影响：可能影响授权、密钥配置或安全边界。
- 证据：community_evidence:github | https://github.com/D-Star-AI/dsRAG/issues/118 | 来源讨论提到 python 相关条件，需在安装/试用前复核。

## 12. 维护坑 · issue/PR 响应质量未知

- 严重度：low
- 证据强度：source_linked
- 发现：issue_or_pr_quality=unknown。
- 对用户的影响：用户无法判断遇到问题后是否有人维护。
- 证据：evidence.maintainer_signals | https://github.com/D-Star-AI/dsRAG | issue_or_pr_quality=unknown

## 13. 维护坑 · 发布节奏不明确

- 严重度：low
- 证据强度：source_linked
- 发现：release_recency=unknown。
- 对用户的影响：安装命令和文档可能落后于代码，用户踩坑概率升高。
- 证据：evidence.maintainer_signals | https://github.com/D-Star-AI/dsRAG | release_recency=unknown
