# olmocr 能力包

标准 URL：https://doramagic.ai/zh/projects/olmocr/

源仓库：https://github.com/allenai/olmocr

## 它是什么

用于将 PDF 线性化处理以构建 LLM 数据集和训练语料的工具包。

## 能力边界

技能包、使用配方、宿主说明、评估规则、预检清单

## 第一步安全验证

继续完成沙箱验证和证据复核

## 主要风险

可能增加新用户试用和生产接入成本。

## 证据来源

https://github.com/allenai/olmocr、https://github.com/allenai/olmocr#readme、项目说明书、踩坑日志
