# crawlee 能力包

标准 URL：https://doramagic.ai/zh/projects/crawlee/

源仓库：https://github.com/apify/crawlee

## 它是什么

Crawlee—一款用于 Node.js 的网页抓取与浏览器自动化库，可构建可靠的爬虫，基于 JavaScript 和 TypeScript。可提取数据用于 AI、LLM、RAG 或 GPTs，支持从网站下载 HTML、PDF、JPG、PNG 等文件，兼容 Puppeteer、Playwright、Cheerio、JSDOM 及原生 HTTP，提供有头与无头模式，并支持代理轮换。

## 能力边界

技能包、使用配方、宿主说明、评估规则、预检清单

## 第一步安全验证

继续完成沙箱验证和证据复核

## 主要风险

可能增加新用户试用和生产接入成本。

## 证据来源

https://github.com/apify/crawlee、https://github.com/apify/crawlee#readme、项目说明书、踩坑日志
