可发布
24k 星标
crawlee 项目
Crawlee—一款用于 Node.js 的网页抓取与浏览器自动化库,可构建可靠的爬虫,基于 JavaScript 和 TypeScript。可提取数据用于 AI、LLM、RAG 或 GPTs,支持从网站下载 HTML、PDF、JPG、PNG 等文件,兼容 Puppeteer、Playwright、Cheerio、JSDOM 及原生 HTTP,提供有头与无头模式,并支持代理轮换。
标签结果
当前标签:浏览器 Agent · 10 个已发布项目。标签页只展示通过发布门禁的生产数据。
Crawlee—一款用于 Node.js 的网页抓取与浏览器自动化库,可构建可靠的爬虫,基于 JavaScript 和 TypeScript。可提取数据用于 AI、LLM、RAG 或 GPTs,支持从网站下载 HTML、PDF、JPG、PNG 等文件,兼容 Puppeteer、Playwright、Cheerio、JSDOM 及原生 HTTP,提供有头与无头模式,并支持代理轮换。
SeleniumBase 是一个用于 UI 测试、网页爬取和隐身操作的框架,通过 CDP 模式可绕过所有机器人检测,并扩展了 Playwright 的能力。
MCP 工具接入项目,用于把外部工具、服务或数据源安全接入 AI 宿主。
使用 AI 驱动的爬虫、采集器和浏览器自动化从任意网站获取结构化数据,支持自然语言提示进行抓取与爬取,为你的大语言模型智能体提供新鲜数据。AI Studio 的 Python SDK,助你实现智能化的网页数据采集。
MCP 工具接入项目,用于把外部工具、服务或数据源安全接入 AI 宿主。
MCP 工具接入项目,用于把外部工具、服务或数据源安全接入 AI 宿主。
面向 AI 智能体的开源、可自托管的浏览器自动化库
由 LLM 驱动的浏览器自动化框架,支持钱包扩展测试,结合无障碍树与可选视觉能力。
MCP 工具接入项目,用于把外部工具、服务或数据源安全接入 AI 宿主。
一个专注于简洁性与可扩展性的 AI 网页浏览框架。