可发布
83k 星标
PaddleOCR 项目
PaddleOCR 是一款功能强大且轻量的 OCR 工具包,可将任意 PDF 或图像文档转换为结构化数据,衔接图像/PDF 与大语言模型(LLM),支持超过 100 种语言。
标签结果
当前标签:开源工具 · 4 个已发布项目。标签页只展示通过发布门禁的生产数据。
PaddleOCR 是一款功能强大且轻量的 OCR 工具包,可将任意 PDF 或图像文档转换为结构化数据,衔接图像/PDF 与大语言模型(LLM),支持超过 100 种语言。
一个用于在文本、图像和结构化数据中检测、编辑、遮盖和匿名化敏感数据(PII)的开源框架,支持 NLP、模式匹配和可自定义的流水线。
AI 原生搜索数据库,集成向量、文本、结构化与半结构化数据于一身,专为智能体存储设计,让智能体更智能、更易运行、更稳定。
用于非结构化数据的高性能检索引擎