# evoagentx - Doramagic AI Context Pack

> 定位：安装前体验与判断资产。它帮助宿主 AI 有一个好的开始，但不代表已经安装、执行或验证目标项目。

## 充分原则

- **充分原则，不是压缩原则**：AI Context Pack 应该充分到让宿主 AI 在开工前理解项目价值、能力边界、使用入口、风险和证据来源；它可以分层组织，但不以最短摘要为目标。
- **压缩策略**：只压缩噪声和重复内容，不压缩会影响判断和开工质量的上下文。

## 给宿主 AI 的使用方式

你正在读取 Doramagic 为 evoagentx 编译的 AI Context Pack。请把它当作开工前上下文：帮助用户理解适合谁、能做什么、如何开始、哪些必须安装后验证、风险在哪里。不要声称你已经安装、运行或执行了目标项目。

## Claim 消费规则

- **事实来源**：Repo Evidence + Claim/Evidence Graph；Human Wiki 只提供显著性、术语和叙事结构。
- **事实最低状态**：`supported`
- `supported`：可以作为项目事实使用，但回答中必须引用 claim_id 和证据路径。
- `weak`：只能作为低置信度线索，必须要求用户继续核实。
- `inferred`：只能用于风险提示或待确认问题，不能包装成项目事实。
- `unverified`：不得作为事实使用，应明确说证据不足。
- `contradicted`：必须展示冲突来源，不得替用户强行选择一个版本。

## 它最适合谁

- **AI 研究者或研究型 Agent 构建者**：README 明确围绕研究、实验或论文工作流展开。 证据：`README.md` Claim：`clm_0002` supported 0.86
- **正在使用 Claude/Codex/Cursor/Gemini 等宿主 AI 的开发者**：README 或插件配置提到多个宿主 AI。 证据：`README.md` Claim：`clm_0003` supported 0.86

## 它能做什么

- **命令行启动或安装流程**（需要安装后验证）：项目文档中存在可执行命令，真实使用需要在本地或宿主环境中运行这些命令。 证据：`README.md` Claim：`clm_0001` supported 0.86

## 怎么开始

- `pip install evoagentx` 证据：`README.md` Claim：`clm_0004` supported 0.86
- `pip install git+https://github.com/EvoAgentX/EvoAgentX.git` 证据：`README.md` Claim：`clm_0005` supported 0.86
- `git clone https://github.com/EvoAgentX/EvoAgentX.git` 证据：`README.md` Claim：`clm_0006` supported 0.86
- `pip install -r requirements.txt` 证据：`README.md` Claim：`clm_0007` supported 0.86
- `pip install -e .` 证据：`README.md` Claim：`clm_0004` supported 0.86, `clm_0008` supported 0.86

## 继续前判断卡

- **当前建议**：需要管理员/安全审批
- **为什么**：继续前可能涉及密钥、账号、外部服务或敏感上下文，建议先经过管理员或安全审批。

### 30 秒判断

- **现在怎么做**：需要管理员/安全审批
- **最小安全下一步**：先跑 Prompt Preview；若涉及凭证或企业环境，先审批再试装
- **先别相信**：角色质量和任务匹配不能直接相信。
- **继续会触碰**：角色选择偏差、命令执行、本地环境或项目文件

### 现在可以相信

- **适合人群线索：AI 研究者或研究型 Agent 构建者**（supported）：有 supported claim 或项目证据支撑，但仍不等于真实安装效果。 证据：`README.md` Claim：`clm_0002` supported 0.86
- **适合人群线索：正在使用 Claude/Codex/Cursor/Gemini 等宿主 AI 的开发者**（supported）：有 supported claim 或项目证据支撑，但仍不等于真实安装效果。 证据：`README.md` Claim：`clm_0003` supported 0.86
- **能力存在：命令行启动或安装流程**（supported）：可以相信项目包含这类能力线索；是否适合你的具体任务仍要试用或安装后验证。 证据：`README.md` Claim：`clm_0001` supported 0.86
- **存在 Quick Start / 安装命令线索**（supported）：可以相信项目文档出现过启动或安装入口；不要因此直接在主力环境运行。 证据：`README.md` Claim：`clm_0004` supported 0.86

### 现在还不能相信

- **角色质量和任务匹配不能直接相信。**（unverified）：角色库证明有很多角色，不证明每个角色都适合你的具体任务，也不证明角色能产生高质量结果。
- **不能把角色文案当成真实执行能力。**（unverified）：安装前只能判断角色描述和任务画像是否匹配，不能证明它能在宿主 AI 里完成任务。
- **真实输出质量不能在安装前相信。**（unverified）：Prompt Preview 只能展示引导方式，不能证明真实项目中的结果质量。
- **宿主 AI 版本兼容性不能在安装前相信。**（unverified）：Claude、Cursor、Codex、Gemini 等宿主加载规则和版本差异必须在真实环境验证。
- **不会污染现有宿主 AI 行为，不能直接相信。**（inferred）：Skill、plugin、AGENTS/CLAUDE/GEMINI 指令可能改变宿主 AI 的默认行为。
- **可安全回滚不能默认相信。**（unverified）：除非项目明确提供卸载和恢复说明，否则必须先在隔离环境验证。
- **真实安装后是否与用户当前宿主 AI 版本兼容？**（unverified）：兼容性只能通过实际宿主环境验证。
- **项目输出质量是否满足用户具体任务？**（unverified）：安装前预览只能展示流程和边界，不能替代真实评测。

### 继续会触碰什么

- **角色选择偏差**：用户对任务应该由哪个专家角色处理的判断。 原因：选错角色会让 AI 从错误专业视角回答，浪费时间或误导决策。
- **命令执行**：包管理器、网络下载、本地插件目录、项目配置或用户主目录。 原因：运行第一条命令就可能产生环境改动；必须先判断是否值得跑。 证据：`README.md`
- **本地环境或项目文件**：安装结果、插件缓存、项目配置或本地依赖目录。 原因：安装前无法证明写入范围和回滚方式，需要隔离验证。 证据：`README.md`
- **环境变量 / API Key**：项目入口文档明确出现 API key、token、secret 或账号凭证配置。 原因：如果真实安装需要凭证，应先使用测试凭证并经过权限/合规判断。 证据：`README-zh-TW.md`, `README-zh.md`, `README.md`, `Wonderful_workflow_corpus/README.md` 等
- **宿主 AI 上下文**：AI Context Pack、Prompt Preview、Skill 路由、风险规则和项目事实。 原因：导入上下文会影响宿主 AI 后续判断，必须避免把未验证项包装成事实。

### 最小安全下一步

- **先跑 Prompt Preview**：先用交互式试用验证任务画像和角色匹配，不要先导入整套角色库。（适用：任何项目都适用，尤其是输出质量未知时。）
- **只在隔离目录或测试账号试装**：避免安装命令污染主力宿主 AI、真实项目或用户主目录。（适用：存在命令执行、插件配置或本地写入线索时。）
- **不要使用真实生产凭证**：环境变量/API key 一旦进入宿主或工具链，可能产生账号和合规风险。（适用：出现 API、TOKEN、KEY、SECRET 等环境线索时。）
- **安装后只验证一个最小任务**：先验证加载、兼容、输出质量和回滚，再决定是否深用。（适用：准备从试用进入真实工作流时。）

### 退出方式

- **保留安装前状态**：记录原始宿主配置和项目状态，后续才能判断是否可恢复。
- **保留原始角色选择记录**：如果输出偏题，可以回到任务画像阶段重新选择角色，而不是继续沿着错误角色推进。
- **记录安装命令和写入路径**：没有明确卸载说明时，至少要知道哪些目录或配置需要手动清理。
- **准备撤销测试 API key 或 token**：测试凭证泄露或误用时，可以快速止损。
- **如果没有回滚路径，不进入主力环境**：不可回滚是继续前阻断项，不应靠信任或运气继续。

## 哪些只能预览

- 解释项目适合谁和能做什么
- 基于项目文档演示典型对话流程
- 帮助用户判断是否值得安装或继续研究

## 哪些必须安装后验证

- 真实安装 Skill、插件或 CLI
- 执行脚本、修改本地文件或访问外部服务
- 验证真实输出质量、性能和兼容性

## 边界与风险判断卡

- **把安装前预览误认为真实运行**：用户可能高估项目已经完成的配置、权限和兼容性验证。 处理方式：明确区分 prompt_preview_can_do 与 runtime_required。 Claim：`clm_0009` inferred 0.45
- **命令执行会修改本地环境**：安装命令可能写入用户主目录、宿主插件目录或项目配置。 处理方式：先在隔离环境或测试账号中运行。 证据：`README.md` Claim：`clm_0010` supported 0.86
- **待确认**：真实安装后是否与用户当前宿主 AI 版本兼容？。原因：兼容性只能通过实际宿主环境验证。
- **待确认**：项目输出质量是否满足用户具体任务？。原因：安装前预览只能展示流程和边界，不能替代真实评测。
- **待确认**：安装命令是否需要网络、权限或全局写入？。原因：这影响企业环境和个人环境的安装风险。

## 开工前工作上下文

### 加载顺序

- 先读取 how_to_use.host_ai_instruction，建立安装前判断资产的边界。
- 读取 claim_graph_summary，确认事实来自 Claim/Evidence Graph，而不是 Human Wiki 叙事。
- 再读取 intended_users、capabilities 和 quick_start_candidates，判断用户是否匹配。
- 需要执行具体任务时，优先查 role_skill_index，再查 evidence_index。
- 遇到真实安装、文件修改、网络访问、性能或兼容性问题时，转入 risk_card 和 boundaries.runtime_required。

### 任务路由

- **命令行启动或安装流程**：先说明这是安装后验证能力，再给出安装前检查清单。 边界：必须真实安装或运行后验证。 证据：`README.md` Claim：`clm_0001` supported 0.86

### 上下文规模

- 文件总数：480
- 重要文件覆盖：40/480
- 证据索引条目：80
- 角色 / Skill 条目：79

### 证据不足时的处理

- **missing_evidence**：说明证据不足，要求用户提供目标文件、README 段落或安装后验证记录；不要补全事实。
- **out_of_scope_request**：说明该任务超出当前 AI Context Pack 证据范围，并建议用户先查看 Human Manual 或真实安装后验证。
- **runtime_request**：给出安装前检查清单和命令来源，但不要替用户执行命令或声称已执行。
- **source_conflict**：同时展示冲突来源，标记为待核实，不要强行选择一个版本。

## Prompt Recipes

### 适配判断

- 目标：判断这个项目是否适合用户当前任务。
- 预期输出：适配结论、关键理由、证据引用、安装前可预览内容、必须安装后验证内容、下一步建议。

```text
请基于 evoagentx 的 AI Context Pack，先问我 3 个必要问题，然后判断它是否适合我的任务。回答必须包含：适合谁、能做什么、不能做什么、是否值得安装、证据来自哪里。所有项目事实必须引用 evidence_refs、source_paths 或 claim_id。
```

### 安装前体验

- 目标：让用户在安装前感受核心工作流，同时避免把预览包装成真实能力或营销承诺。
- 预期输出：一段带边界标签的体验剧本、安装后验证清单和谨慎建议；不含真实运行承诺或强营销表述。

```text
请把 evoagentx 当作安装前体验资产，而不是已安装工具或真实运行环境。

请严格输出四段：
1. 先问我 3 个必要问题。
2. 给出一段“体验剧本”：用 [安装前可预览]、[必须安装后验证]、[证据不足] 三种标签展示它可能如何引导工作流。
3. 给出安装后验证清单：列出哪些能力只有真实安装、真实宿主加载、真实项目运行后才能确认。
4. 给出谨慎建议：只能说“值得继续研究/试装”“先补充信息后再判断”或“不建议继续”，不得替项目背书。

硬性边界：
- 不要声称已经安装、运行、执行测试、修改文件或产生真实结果。
- 不要写“自动适配”“确保通过”“完美适配”“强烈建议安装”等承诺性表达。
- 如果描述安装后的工作方式，必须使用“如果安装成功且宿主正确加载 Skill，它可能会……”这种条件句。
- 体验剧本只能写成“示例台词/假设流程”：使用“可能会询问/可能会建议/可能会展示”，不要写“已写入、已生成、已通过、正在运行、正在生成”。
- Prompt Preview 不负责给安装命令；如用户准备试装，只能提示先阅读 Quick Start 和 Risk Card，并在隔离环境验证。
- 所有项目事实必须来自 supported claim、evidence_refs 或 source_paths；inferred/unverified 只能作风险或待确认项。

```

### 角色 / Skill 选择

- 目标：从项目里的角色或 Skill 中挑选最匹配的资产。
- 预期输出：候选角色或 Skill 列表，每项包含适用场景、证据路径、风险边界和是否需要安装后验证。

```text
请读取 role_skill_index，根据我的目标任务推荐 3-5 个最相关的角色或 Skill。每个推荐都要说明适用场景、可能输出、风险边界和 evidence_refs。
```

### 风险预检

- 目标：安装或引入前识别环境、权限、规则冲突和质量风险。
- 预期输出：环境、权限、依赖、许可、宿主冲突、质量风险和未知项的检查清单。

```text
请基于 risk_card、boundaries 和 quick_start_candidates，给我一份安装前风险预检清单。不要替我执行命令，只说明我应该检查什么、为什么检查、失败会有什么影响。
```

### 宿主 AI 开工指令

- 目标：把项目上下文转成一次对话开始前的宿主 AI 指令。
- 预期输出：一段边界明确、证据引用明确、适合复制给宿主 AI 的开工前指令。

```text
请基于 evoagentx 的 AI Context Pack，生成一段我可以粘贴给宿主 AI 的开工前指令。这段指令必须遵守 not_runtime=true，不能声称项目已经安装、运行或产生真实结果。
```

## 角色 / Skill 索引

- 共索引 79 个角色 / Skill / 项目文档条目。

- **🤖 Agents**（project_doc）： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/api/agents.md`
- **🤖 Agent 接口**（project_doc）： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/api/agents.md`
- **What is EvoAgentX**（project_doc）：Building a Self-Evolving Ecosystem of AI Agents 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`README.md`
- **Readme**（project_doc）：🌟 Wonderful Workflow Corpus ============================ 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`Wonderful_workflow_corpus/README.md`
- **Benchmark**（project_doc）：This repository provides a set of benchmarks to facilitate the evaluation of different agent-based systems. Below is a summary of the benchmarks currently included, along with basic dataset statistics: 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`evoagentx/benchmark/README.md`
- **EvoPrompt**（project_doc）：To use evoprompt singleagent.py , you need to download the required prompt scripts from the following repository: 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`examples/optimization/evoprompt/README.md`
- **Contributing to EvoAgentX**（project_doc）：Thank you for considering contributing to EvoAgentX – an automatic agentic workflow generation and evolving framework! We appreciate your interest and contributions to improving the project. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`CONTRIBUTING.md`
- **EvoAgentX**（project_doc）：An automated framework for evaluating and evolving agentic workflows. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/index.md`
- **Installation Guide for EvoAgentX**（project_doc）：This guide will walk you through the process of installing EvoAgentX on your system, setting up the required dependencies, and configuring the framework for your projects. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/installation.md`
- **EvoAgentX Quickstart Guide**（project_doc）：This quickstart guide will walk you through the essential steps to set up and start using EvoAgentX. In this tutorial, you'll learn how to: 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/quickstart.md`
- **🎯 Actions**（project_doc）： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/api/actions.md`
- **🧪 Benchmark**（project_doc）：🧪 Benchmark ::: evoagentx.benchmark 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/api/benchmark.md`
- **🧠 Core**（project_doc）： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/api/core.md`
- **🧑‍⚖️ Evaluators**（project_doc）：🧑‍⚖️ Evaluators ::: evoagentx.evaluators 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/api/evaluators.md`
- **🖇️ Memory**（project_doc）： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/api/memory.md`
- **🧬 Models**（project_doc）： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/api/models.md`
- **🧮 Optimizers**（project_doc）：🧮 Optimizers ::: evoagentx.optimizers 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/api/optimizers.md`
- **💾 Storages**（project_doc）： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/api/storages.md`
- **🛠️ Tools**（project_doc）： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/api/tools.md`
- **🔁 Workflow**（project_doc）： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/api/workflow.md`
- **Action Graph**（project_doc）：The ActionGraph class is a fundamental component in the EvoAgentX framework for creating and executing sequences of operations actions within a single task. It provides a structured way to define, manage, and execute a series of operations that need to be performed in a specific order to complete a task. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/modules/action_graph.md`
- **Agent**（project_doc）：The Agent class is the fundamental building block for creating intelligent AI agents within the EvoAgentX framework. It provides a structured way to combine language models with actions, and memory management. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/modules/agent.md`
- **Benchmark**（project_doc）：EvoAgentX provides a set of benchmarks to facilitate the evaluation of different agent-based systems. Below is a summary of the benchmarks currently included, along with basic dataset statistics: 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/modules/benchmark.md`
- **CustomizeAgent**（project_doc）：The CustomizeAgent class provides a flexible framework for creating specialized LLM-powered agents. It enables the definition of agents with well-defined inputs, outputs, custom prompt templates, and configurable parsing strategies, making it suitable for rapid prototyping and deployment of domain-specific agents. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/modules/customize_agent.md`
- **Evaluator**（project_doc）：The Evaluator class is a fundamental component in the EvoAgentX framework for evaluating the performance of workflows and action graphs against benchmarks. It provides a structured way to measure how well AI agents perform on specific tasks by running evaluations on test data and computing metrics. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/modules/evaluator.md`
- **Naming**（project_doc）：This document describes the image tools in EvoAgentX: module layout, naming, public API, inputs/outputs, and behavior. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/modules/image_tools.md`
- **LLM**（project_doc）：The LLM Large Language Model module provides a unified interface for interacting with various language model providers in the EvoAgentX framework. It abstracts away provider-specific implementation details, offering a consistent API for generating text, managing costs, and handling responses. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/modules/llm.md`
- **Multi-Agent Debate Framework**（project_doc）：The Multi-Agent Debate MAD framework is a sophisticated system for orchestrating debates between multiple AI agents to solve complex problems through collaborative reasoning. Built on top of EvoAgentX's ActionGraph architecture, it implements Google's Multi-Agent Debate methodology with enhanced features for production use. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/modules/multi_agent_debate.md`
- **PromptTemplate**（project_doc）：The PromptTemplate class provides a flexible and structured way to define prompts for language models. It supports various components like instructions, context, constraints, tools, and demonstrations, making it easier to create consistent and well-formatted prompts. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/modules/prompt_template.md`
- **RAGEngine Module Documentation**（project_doc）：The RAGEngine module is the core component of the Retrieval-Augmented Generation RAG system, designed to manage document indexing, storage, and retrieval for efficient information access. Built on top of LlamaIndex, it integrates with various storage backends e.g., SQLite, FAISS, Neo4j and supports multiple index types e.g., vector, graph . This module is part of a long-term memory management framework, enabling age… 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/modules/rag.md`
- **StorageHandler Documentation**（project_doc）：Overview The StorageHandler class is a critical component designed to manage multiple storage backends for storing and retrieving various types of data, such as agent configurations, workflows, memory entries, and index data. It provides a unified interface to interact with different storage systems, including relational databases e.g., SQLite , vector databases e.g., FAISS , and graph databases e.g., Neo4j . The cl… 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/modules/storages.md`
- **Workflow Graph**（project_doc）：The WorkFlowGraph class is a fundamental component in the EvoAgentX framework for creating, managing, and executing complex AI agent workflows. It provides a structured way to define task dependencies, execution order, and the flow of data between tasks. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/modules/workflow_graph.md`
- **AFlow Optimizer Tutorial**（project_doc）：This tutorial will guide you through the process of setting up and running the AFlow https://arxiv.org/abs/2410.10762 optimizer in EvoAgentX. We'll use the HumanEval benchmark as an example to demonstrate how to optimize a multi-agent workflow for code generation tasks. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/tutorial/aflow_optimizer.md`
- **Alita Agent Search + Storage + Code + Dynamic Tools**（project_doc）：Alita Agent Search + Storage + Code + Dynamic Tools 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/tutorial/alita_agent.md`
- **Benchmark and Evaluation Tutorial**（project_doc）：This tutorial will guide you through the process of setting up and running benchmark evaluations using EvoAgentX. We'll use the HotpotQA dataset as an example to demonstrate how to set up and run the evaluation process. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/tutorial/benchmark_and_evaluation.md`
- **Colab Tutorial Notebooks**（project_doc）：This page collects the official Colab notebooks for EvoAgentX. Click the Open in Colab badge to launch a runnable copy in your browser. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/tutorial/colab_notebooks.md`
- **EvoPrompt Optimizer Tutorial**（project_doc）：This tutorial will guide you through the process of setting up and running the EvoPrompt optimizer in EvoAgentX. We'll use the BIG-Bench Hard benchmark as an example to demonstrate how to optimize multi-agent workflow prompts using Genetic Algorithm GA and Differential Evolution DE algorithms. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/tutorial/evoprompt_optimizer.md`
- **Build Your First Agent**（project_doc）：In EvoAgentX, agents are intelligent components designed to complete specific tasks autonomously. This tutorial will walk you through the essential concepts of creating and using agents in EvoAgentX: 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/tutorial/first_agent.md`
- **Build Your First Workflow**（project_doc）：In EvoAgentX, workflows allow multiple agents to collaborate sequentially on complex tasks. This tutorial will guide you through creating and using workflows: 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/tutorial/first_workflow.md`
- **Getting Started with Human-in-the-Loop HITL**（project_doc）：Getting Started with Human-in-the-Loop HITL 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/tutorial/hitl.md`
- **Quick Start**（project_doc）：This tutorial shows how to use image tools in EvoAgentX, including: 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/tutorial/image_tools.md`
- **Working with MCP Tools in EvoAgentX**（project_doc）：Working with MCP Tools in EvoAgentX 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/tutorial/mcp.md`
- **Multi-Agent Debate Tutorial**（project_doc）：This tutorial provides a practical guide to using EvoAgentX's Multi-Agent Debate MAD framework. You'll learn how to set up debates, configure agents, and solve real-world problems through collaborative AI reasoning. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/tutorial/multi_agent_debate.md`
- **Build Your First RAG System with RAGEngine**（project_doc）：Build Your First RAG System with RAGEngine 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/tutorial/rag.md`
- **SEW Optimizer Tutorial**（project_doc）：This tutorial will guide you through the process of setting up and running the SEW Self-Evolving Workflow optimizer in EvoAgentX. We'll use the HumanEval benchmark as an example to demonstrate how to optimize a multi-agent workflow. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/tutorial/sew_optimizer.md`
- **TextGrad Optimizer Tutorial**（project_doc）：This tutorial will guide you through the process of setting up and running the TextGrad optimizer in EvoAgentX. We'll use the MATH https://www.modelscope.cn/datasets/opencompass/competition math dataset as an example to demonstrate how to optimize the prompts and system prompts in a workflow. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/tutorial/textgrad_optimizer.md`
- **Working with Tools in EvoAgentX**（project_doc）：This tutorial walks you through using EvoAgentX's powerful tool ecosystem. Tools allow agents to interact with the external world, perform computations, and access information. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/tutorial/tools.md`
- **🗃️ AI Agent Gmail Toolkit: User Setup Guide**（project_doc）：This guide is designed for developers of an open-source AI agent who need to provide clear, step-by-step instructions for their users to set up the necessary Google credentials. This approach minimizes user friction by having them create a single Desktop app client and run a seamless authentication script. 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/tutorial/tools/Gmail_api_setup.md`
- **🎯 动作接口**（project_doc）： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/api/actions.md`
- **🧪 基准测试接口**（project_doc）： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/api/benchmark.md`
- **🧠 核心模块**（project_doc）： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/api/core.md`
- **🧑‍⚖️ 评估器接口**（project_doc）：🧑‍⚖️ 评估器接口 ::: evoagentx.evaluators 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/api/evaluators.md`
- **🖇️ 工具集接口**（project_doc）： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/api/memory.md`
- **🧬 模型接口**（project_doc）： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/api/models.md`
- **🧮 优化器接口**（project_doc）： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/api/optimizers.md`
- **💾 存储模块**（project_doc）： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/api/storages.md`
- **🛠️ 工具集接口**（project_doc）： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/api/tools.md`
- **🔁 工作流接口**（project_doc）： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/api/workflow.md`
- **EvoAgentX**（project_doc）：EvoAgentX 是一个开源框架，旨在自动化代理工作流的生成、执行、评估和优化。通过利用大语言模型（LLMs），EvoAgentX 使开发者和研究人员能够快速构建、测试和部署多代理系统，这些系统可以随着时间推移在复杂性和能力上不断增长。 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/index.md`
- **EvoAgentX 安装指南**（project_doc）：本指南将引导您完成在系统上安装 EvoAgentX、设置所需依赖项以及为您的项目配置框架的全过程。 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/installation.md`
- **动作图**（project_doc）：ActionGraph 类是 EvoAgentX 框架中的一个基础组件，用于在单个任务中创建和执行操作（动作）序列。它提供了一种结构化的方式来定义、管理和执行一系列需要按特定顺序执行的操作，以完成任务。 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/modules/action_graph.md`
- **Agent**（project_doc）：Agent 类是 EvoAgentX 框架中创建智能 AI 代理的基础构建块。它提供了一种结构化的方式来组合语言模型、动作和内存管理。 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/modules/agent.md`
- **基准测试**（project_doc）：EvoAgentX 提供了一套基准测试工具，用于评估不同的基于代理的系统。以下是当前包含的基准测试及其基本数据集统计信息： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/modules/benchmark.md`
- **自定义代理**（project_doc）：CustomizeAgent 类提供了一个灵活的框架，用于创建专门的 LLM 驱动的代理。它允许定义具有明确定义的输入、输出、自定义提示模板和可配置解析策略的代理，使其适合快速原型设计和部署特定领域的代理。 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/modules/customize_agent.md`
- **评估器**（project_doc）：Evaluator 类是 EvoAgentX 框架中的一个基础组件，用于评估工作流和动作图在基准测试上的性能。它提供了一种结构化的方式来衡量 AI 代理在特定任务上的表现，通过运行测试数据并计算指标。 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/modules/evaluator.md`
- **LLM**（project_doc）：LLM（大语言模型）模块为 EvoAgentX 框架提供了与各种语言模型提供商交互的统一接口。它抽象了特定提供商的实现细节，为生成文本、管理成本和处理响应提供了一致的 API。 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/modules/llm.md`
- **提示模板**（project_doc）：PromptTemplate 类提供了一种灵活且结构化的方式来定义语言模型的提示。它支持各种组件，如指令、上下文、约束、工具和示例，使创建一致且格式良好的提示变得更加容易。 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/modules/prompt_template.md`
- **RAGEngine 模块文档**（project_doc）：RAGEngine 模块是检索增强生成（RAG）系统的核心组件，设计用于管理文档的索引、存储和检索，以实现高效的信息访问。基于 LlamaIndex 构建，它与多种存储后端（如 SQLite、FAISS、Neo4j）集成，并支持多种索引类型（如向量索引、图索引）。该模块是长期记忆管理框架的一部分，适用于需要高效处理和查询大型数据集的代理系统。 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/modules/rag.md`
- **StorageHandler 文档**（project_doc）：概述 StorageHandler 类是一个为管理多种存储后端而设计的关键组件，用于存储和检索各类数据，如代理配置、工作流、记忆条目和索引数据。它提供了一个统一的接口，与不同类型的存储系统交互，包括关系型数据库（如 SQLite）、向量数据库（如 FAISS）和图数据库（如 Neo4j）。该类利用Pydantic库进行配置验证，以及工厂模式初始化存储后端。 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/modules/storages.md`
- **工作流图**（project_doc）：WorkFlowGraph 类是 EvoAgentX 框架中的一个基础组件，用于创建、管理和执行复杂的 AI 代理工作流。它提供了一种结构化的方式来定义任务依赖关系、执行顺序和任务之间的数据流。 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/modules/workflow_graph.md`
- **EvoAgentX 快速开始指南**（project_doc）：本快速开始指南将引导你完成使用 EvoAgentX 的基础步骤。在本教程中，你将学习如何： 1. 配置用于访问 LLM 的 API 密钥 2. 自动创建并执行工作流 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/quickstart.md`
- **AFlow 优化器教程**（project_doc）：本教程将指导你如何使用 EvoAgentX 的 AFlow 优化器来优化你的工作流。AFlow 优化器是一个强大的工具，可以帮助你自动优化工作流的性能。 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/tutorial/aflow_optimizer.md`
- **Alita 智能体（搜索 + 存储 + 代码执行 + 动态工具）**（project_doc）：本页面简要介绍 Alita 智能体 ：一个集成了网页搜索、文件读写、代码执行，并且可以在运行过程中 动态创建工具 的单智能体。 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/tutorial/alita_agent.md`
- **基准测试和评估教程**（project_doc）：本教程将指导你使用 EvoAgentX 设置和运行基准测试评估。我们将使用 HotpotQA 数据集作为示例，演示如何设置和运行评估过程。 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/tutorial/benchmark_and_evaluation.md`
- **EvoPrompt 优化器教程**（project_doc）：本教程将指导您在 EvoAgentX 中设置和运行 EvoPrompt 优化器。我们将使用 BIG-Bench Hard 基准测试作为示例，展示如何通过遗传算法 GA 和差分进化 DE 算法来优化多代理工作流的提示。 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/tutorial/evoprompt_optimizer_zh.md`
- **构建你的第一个代理**（project_doc）：在 EvoAgentX 中，代理是设计用来自主完成特定任务的智能组件。本教程将引导你了解在 EvoAgentX 中创建和使用代理的基本概念： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/tutorial/first_agent.md`
- **构建你的第一个工作流**（project_doc）：在 EvoAgentX 中，工作流允许多个代理按顺序协作完成复杂任务。本教程将指导你创建和使用工作流： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/tutorial/first_workflow.md`
- **使用 RAGEngine 构建您的第一个 RAG 系统**（project_doc）：在 EvoAgentX 中， RAGEngine 是一个强大的工具，用于构建检索增强生成（RAG）系统。它允许您加载文档、创建可搜索的索引，并检索相关信息来回答问题。本教程专为初学者设计，将指导您完成使用 RAGEngine 创建和使用 RAG 系统的基本步骤： 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/tutorial/rag.md`
- **SEW优化器教程**（project_doc）：本教程将指导您设置和运行EvoAgentX中的SEW（Self-Evolving Workflow，自进化工作流）优化器。我们将使用HumanEval基准作为示例，演示如何优化多智能体工作流。 激活提示：当用户需要理解项目结构、安装方式或边界时参考。 证据：`docs/zh/tutorial/sew_optimizer.md`

## 证据索引

- 共索引 80 条证据。

- **🤖 Agents**（documentation）：🤖 Agents ::: evoagentx.agents 证据：`docs/api/agents.md`
- **🤖 Agent 接口**（documentation）：🤖 Agent 接口 ::: evoagentx.agents 证据：`docs/zh/api/agents.md`
- **What is EvoAgentX**（documentation）：Building a Self-Evolving Ecosystem of AI Agents 证据：`README.md`
- **Readme**（documentation）：🌟 Wonderful Workflow Corpus ============================ 证据：`Wonderful_workflow_corpus/README.md`
- **Benchmark**（documentation）：This repository provides a set of benchmarks to facilitate the evaluation of different agent-based systems. Below is a summary of the benchmarks currently included, along with basic dataset statistics: 证据：`evoagentx/benchmark/README.md`
- **EvoPrompt**（documentation）：To use evoprompt singleagent.py , you need to download the required prompt scripts from the following repository: 证据：`examples/optimization/evoprompt/README.md`
- **Contributing to EvoAgentX**（documentation）：Thank you for considering contributing to EvoAgentX – an automatic agentic workflow generation and evolving framework! We appreciate your interest and contributions to improving the project. 证据：`CONTRIBUTING.md`
- **Third-party Licenses**（source_file）：Permission is hereby granted, free of charge, to any person obtaining a copy of this software and associated documentation files the “Software” , to deal in the Software without restriction, including without limitation the rights to use, copy, modify, merge, publish, distribute, sublicense, and/or sell copies of the Software, and to permit persons to whom the Software is furnished to do so, subject to the following conditions: 证据：`LICENSE`
- **EvoAgentX**（documentation）：An automated framework for evaluating and evolving agentic workflows. 证据：`docs/index.md`
- **Installation Guide for EvoAgentX**（documentation）：This guide will walk you through the process of installing EvoAgentX on your system, setting up the required dependencies, and configuring the framework for your projects. 证据：`docs/installation.md`
- **EvoAgentX Quickstart Guide**（documentation）：This quickstart guide will walk you through the essential steps to set up and start using EvoAgentX. In this tutorial, you'll learn how to: 证据：`docs/quickstart.md`
- **🎯 Actions**（documentation）：🎯 Actions ::: evoagentx.actions 证据：`docs/api/actions.md`
- **🧪 Benchmark**（documentation）：🧪 Benchmark ::: evoagentx.benchmark 证据：`docs/api/benchmark.md`
- **🧠 Core**（documentation）：🧠 Core ::: evoagentx.core 证据：`docs/api/core.md`
- **🧑‍⚖️ Evaluators**（documentation）：🧑‍⚖️ Evaluators ::: evoagentx.evaluators 证据：`docs/api/evaluators.md`
- **🖇️ Memory**（documentation）：🖇️ Memory ::: evoagentx.memory 证据：`docs/api/memory.md`
- **🧬 Models**（documentation）：🧬 Models ::: evoagentx.models 证据：`docs/api/models.md`
- **🧮 Optimizers**（documentation）：🧮 Optimizers ::: evoagentx.optimizers 证据：`docs/api/optimizers.md`
- **💾 Storages**（documentation）：💾 Storages ::: evoagentx.storages 证据：`docs/api/storages.md`
- **🛠️ Tools**（documentation）：🛠️ Tools ::: evoagentx.tools 证据：`docs/api/tools.md`
- **🔁 Workflow**（documentation）：🔁 Workflow ::: evoagentx.workflow 证据：`docs/api/workflow.md`
- **Action Graph**（documentation）：The ActionGraph class is a fundamental component in the EvoAgentX framework for creating and executing sequences of operations actions within a single task. It provides a structured way to define, manage, and execute a series of operations that need to be performed in a specific order to complete a task. 证据：`docs/modules/action_graph.md`
- **Agent**（documentation）：The Agent class is the fundamental building block for creating intelligent AI agents within the EvoAgentX framework. It provides a structured way to combine language models with actions, and memory management. 证据：`docs/modules/agent.md`
- **Benchmark**（documentation）：EvoAgentX provides a set of benchmarks to facilitate the evaluation of different agent-based systems. Below is a summary of the benchmarks currently included, along with basic dataset statistics: 证据：`docs/modules/benchmark.md`
- **CustomizeAgent**（documentation）：The CustomizeAgent class provides a flexible framework for creating specialized LLM-powered agents. It enables the definition of agents with well-defined inputs, outputs, custom prompt templates, and configurable parsing strategies, making it suitable for rapid prototyping and deployment of domain-specific agents. 证据：`docs/modules/customize_agent.md`
- **Evaluator**（documentation）：The Evaluator class is a fundamental component in the EvoAgentX framework for evaluating the performance of workflows and action graphs against benchmarks. It provides a structured way to measure how well AI agents perform on specific tasks by running evaluations on test data and computing metrics. 证据：`docs/modules/evaluator.md`
- **Naming**（documentation）：This document describes the image tools in EvoAgentX: module layout, naming, public API, inputs/outputs, and behavior. 证据：`docs/modules/image_tools.md`
- **LLM**（documentation）：The LLM Large Language Model module provides a unified interface for interacting with various language model providers in the EvoAgentX framework. It abstracts away provider-specific implementation details, offering a consistent API for generating text, managing costs, and handling responses. 证据：`docs/modules/llm.md`
- **Multi-Agent Debate Framework**（documentation）：The Multi-Agent Debate MAD framework is a sophisticated system for orchestrating debates between multiple AI agents to solve complex problems through collaborative reasoning. Built on top of EvoAgentX's ActionGraph architecture, it implements Google's Multi-Agent Debate methodology with enhanced features for production use. 证据：`docs/modules/multi_agent_debate.md`
- **PromptTemplate**（documentation）：The PromptTemplate class provides a flexible and structured way to define prompts for language models. It supports various components like instructions, context, constraints, tools, and demonstrations, making it easier to create consistent and well-formatted prompts. 证据：`docs/modules/prompt_template.md`
- **RAGEngine Module Documentation**（documentation）：The RAGEngine module is the core component of the Retrieval-Augmented Generation RAG system, designed to manage document indexing, storage, and retrieval for efficient information access. Built on top of LlamaIndex, it integrates with various storage backends e.g., SQLite, FAISS, Neo4j and supports multiple index types e.g., vector, graph . This module is part of a long-term memory management framework, enabling agents to process and query large datasets effectively. 证据：`docs/modules/rag.md`
- **StorageHandler Documentation**（documentation）：Overview The StorageHandler class is a critical component designed to manage multiple storage backends for storing and retrieving various types of data, such as agent configurations, workflows, memory entries, and index data. It provides a unified interface to interact with different storage systems, including relational databases e.g., SQLite , vector databases e.g., FAISS , and graph databases e.g., Neo4j . The class leverages the Pydantic library for configuration validation and uses factory patterns to initialize storage backends. 证据：`docs/modules/storages.md`
- **Workflow Graph**（documentation）：The WorkFlowGraph class is a fundamental component in the EvoAgentX framework for creating, managing, and executing complex AI agent workflows. It provides a structured way to define task dependencies, execution order, and the flow of data between tasks. 证据：`docs/modules/workflow_graph.md`
- **AFlow Optimizer Tutorial**（documentation）：This tutorial will guide you through the process of setting up and running the AFlow https://arxiv.org/abs/2410.10762 optimizer in EvoAgentX. We'll use the HumanEval benchmark as an example to demonstrate how to optimize a multi-agent workflow for code generation tasks. 证据：`docs/tutorial/aflow_optimizer.md`
- **Alita Agent Search + Storage + Code + Dynamic Tools**（documentation）：Alita Agent Search + Storage + Code + Dynamic Tools 证据：`docs/tutorial/alita_agent.md`
- **Benchmark and Evaluation Tutorial**（documentation）：This tutorial will guide you through the process of setting up and running benchmark evaluations using EvoAgentX. We'll use the HotpotQA dataset as an example to demonstrate how to set up and run the evaluation process. 证据：`docs/tutorial/benchmark_and_evaluation.md`
- **Colab Tutorial Notebooks**（documentation）：This page collects the official Colab notebooks for EvoAgentX. Click the Open in Colab badge to launch a runnable copy in your browser. 证据：`docs/tutorial/colab_notebooks.md`
- **EvoPrompt Optimizer Tutorial**（documentation）：This tutorial will guide you through the process of setting up and running the EvoPrompt optimizer in EvoAgentX. We'll use the BIG-Bench Hard benchmark as an example to demonstrate how to optimize multi-agent workflow prompts using Genetic Algorithm GA and Differential Evolution DE algorithms. 证据：`docs/tutorial/evoprompt_optimizer.md`
- **Build Your First Agent**（documentation）：In EvoAgentX, agents are intelligent components designed to complete specific tasks autonomously. This tutorial will walk you through the essential concepts of creating and using agents in EvoAgentX: 证据：`docs/tutorial/first_agent.md`
- **Build Your First Workflow**（documentation）：In EvoAgentX, workflows allow multiple agents to collaborate sequentially on complex tasks. This tutorial will guide you through creating and using workflows: 证据：`docs/tutorial/first_workflow.md`
- **Getting Started with Human-in-the-Loop HITL**（documentation）：Getting Started with Human-in-the-Loop HITL 证据：`docs/tutorial/hitl.md`
- **Quick Start**（documentation）：This tutorial shows how to use image tools in EvoAgentX, including: 证据：`docs/tutorial/image_tools.md`
- **Working with MCP Tools in EvoAgentX**（documentation）：Working with MCP Tools in EvoAgentX 证据：`docs/tutorial/mcp.md`
- **Multi-Agent Debate Tutorial**（documentation）：This tutorial provides a practical guide to using EvoAgentX's Multi-Agent Debate MAD framework. You'll learn how to set up debates, configure agents, and solve real-world problems through collaborative AI reasoning. 证据：`docs/tutorial/multi_agent_debate.md`
- **Build Your First RAG System with RAGEngine**（documentation）：Build Your First RAG System with RAGEngine 证据：`docs/tutorial/rag.md`
- **SEW Optimizer Tutorial**（documentation）：This tutorial will guide you through the process of setting up and running the SEW Self-Evolving Workflow optimizer in EvoAgentX. We'll use the HumanEval benchmark as an example to demonstrate how to optimize a multi-agent workflow. 证据：`docs/tutorial/sew_optimizer.md`
- **TextGrad Optimizer Tutorial**（documentation）：This tutorial will guide you through the process of setting up and running the TextGrad optimizer in EvoAgentX. We'll use the MATH https://www.modelscope.cn/datasets/opencompass/competition math dataset as an example to demonstrate how to optimize the prompts and system prompts in a workflow. 证据：`docs/tutorial/textgrad_optimizer.md`
- **Working with Tools in EvoAgentX**（documentation）：This tutorial walks you through using EvoAgentX's powerful tool ecosystem. Tools allow agents to interact with the external world, perform computations, and access information. 证据：`docs/tutorial/tools.md`
- **🗃️ AI Agent Gmail Toolkit: User Setup Guide**（documentation）：This guide is designed for developers of an open-source AI agent who need to provide clear, step-by-step instructions for their users to set up the necessary Google credentials. This approach minimizes user friction by having them create a single Desktop app client and run a seamless authentication script. 证据：`docs/tutorial/tools/Gmail_api_setup.md`
- **🎯 动作接口**（documentation）：🎯 动作接口 ::: evoagentx.actions 证据：`docs/zh/api/actions.md`
- **🧪 基准测试接口**（documentation）：🧪 基准测试接口 ::: evoagentx.benchmark 证据：`docs/zh/api/benchmark.md`
- **🧠 核心模块**（documentation）：🧠 核心模块 ::: evoagentx.core 证据：`docs/zh/api/core.md`
- **🧑‍⚖️ 评估器接口**（documentation）：🧑‍⚖️ 评估器接口 ::: evoagentx.evaluators 证据：`docs/zh/api/evaluators.md`
- **🖇️ 工具集接口**（documentation）：🖇️ 工具集接口 ::: evoagentx.memory 证据：`docs/zh/api/memory.md`
- **🧬 模型接口**（documentation）：🧬 模型接口 ::: evoagentx.models 证据：`docs/zh/api/models.md`
- **🧮 优化器接口**（documentation）：🧮 优化器接口 ::: evoagentx.optimizers 证据：`docs/zh/api/optimizers.md`
- **💾 存储模块**（documentation）：💾 存储模块 ::: evoagentx.storages 证据：`docs/zh/api/storages.md`
- **🛠️ 工具集接口**（documentation）：🛠️ 工具集接口 ::: evoagentx.tools 证据：`docs/zh/api/tools.md`
- **🔁 工作流接口**（documentation）：🔁 工作流接口 ::: evoagentx.workflow 证据：`docs/zh/api/workflow.md`
- **EvoAgentX**（documentation）：EvoAgentX 是一个开源框架，旨在自动化代理工作流的生成、执行、评估和优化。通过利用大语言模型（LLMs），EvoAgentX 使开发者和研究人员能够快速构建、测试和部署多代理系统，这些系统可以随着时间推移在复杂性和能力上不断增长。 证据：`docs/zh/index.md`
- 其余 20 条证据见 `AI_CONTEXT_PACK.json` 或 `EVIDENCE_INDEX.json`。

## 宿主 AI 必须遵守的规则

- **把本资产当作开工前上下文，而不是运行环境。**：AI Context Pack 只包含证据化项目理解，不包含目标项目的可执行状态。 证据：`docs/api/agents.md`, `docs/zh/api/agents.md`, `README.md`
- **回答用户时区分可预览内容与必须安装后才能验证的内容。**：安装前体验的消费者价值来自降低误装和误判，而不是伪装成真实运行。 证据：`docs/api/agents.md`, `docs/zh/api/agents.md`, `README.md`

## 用户开工前应该回答的问题

- 你准备在哪个宿主 AI 或本地环境中使用它？
- 你只是想先体验工作流，还是准备真实安装？
- 你最在意的是安装成本、输出质量、还是和现有规则的冲突？

## 验收标准

- 所有能力声明都能回指到 evidence_refs 中的文件路径。
- AI_CONTEXT_PACK.md 没有把预览包装成真实运行。
- 用户能在 3 分钟内看懂适合谁、能做什么、如何开始和风险边界。

---

## Doramagic Context Augmentation

下面内容用于强化 Repomix/AI Context Pack 主体。Human Manual 只提供阅读骨架；踩坑日志会被转成宿主 AI 必须遵守的工作约束。

## Human Manual 骨架

使用规则：这里只是项目阅读路线和显著性信号，不是事实权威。具体事实仍必须回到 repo evidence / Claim Graph。

宿主 AI 硬性规则：
- 不得把页标题、章节顺序、摘要或 importance 当作项目事实证据。
- 解释 Human Manual 骨架时，必须明确说它只是阅读路线/显著性信号。
- 能力、安装、兼容性、运行状态和风险判断必须引用 repo evidence、source path 或 Claim Graph。

- **框架总览与核心架构**：importance `high`
  - source_paths: README.md, evoagentx/__init__.py, evoagentx/config.py, evoagentx/agents/agent.py, evoagentx/agents/customize_agent.py
- **工作流生成、执行与评估**：importance `high`
  - source_paths: evoagentx/workflow/workflow_generator.py, evoagentx/workflow/workflow_graph.py, evoagentx/workflow/action_graph.py, evoagentx/workflow/workflow.py, evoagentx/workflow/controller.py
- **自演化优化器**：importance `high`
  - source_paths: evoagentx/optimizers/optimizer.py, evoagentx/optimizers/optimizer_core.py, evoagentx/optimizers/textgrad_optimizer.py, evoagentx/optimizers/aflow_optimizer.py, evoagentx/optimizers/evoprompt_optimizer.py
- **工具、模型、存储与扩展**：importance `medium`
  - source_paths: evoagentx/models/openai_model.py, evoagentx/models/openrouter_model.py, evoagentx/models/aliyun_model.py, evoagentx/models/siliconflow_model.py, evoagentx/models/litellm_model.py

## Repo Inspection Evidence / 源码检查证据

- repo_clone_verified: true
- repo_inspection_verified: true
- repo_commit: `74911e0daaaae159c7d90547e1734403f335fda3`
- inspected_files: `README.md`, `pyproject.toml`, `requirements.txt`, `docs/api/actions.md`, `docs/api/agents.md`, `docs/api/benchmark.md`, `docs/api/core.md`, `docs/api/evaluators.md`, `docs/api/memory.md`, `docs/api/models.md`, `docs/api/optimizers.md`, `docs/api/storages.md`, `docs/api/tools.md`, `docs/api/workflow.md`, `docs/index.md`, `docs/installation.md`, `docs/modules/action_graph.md`, `docs/modules/agent.md`, `docs/modules/benchmark.md`, `docs/modules/customize_agent.md`

宿主 AI 硬性规则：
- 没有 repo_clone_verified=true 时，不得声称已经读过源码。
- 没有 repo_inspection_verified=true 时，不得把 README/docs/package 文件判断写成事实。
- 没有 quick_start_verified=true 时，不得声称 Quick Start 已跑通。

## Doramagic Pitfall Constraints / 踩坑约束

这些规则来自 Doramagic 发现、验证或编译过程中的项目专属坑点。宿主 AI 必须把它们当作工作约束，而不是普通说明文字。

### Constraint 1: 来源证据：[Question] Update Optimizer?

- Trigger: GitHub 社区证据显示该项目存在一个能力理解相关的待验证问题：[Question] Update Optimizer?
- Why it matters: 可能增加新用户试用和生产接入成本。
- Evidence: community_evidence:github | https://github.com/EvoAgentX/EvoAgentX/issues/220 | 来源类型 github_issue 暴露的待验证使用条件。
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 2: 失败模式：installation: v0.1.0 – Initial Release

- Trigger: Developers should check this installation risk before relying on the project: v0.1.0 – Initial Release
- Host AI rule: Before packaging this project, run the relevant install/config/quickstart check for: v0.1.0 – Initial Release. Context: Observed when using python
- Why it matters: Upgrade or migration may change expected behavior: v0.1.0 – Initial Release
- Evidence: failure_mode_cluster:github_release | https://github.com/EvoAgentX/EvoAgentX/releases/tag/v0.1.0 | v0.1.0 – Initial Release
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 3: 可能修改宿主 AI 配置

- Trigger: 项目面向 Claude/Cursor/Codex/Gemini/OpenCode 等宿主，或安装命令涉及用户配置目录。
- Host AI rule: 列出会写入的配置文件、目录和卸载/回滚步骤。
- Why it matters: 安装可能改变本机 AI 工具行为，用户需要知道写入位置和回滚方法。
- Evidence: capability.host_targets | https://github.com/EvoAgentX/EvoAgentX | host_targets=claude, chatgpt
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 4: 失败模式：configuration: [Bug] EvoPrompt concurrent evaluation can contaminate registry state

- Trigger: Developers should check this configuration risk before relying on the project: [Bug] EvoPrompt concurrent evaluation can contaminate registry state
- Host AI rule: Before packaging this project, run the relevant install/config/quickstart check for: [Bug] EvoPrompt concurrent evaluation can contaminate registry state. Context: Observed when using python, macos
- Why it matters: Developers may misconfigure credentials, environment, or host setup: [Bug] EvoPrompt concurrent evaluation can contaminate registry state
- Evidence: failure_mode_cluster:github_issue | https://github.com/EvoAgentX/EvoAgentX/issues/252 | [Bug] EvoPrompt concurrent evaluation can contaminate registry state
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 5: 失败模式：configuration: v0.1.1 Release

- Trigger: Developers should check this configuration risk before relying on the project: v0.1.1 Release
- Host AI rule: Before packaging this project, run the relevant install/config/quickstart check for: v0.1.1 Release. Context: Source discussion did not expose a precise runtime context.
- Why it matters: Upgrade or migration may change expected behavior: v0.1.1 Release
- Evidence: failure_mode_cluster:github_release | https://github.com/EvoAgentX/EvoAgentX/releases/tag/v0.1.1 | v0.1.1 Release
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 6: 来源证据：[Bug] Alita generated tools lose structured result when code prints extra stdout

- Trigger: GitHub 社区证据显示该项目存在一个配置相关的待验证问题：[Bug] Alita generated tools lose structured result when code prints extra stdout
- Why it matters: 可能增加新用户试用和生产接入成本。
- Evidence: community_evidence:github | https://github.com/EvoAgentX/EvoAgentX/issues/255 | 来源讨论提到 python 相关条件，需在安装/试用前复核。
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 7: 来源证据：[Bug] EvoPrompt concurrent evaluation can contaminate registry state

- Trigger: GitHub 社区证据显示该项目存在一个配置相关的待验证问题：[Bug] EvoPrompt concurrent evaluation can contaminate registry state
- Why it matters: 可能增加新用户试用和生产接入成本。
- Evidence: community_evidence:github | https://github.com/EvoAgentX/EvoAgentX/issues/252 | 来源讨论提到 python 相关条件，需在安装/试用前复核。
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 8: 能力判断依赖假设

- Trigger: README/documentation is current enough for a first validation pass.
- Host AI rule: 将假设转成下游验证清单。
- Why it matters: 假设不成立时，用户拿不到承诺的能力。
- Evidence: capability.assumptions | https://github.com/EvoAgentX/EvoAgentX | README/documentation is current enough for a first validation pass.
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

### Constraint 9: 维护活跃度未知

- Trigger: 未记录 last_activity_observed。
- Host AI rule: 补 GitHub 最近 commit、release、issue/PR 响应信号。
- Why it matters: 新项目、停更项目和活跃项目会被混在一起，推荐信任度下降。
- Evidence: evidence.maintainer_signals | https://github.com/EvoAgentX/EvoAgentX | last_activity_observed missing
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。

- Trigger: no_demo
- Evidence: downstream_validation.risk_items | https://github.com/EvoAgentX/EvoAgentX | no_demo; severity=medium
- Hard boundary: 不要把这个坑点包装成已解决、已验证或可忽略，除非后续验证证据明确证明它已经关闭。
