feat: add create_deerflow_agent SDK entry point (Phase 1) (#1203)

2026-05-21 15:36:48 +00:00 · 2026-03-29 15:31:18 +08:00
parent 7eb3a150b5
commit 06a623f9c8
10 changed files with 2225 additions and 3 deletions
@@ -0,0 +1,291 @@
+# Middleware 执行流程
+
+## Middleware 列表
+
+`create_deerflow_agent` 通过 `RuntimeFeatures` 组装的完整 middleware 链（默认全开时）：
+
+| # | Middleware | `before_agent` | `before_model` | `after_model` | `after_agent` | `wrap_tool_call` | 主 Agent | Subagent | 来源 |
+|---|-----------|:-:|:-:|:-:|:-:|:-:|:-:|:-:|------|
+| 0 | ThreadDataMiddleware | ✓ | | | | | ✓ | ✓ | `sandbox` |
+| 1 | UploadsMiddleware | ✓ | | | | | ✓ | ✗ | `sandbox` |
+| 2 | SandboxMiddleware | ✓ | | | ✓ | | ✓ | ✓ | `sandbox` |
+| 3 | DanglingToolCallMiddleware | | | ✓ | | | ✓ | ✗ | 始终开启 |
+| 4 | GuardrailMiddleware | | | | | ✓ | ✓ | ✓ | *Phase 2 纳入* |
+| 5 | ToolErrorHandlingMiddleware | | | | | ✓ | ✓ | ✓ | 始终开启 |
+| 6 | SummarizationMiddleware | | | ✓ | | | ✓ | ✗ | `summarization` |
+| 7 | TodoMiddleware | | | ✓ | | | ✓ | ✗ | `plan_mode` 参数 |
+| 8 | TitleMiddleware | | | ✓ | | | ✓ | ✗ | `auto_title` |
+| 9 | MemoryMiddleware | | | | ✓ | | ✓ | ✗ | `memory` |
+| 10 | ViewImageMiddleware | | ✓ | | | | ✓ | ✗ | `vision` |
+| 11 | SubagentLimitMiddleware | | | ✓ | | | ✓ | ✗ | `subagent` |
+| 12 | LoopDetectionMiddleware | | | ✓ | | | ✓ | ✗ | 始终开启 |
+| 13 | ClarificationMiddleware | | | ✓ | | | ✓ | ✗ | 始终最后 |
+
+主 agent **14 个** middleware（`make_lead_agent`），subagent **4 个**（ThreadData、Sandbox、Guardrail、ToolErrorHandling）。`create_deerflow_agent` Phase 1 实现 **13 个**（Guardrail 仅支持自定义实例，无内置默认）。
+
+## 执行流程
+
+LangChain `create_agent` 的规则：
+- **`before_*` 正序执行**（列表位置 0 → N）
+- **`after_*` 反序执行**（列表位置 N → 0）
+
+```mermaid
+graph TB
+    START(["invoke"]) --> TD
+
+    subgraph BA ["<b>before_agent</b> 正序 0→N"]
+        direction TB
+        TD["[0] ThreadData<br/>创建线程目录"] --> UL["[1] Uploads<br/>扫描上传文件"] --> SB["[2] Sandbox<br/>获取沙箱"]
+    end
+
+    subgraph BM ["<b>before_model</b> 正序 0→N"]
+        direction TB
+        VI["[10] ViewImage<br/>注入图片 base64"]
+    end
+
+    SB --> VI
+    VI --> M["<b>MODEL</b>"]
+
+    subgraph AM ["<b>after_model</b> 反序 N→0"]
+        direction TB
+        CL["[13] Clarification<br/>拦截 ask_clarification"] --> LD["[12] LoopDetection<br/>检测循环"] --> SL["[11] SubagentLimit<br/>截断多余 task"] --> TI["[8] Title<br/>生成标题"] --> SM["[6] Summarization<br/>上下文压缩"] --> DTC["[3] DanglingToolCall<br/>补缺失 ToolMessage"]
+    end
+
+    M --> CL
+
+    subgraph AA ["<b>after_agent</b> 反序 N→0"]
+        direction TB
+        SBR["[2] Sandbox<br/>释放沙箱"] --> MEM["[9] Memory<br/>入队记忆"]
+    end
+
+    DTC --> SBR
+    MEM --> END(["response"])
+
+    classDef beforeNode fill:#a0a8b5,stroke:#636b7a,color:#2d3239
+    classDef modelNode fill:#b5a8a0,stroke:#7a6b63,color:#2d3239
+    classDef afterModelNode fill:#b5a0a8,stroke:#7a636b,color:#2d3239
+    classDef afterAgentNode fill:#a0b5a8,stroke:#637a6b,color:#2d3239
+    classDef terminalNode fill:#a8b5a0,stroke:#6b7a63,color:#2d3239
+
+    class TD,UL,SB,VI beforeNode
+    class M modelNode
+    class CL,LD,SL,TI,SM,DTC afterModelNode
+    class SBR,MEM afterAgentNode
+    class START,END terminalNode
+```
+
+## 时序图
+
+```mermaid
+sequenceDiagram
+    participant U as User
+    participant TD as ThreadDataMiddleware
+    participant UL as UploadsMiddleware
+    participant SB as SandboxMiddleware
+    participant VI as ViewImageMiddleware
+    participant M as MODEL
+    participant CL as ClarificationMiddleware
+    participant SL as SubagentLimitMiddleware
+    participant TI as TitleMiddleware
+    participant SM as SummarizationMiddleware
+    participant DTC as DanglingToolCallMiddleware
+    participant MEM as MemoryMiddleware
+
+    U ->> TD: invoke
+    activate TD
+    Note right of TD: before_agent 创建目录
+
+    TD ->> UL: before_agent
+    activate UL
+    Note right of UL: before_agent 扫描上传文件
+
+    UL ->> SB: before_agent
+    activate SB
+    Note right of SB: before_agent 获取沙箱
+
+    SB ->> VI: before_model
+    activate VI
+    Note right of VI: before_model 注入图片 base64
+
+    VI ->> M: messages + tools
+    activate M
+    M -->> CL: AI response
+    deactivate M
+
+    activate CL
+    Note right of CL: after_model 拦截 ask_clarification
+    CL -->> SL: after_model
+    deactivate CL
+
+    activate SL
+    Note right of SL: after_model 截断多余 task
+    SL -->> TI: after_model
+    deactivate SL
+
+    activate TI
+    Note right of TI: after_model 生成标题
+    TI -->> SM: after_model
+    deactivate TI
+
+    activate SM
+    Note right of SM: after_model 上下文压缩
+    SM -->> DTC: after_model
+    deactivate SM
+
+    activate DTC
+    Note right of DTC: after_model 补缺失 ToolMessage
+    DTC -->> VI: done
+    deactivate DTC
+
+    VI -->> SB: done
+    deactivate VI
+
+    Note right of SB: after_agent 释放沙箱
+    SB -->> UL: done
+    deactivate SB
+
+    UL -->> TD: done
+    deactivate UL
+
+    Note right of MEM: after_agent 入队记忆
+
+    TD -->> U: response
+    deactivate TD
+```
+
+## 洋葱模型
+
+列表位置决定在洋葱中的层级 — 位置 0 最外层，位置 N 最内层：
+
+```
+进入 before_*：   [0] → [1] → [2] → ... → [10] → MODEL
+退出 after_*：    MODEL → [13] → [11] → ... → [6] → [3] → [2] → [0]
+                          ↑ 最内层最先执行
+```
+
+> [!important] 核心规则
+> 列表最后的 middleware，其 `after_model` **最先执行**。
+> ClarificationMiddleware 在列表末尾，所以它第一个拦截 model 输出。
+
+## 对比：真正的洋葱 vs DeerFlow 的实际情况
+
+### 真正的洋葱（如 Koa/Express）
+
+每个 middleware 同时负责 before 和 after，形成对称嵌套：
+
+```mermaid
+sequenceDiagram
+    participant U as User
+    participant A as AuthMiddleware
+    participant L as LogMiddleware
+    participant R as RateLimitMiddleware
+    participant H as Handler
+
+    U ->> A: request
+    activate A
+    Note right of A: before: 校验 token
+
+    A ->> L: next()
+    activate L
+    Note right of L: before: 记录请求时间
+
+    L ->> R: next()
+    activate R
+    Note right of R: before: 检查频率
+
+    R ->> H: next()
+    activate H
+    H -->> R: result
+    deactivate H
+
+    Note right of R: after: 更新计数器
+    R -->> L: result
+    deactivate R
+
+    Note right of L: after: 记录耗时
+    L -->> A: result
+    deactivate L
+
+    Note right of A: after: 清理上下文
+    A -->> U: response
+    deactivate A
+```
+
+> [!tip] 洋葱特征
+> 每个 middleware 都有 before/after 对称操作，`activate` 跨越整个内层执行，形成完美嵌套。
+
+### DeerFlow 的实际情况
+
+不是洋葱，是管道。大部分 middleware 只用一个钩子，不存在对称嵌套。多轮对话时 before_model / after_model 循环执行：
+
+```mermaid
+sequenceDiagram
+    participant U as User
+    participant TD as ThreadData
+    participant UL as Uploads
+    participant SB as Sandbox
+    participant VI as ViewImage
+    participant M as MODEL
+    participant CL as Clarification
+    participant SL as SubagentLimit
+    participant TI as Title
+    participant SM as Summarization
+    participant MEM as Memory
+
+    U ->> TD: invoke
+    Note right of TD: before_agent 创建目录
+    TD ->> UL: .
+    Note right of UL: before_agent 扫描文件
+    UL ->> SB: .
+    Note right of SB: before_agent 获取沙箱
+
+    loop 每轮对话（tool call 循环）
+        SB ->> VI: .
+        Note right of VI: before_model 注入图片
+        VI ->> M: messages + tools
+        M -->> CL: AI response
+        Note right of CL: after_model 拦截 ask_clarification
+        CL -->> SL: .
+        Note right of SL: after_model 截断多余 task
+        SL -->> TI: .
+        Note right of TI: after_model 生成标题
+        TI -->> SM: .
+        Note right of SM: after_model 上下文压缩
+    end
+
+    Note right of SB: after_agent 释放沙箱
+    SB -->> MEM: .
+    Note right of MEM: after_agent 入队记忆
+    MEM -->> U: response
+```
+
+> [!warning] 不是洋葱
+> 14 个 middleware 中只有 SandboxMiddleware 有 before/after 对称（获取/释放）。其余都是单向的：要么只在 `before_*` 做事，要么只在 `after_*` 做事。`before_agent` / `after_agent` 只跑一次，`before_model` / `after_model` 每轮循环都跑。
+
+硬依赖只有 2 处：
+
+1. **ThreadData 在 Sandbox 之前** — sandbox 需要线程目录
+2. **Clarification 在列表最后** — `after_model` 反序时最先执行，第一个拦截 `ask_clarification`
+
+### 结论
+
+| | 真正的洋葱 | DeerFlow 实际 |
+|---|---|---|
+| 每个 middleware | before + after 对称 | 大多只用一个钩子 |
+| 激活条 | 嵌套（外长内短） | 不嵌套（串行） |
+| 反序的意义 | 清理与初始化配对 | 仅影响 after_model 的执行优先级 |
+| 典型例子 | Auth: 校验 token / 清理上下文 | ThreadData: 只创建目录，没有清理 |
+
+## 关键设计点
+
+### ClarificationMiddleware 为什么在列表最后？
+
+位置最后 = `after_model` 最先执行。它需要**第一个**看到 model 输出，检查是否有 `ask_clarification` tool call。如果有，立即中断（`Command(goto=END)`），后续 middleware 的 `after_model` 不再执行。
+
+### SandboxMiddleware 的对称性
+
+`before_agent`（正序第 3 个）获取沙箱，`after_agent`（反序第 1 个）释放沙箱。外层进入 → 外层退出，天然的洋葱对称。
+
+### 大部分 middleware 只用一个钩子
+
+14 个 middleware 中，只有 SandboxMiddleware 同时用了 `before_agent` + `after_agent`（获取/释放）。其余都只在一个阶段执行。洋葱模型的反序特性主要影响 `after_model` 阶段的执行顺序。
@@ -0,0 +1,503 @@
+# RFC: `create_deerflow_agent` — 纯参数的 SDK 工厂 API
+
+## 1. 问题
+
+当前 harness 的唯一公开入口是 `make_lead_agent(config: RunnableConfig)`。它内部：
+
+```
+make_lead_agent
+  ├─ get_app_config()          ← 读 config.yaml
+  ├─ _resolve_model_name()     ← 读 config.yaml
+  ├─ load_agent_config()       ← 读 agents/{name}/config.yaml
+  ├─ create_chat_model(name)   ← 读 config.yaml（反射加载 model class）
+  ├─ get_available_tools()     ← 读 config.yaml + extensions_config.json
+  ├─ apply_prompt_template()   ← 读 skills 目录 + memory.json
+  └─ _build_middlewares()      ← 读 config.yaml（summarization、model vision）
+```
+
+**6 处隐式 I/O** — 全部依赖文件系统。如果你想把 `deerflow-harness` 当 Python 库嵌入自己的应用，你必须准备 `config.yaml` + `extensions_config.json` + skills 目录。这对 SDK 用户是不可接受的。
+
+### 对比
+
+| | `langchain.create_agent` | `make_lead_agent` | `DeerFlowClient`（增强后） |
+|---|---|---|---|
+| 定位 | 底层原语 | 内部工厂 | **唯一公开 API** |
+| 配置来源 | 纯参数 | YAML 文件 | **参数优先，config fallback** |
+| 内置能力 | 无 | Sandbox/Memory/Skills/Subagent/... | **按需组合 + 管理 API** |
+| 用户接口 | `graph.invoke(state)` | 内部使用 | **`client.chat("hello")`** |
+| 适合谁 | 写 LangChain 的人 | 内部使用 | **所有 DeerFlow 用户** |
+
+## 2. 设计原则
+
+### Python 中的 DI 最佳实践
+
+1. **函数参数即注入** — 不读全局状态，所有依赖通过参数传入
+2. **Protocol 定义契约** — 不依赖具体类，依赖行为接口
+3. **合理默认值** — `sandbox=True` 等价于 `sandbox=LocalSandboxProvider()`
+4. **分层 API** — 简单用法一行搞定，复杂用法有逃生舱
+
+### 分层架构
+
+```
+    ┌──────────────────────┐
+    │   DeerFlowClient     │  ← 唯一公开 API（chat/stream + 管理）
+    └──────────┬───────────┘
+    ┌──────────▼───────────┐
+    │   make_lead_agent    │  ← 内部：配置驱动工厂
+    └──────────┬───────────┘
+    ┌──────────▼───────────┐
+    │  create_deerflow_agent   │  ← 内部：纯参数工厂
+    └──────────┬───────────┘
+    ┌──────────▼───────────┐
+    │ langchain.create_agent│  ← 底层原语
+    └──────────────────────┘
+```
+
+`DeerFlowClient` 是唯一公开 API。`create_deerflow_agent` 和 `make_lead_agent` 都是内部实现。
+
+用户通过 `DeerFlowClient` 三个参数控制行为：
+
+| 参数 | 类型 | 职责 |
+|------|------|------|
+| `config` | `dict` | 覆盖 config.yaml 的任意配置项 |
+| `features` | `RuntimeFeatures` | 替换内置 middleware 实现 |
+| `extra_middleware` | `list[AgentMiddleware]` | 新增用户 middleware |
+
+不传参数 → 读 config.yaml（现有行为，完全兼容）。
+
+### 核心约束
+
+- **配置覆盖** — `config` dict > config.yaml > 默认值
+- **三层不重叠** — config 传参数，features 传实例，extra_middleware 传新增
+- **向前兼容** — 现有 `DeerFlowClient()` 无参构造行为不变
+- **harness 边界合规** — 不 import `app.*`（`test_harness_boundary.py` 强制）
+
+## 3. API 设计
+
+### 3.1 `DeerFlowClient` — 唯一公开 API
+
+在现有构造函数上增加三个可选参数：
+
+```python
+from deerflow.client import DeerFlowClient
+from deerflow.agents.features import RuntimeFeatures
+
+client = DeerFlowClient(
+    # 1. config — 覆盖 config.yaml 的任意 key（结构和 yaml 一致）
+    config={
+        "models": [{"name": "gpt-4o", "use": "langchain_openai:ChatOpenAI", "model": "gpt-4o", "api_key": "sk-..."}],
+        "memory": {"max_facts": 50, "enabled": True},
+        "title": {"enabled": False},
+        "summarization": {"enabled": True, "trigger": [{"type": "tokens", "value": 10000}]},
+        "sandbox": {"use": "deerflow.sandbox.local:LocalSandboxProvider"},
+    },
+
+    # 2. features — 替换内置 middleware 实现
+    features=RuntimeFeatures(
+        memory=MyMemoryMiddleware(),
+        auto_title=MyTitleMiddleware(),
+    ),
+
+    # 3. extra_middleware — 新增用户 middleware
+    extra_middleware=[
+        MyAuditMiddleware(),       # @Next(SandboxMiddleware)
+        MyFilterMiddleware(),      # @Prev(ClarificationMiddleware)
+    ],
+)
+```
+
+三种典型用法：
+
+```python
+# 用法 1：全读 config.yaml（现有行为，不变）
+client = DeerFlowClient()
+
+# 用法 2：只改参数，不换实现
+client = DeerFlowClient(config={"memory": {"max_facts": 50}})
+
+# 用法 3：替换 middleware 实现
+client = DeerFlowClient(features=RuntimeFeatures(auto_title=MyTitleMiddleware()))
+
+# 用法 4：添加自定义 middleware
+client = DeerFlowClient(extra_middleware=[MyAuditMiddleware()])
+
+# 用法 5：纯 SDK（无 config.yaml）
+client = DeerFlowClient(config={
+    "models": [{"name": "gpt-4o", "use": "langchain_openai:ChatOpenAI", ...}],
+    "tools": [{"name": "bash", "use": "deerflow.sandbox.tools:bash_tool", "group": "bash"}],
+    "memory": {"enabled": True},
+})
+```
+
+内部实现：`final_config = deep_merge(file_config, code_config)`
+
+### 3.2 `create_deerflow_agent` — 内部工厂（不公开）
+
+```python
+def create_deerflow_agent(
+    model: BaseChatModel,
+    tools: list[BaseTool] | None = None,
+    *,
+    system_prompt: str | None = None,
+    middleware: list[AgentMiddleware] | None = None,
+    features: RuntimeFeatures | None = None,
+    state_schema: type | None = None,
+    checkpointer: BaseCheckpointSaver | None = None,
+    name: str = "default",
+) -> CompiledStateGraph:
+    ...
+```
+
+`DeerFlowClient` 内部调用此函数。
+
+### 3.3 `RuntimeFeatures` — 内置 Middleware 替换
+
+只做一件事：用自定义实例替换内置 middleware。不管配置参数（参数走 `config` dict）。
+
+```python
+@dataclass
+class RuntimeFeatures:
+    sandbox: bool | AgentMiddleware = True
+    memory: bool | AgentMiddleware = False
+    summarization: bool | AgentMiddleware = False
+    subagent: bool | AgentMiddleware = False
+    vision: bool | AgentMiddleware = False
+    auto_title: bool | AgentMiddleware = False
+```
+
+| 值 | 含义 |
+|---|---|
+| `True` | 使用默认 middleware（参数从 config 读） |
+| `False` | 关闭该功能 |
+| `AgentMiddleware` 实例 | 替换整个实现 |
+
+不再有 `MemoryOptions`、`TitleOptions` 等。参数调整走 `config` dict：
+
+```python
+# 改 memory 参数 → config
+client = DeerFlowClient(config={"memory": {"max_facts": 50}})
+
+# 换 memory 实现 → features
+client = DeerFlowClient(features=RuntimeFeatures(memory=MyMemoryMiddleware()))
+
+# 两者组合 — config 参数给默认 middleware，但 title 换实现
+client = DeerFlowClient(
+    config={"memory": {"max_facts": 50}},
+    features=RuntimeFeatures(auto_title=MyTitleMiddleware()),
+)
+```
+
+### 3.4 Middleware 链组装
+
+不使用 priority 数字排序。按固定顺序 append 构建列表：
+
+```python
+def _resolve(spec, default_cls):
+    """bool → 默认实现 / AgentMiddleware → 替换"""
+    if isinstance(spec, AgentMiddleware):
+        return spec
+    return default_cls()
+
+def _assemble_from_features(feat: RuntimeFeatures, config: AppConfig) -> tuple[list, list]:
+    chain = []
+    extra_tools = []
+
+    if feat.sandbox:
+        chain.append(_resolve(feat.sandbox, ThreadDataMiddleware))
+        chain.append(UploadsMiddleware())
+        chain.append(_resolve(feat.sandbox, SandboxMiddleware))
+
+    chain.append(DanglingToolCallMiddleware())
+    chain.append(ToolErrorHandlingMiddleware())
+
+    if feat.summarization:
+        chain.append(_resolve(feat.summarization, SummarizationMiddleware))
+    if config.title.enabled and feat.auto_title is not False:
+        chain.append(_resolve(feat.auto_title, TitleMiddleware))
+    if feat.memory:
+        chain.append(_resolve(feat.memory, MemoryMiddleware))
+    if feat.vision:
+        chain.append(ViewImageMiddleware())
+        extra_tools.append(view_image_tool)
+    if feat.subagent:
+        chain.append(_resolve(feat.subagent, SubagentLimitMiddleware))
+        extra_tools.append(task_tool)
+    if feat.loop_detection:
+        chain.append(_resolve(feat.loop_detection, LoopDetectionMiddleware))
+
+    # 插入 extra_middleware（按 @Next/@Prev 声明定位）
+    _insert_extra(chain, extra_middleware)
+
+    # Clarification 永远最后
+    chain.append(ClarificationMiddleware())
+    extra_tools.append(ask_clarification_tool)
+
+    return chain, extra_tools
+```
+
+### 3.6 Middleware 排序策略
+
+**两阶段排序：内置固定 + 外置插入**
+
+1. **内置链固定顺序** — 按代码中的 append 顺序确定，不参与 @Next/@Prev
+2. **外置 middleware 插入** — `extra_middleware` 中的 middleware 通过 @Next/@Prev 声明锚点，自由锚定任意 middleware（内置或其他外置均可）
+3. **冲突检测** — 两个外置 middleware 如果 @Next 或 @Prev 同一个目标 → `ValueError`
+
+**这不是全排序。** 内置链的顺序在代码中已确定，外置 middleware 只做插入操作。这样可以避免内置和外置同时竞争同一个位置的问题。
+
+### 3.7 `@Next` / `@Prev` 装饰器
+
+用户自定义 middleware 通过装饰器声明在链中的位置，类型安全：
+
+```python
+from deerflow.agents import Next, Prev
+
+@Next(SandboxMiddleware)
+class MyAuditMiddleware(AgentMiddleware):
+    """排在 SandboxMiddleware 后面"""
+    def before_agent(self, state, runtime):
+        ...
+
+@Prev(ClarificationMiddleware)
+class MyFilterMiddleware(AgentMiddleware):
+    """排在 ClarificationMiddleware 前面"""
+    def after_model(self, state, runtime):
+        ...
+```
+
+实现：
+
+```python
+def Next(anchor: type[AgentMiddleware]):
+    """装饰器：声明本 middleware 排在 anchor 的下一个位置。"""
+    def decorator(cls: type[AgentMiddleware]) -> type[AgentMiddleware]:
+        cls._next_anchor = anchor
+        return cls
+    return decorator
+
+def Prev(anchor: type[AgentMiddleware]):
+    """装饰器：声明本 middleware 排在 anchor 的前一个位置。"""
+    def decorator(cls: type[AgentMiddleware]) -> type[AgentMiddleware]:
+        cls._prev_anchor = anchor
+        return cls
+    return decorator
+```
+
+`_insert_extra` 算法：
+
+1. 遍历 `extra_middleware`，读取每个 middleware 的 `_next_anchor` / `_prev_anchor`
+2. **冲突检测**：如果两个外置 middleware 的锚点相同（同方向同目标），抛出 `ValueError`
+3. 有锚点的 middleware 插入到目标位置（@Next → 目标之后，@Prev → 目标之前）
+4. 无声明的 middleware 追加到 Clarification 之前
+
+## 4. Middleware 执行模型
+
+### LangChain 的执行规则
+
+```
+before_agent 正序 →  [0] → [1] → ... → [N]
+before_model 正序 →  [0] → [1] → ... → [N]  ← 每轮循环
+         MODEL
+after_model 反序 ←   [N] → [N-1] → ... → [0]  ← 每轮循环
+after_agent 反序 ←   [N] → [N-1] → ... → [0]
+```
+
+`before_agent` / `after_agent` 只跑一次。`before_model` / `after_model` 每轮 tool call 循环都跑。
+
+### DeerFlow 的实际情况
+
+**不是洋葱，是管道。** 11 个 middleware 中只有 SandboxMiddleware 有 before/after 对称（获取/释放），其余只用一个钩子。
+
+硬依赖只有 2 处：
+1. **ThreadData 在 Sandbox 之前** — sandbox 需要线程目录
+2. **Clarification 在列表最后** — after_model 反序时最先执行，第一个拦截 `ask_clarification`
+
+详见 [middleware-execution-flow.md](middleware-execution-flow.md)。
+
+## 5. 使用示例
+
+### 5.1 全读 config.yaml（现有行为不变）
+
+```python
+from deerflow.client import DeerFlowClient
+
+client = DeerFlowClient()
+response = client.chat("Hello")
+```
+
+### 5.2 覆盖配置参数
+
+```python
+client = DeerFlowClient(config={
+    "memory": {"max_facts": 50},
+    "title": {"enabled": False},
+    "summarization": {"trigger": [{"type": "tokens", "value": 10000}]},
+})
+```
+
+### 5.3 纯 SDK（无 config.yaml）
+
+```python
+client = DeerFlowClient(config={
+    "models": [{"name": "gpt-4o", "use": "langchain_openai:ChatOpenAI", "model": "gpt-4o", "api_key": "sk-..."}],
+    "tools": [
+        {"name": "bash", "group": "bash", "use": "deerflow.sandbox.tools:bash_tool"},
+        {"name": "web_search", "group": "web", "use": "deerflow.community.tavily.tools:web_search_tool"},
+    ],
+    "memory": {"enabled": True, "max_facts": 50},
+    "sandbox": {"use": "deerflow.sandbox.local:LocalSandboxProvider"},
+})
+```
+
+### 5.4 替换内置 middleware
+
+```python
+from deerflow.agents.features import RuntimeFeatures
+
+client = DeerFlowClient(
+    features=RuntimeFeatures(
+        memory=MyMemoryMiddleware(),       # 替换
+        auto_title=MyTitleMiddleware(),    # 替换
+        vision=False,                      # 关闭
+    ),
+)
+```
+
+### 5.5 插入自定义 middleware
+
+```python
+from deerflow.agents import Next, Prev
+from deerflow.sandbox.middleware import SandboxMiddleware
+from deerflow.agents.middlewares.clarification_middleware import ClarificationMiddleware
+
+@Next(SandboxMiddleware)
+class MyAuditMiddleware(AgentMiddleware):
+    def before_agent(self, state, runtime):
+        log_sandbox_acquired(state)
+
+@Prev(ClarificationMiddleware)
+class MyFilterMiddleware(AgentMiddleware):
+    def after_model(self, state, runtime):
+        filter_sensitive_output(state)
+
+client = DeerFlowClient(
+    extra_middleware=[MyAuditMiddleware(), MyFilterMiddleware()],
+)
+```
+
+## 6. Phase 1 限制
+
+当前实现中以下 middleware 内部仍读 `config.yaml`，SDK 用户需注意：
+
+| Middleware | 读取内容 | Phase 2 解决方案 |
+|------------|---------|-----------------|
+| TitleMiddleware | `get_title_config()` + `create_chat_model()` | `TitleOptions(model=...)` 参数覆盖 |
+| MemoryMiddleware | `get_memory_config()` | `MemoryOptions(...)` 参数覆盖 |
+| SandboxMiddleware | `get_sandbox_provider()` | `SandboxProvider` 实例直传 |
+
+Phase 1 中 `auto_title` 默认为 `False` 以避免无 config 时崩溃。其他有 config 依赖的 feature 默认也为 `False`。
+
+## 7. 迁移路径
+
+```
+Phase 1（当前 PR #1203）:
+  ✓ 新增 create_deerflow_agent + RuntimeFeatures（内部 API）
+  ✓ 不改 DeerFlowClient 和 make_lead_agent
+  ✗ middleware 内部仍读 config（已知限制）
+
+Phase 2（#1380）:
+  - DeerFlowClient 构造函数增加可选参数（model, tools, features, system_prompt）
+  - Options 参数覆盖 config（MemoryOptions, TitleOptions 等）
+  - @Next/@Prev 装饰器
+  - 补缺失 middleware（Guardrail, TokenUsage, DeferredToolFilter）
+  - make_lead_agent 改为薄壳调 create_deerflow_agent
+
+Phase 3:
+  - SDK 文档和示例
+  - deerflow.client 稳定 API
+```
+
+## 8. 设计决议
+
+| 问题 | 决议 | 理由 |
+|------|------|------|
+| 公开 API | `DeerFlowClient` 唯一入口 | 自顶向下，先改现有 API 再抽底层 |
+| create_deerflow_agent | 内部实现，不公开 | 用户不需要接触 CompiledStateGraph |
+| 配置覆盖 | `config` dict，和 config.yaml 结构一致 | 无新概念，deep merge 覆盖 |
+| middleware 替换 | `features=RuntimeFeatures(memory=MyMW())` | bool 开关 + 实例替换 |
+| middleware 扩展 | `extra_middleware` 独立参数 | 和内置 features 分开 |
+| middleware 定位 | `@Next/@Prev` 装饰器 | 类型安全，不暴露排序细节 |
+| 排序机制 | 顺序 append + @Next/@Prev | priority 数字无功能意义 |
+| 运行时开关 | 保留 `RunnableConfig` | plan_mode、thread_id 等按请求切换 |
+
+## 9. 附录：Middleware 链
+
+```mermaid
+graph TB
+    subgraph BA ["before_agent 正序"]
+        direction TB
+        TD["ThreadData<br/>创建目录"] --> UL["Uploads<br/>扫描文件"] --> SB["Sandbox<br/>获取沙箱"]
+    end
+
+    subgraph BM ["before_model 正序 每轮"]
+        direction TB
+        VI["ViewImage<br/>注入图片"]
+    end
+
+    SB --> VI
+    VI --> M["MODEL"]
+
+    subgraph AM ["after_model 反序 每轮"]
+        direction TB
+        CL["Clarification<br/>拦截中断"] --> LD["LoopDetection<br/>检测循环"] --> SL["SubagentLimit<br/>截断 task"] --> TI["Title<br/>生成标题"] --> DTC["DanglingToolCall<br/>补缺失消息"]
+    end
+
+    M --> CL
+
+    subgraph AA ["after_agent 反序"]
+        direction TB
+        SBR["Sandbox<br/>释放沙箱"] --> MEM["Memory<br/>入队记忆"]
+    end
+
+    DTC --> SBR
+
+    classDef beforeNode fill:#a0a8b5,stroke:#636b7a,color:#2d3239
+    classDef modelNode fill:#b5a8a0,stroke:#7a6b63,color:#2d3239
+    classDef afterModelNode fill:#b5a0a8,stroke:#7a636b,color:#2d3239
+    classDef afterAgentNode fill:#a0b5a8,stroke:#637a6b,color:#2d3239
+
+    class TD,UL,SB,VI beforeNode
+    class M modelNode
+    class CL,LD,SL,TI,DTC afterModelNode
+    class SBR,MEM afterAgentNode
+```
+
+硬依赖：
+- ThreadData → Uploads → Sandbox（before_agent 阶段）
+- Clarification 必须在列表最后（after_model 反序时最先执行）
+
+## 10. 主 Agent 与 Subagent 的 Middleware 差异
+
+主 agent 和 subagent 共享基础 middleware 链（`_build_runtime_middlewares`），subagent 在此基础上做精简：
+
+| Middleware | 主 Agent | Subagent | 说明 |
+|------------|:-------:|:--------:|------|
+| ThreadDataMiddleware | ✓ | ✓ | 共享：创建线程目录 |
+| UploadsMiddleware | ✓ | ✗ | 主 agent 独有：扫描上传文件 |
+| SandboxMiddleware | ✓ | ✓ | 共享：获取/释放沙箱 |
+| DanglingToolCallMiddleware | ✓ | ✗ | 主 agent 独有：补缺失 ToolMessage |
+| GuardrailMiddleware | ✓ | ✓ | 共享：工具调用授权（可选） |
+| ToolErrorHandlingMiddleware | ✓ | ✓ | 共享：工具异常处理 |
+| SummarizationMiddleware | ✓ | ✗ | |
+| TodoMiddleware | ✓ | ✗ | |
+| TitleMiddleware | ✓ | ✗ | |
+| MemoryMiddleware | ✓ | ✗ | |
+| ViewImageMiddleware | ✓ | ✗ | |
+| SubagentLimitMiddleware | ✓ | ✗ | |
+| LoopDetectionMiddleware | ✓ | ✗ | |
+| ClarificationMiddleware | ✓ | ✗ | |
+
+**设计原则**：
+- `RuntimeFeatures`、`@Next/@Prev`、排序机制只作用于**主 agent**
+- Subagent 链短且固定（4 个），不需要动态组装
+- `extra_middleware` 当前只影响主 agent，不传递给 subagent