Multi-Agent Workflow Blueprint

角色是基础积木，流程是建筑图纸。后续发展重点不是加更多积木，而是把积木做得更清晰、更轻、更稳，再把流程编排得更合理。

总纲

少角色，强流程；轻约束 Coder，强门禁与强验收；少依赖 worker 自觉，多依赖流程关卡与交付协议。

一、角色积木

角色按"基础能力原语"理解，不按"组织岗位"扩张。不因为一个新问题就加一个新基础角色。

Leader — 控制核

定义边界、路由、裁决、验收、合并、收口
掌握完整项目上下文（项目为什么这样、架构为什么这样）
可以改代码，但不从零写大段基础功能
所有 agent 间通信必须经 Leader 中转
最终解释权和验收权不可分割

Coder — 实现引擎

给它 change、目标、边界、红线，自行决定实现路径
Leader 不该给过多实现层约束（"只说做什么，不说怎么做"）
默认被视为高能力实现者，不是低能力施工队
在不同流程环节承担不同职责（实现 / 审查 change / 等），通过 skill 切换

Debug — 修复引擎

发现问题直接修，不只是报告（"谁发现谁修"）
三种工作场景：审查 Coder 代码（apply）、定点修复 bug（verify）、验收 Leader 修改（讨论轮次）
不是"大一统质量委员"，主责是正确性、边界条件、错误处理、回归问题
Debug-Duel 是 Debug 的一种流程化使用方式，不是独立角色

Tester — 验证引擎

只在 Leader 验收通过后才介入
负责最终运行验证和回归确认
发现 bug 不直接修，报回 Leader 路由
不写功能代码

二、流程图纸

真正可演进的是流程层，不是角色层。新需求优先改流程或加流程环节，不优先造新角色。

总流程

Generate Change
     │
     ▼
agent-change-review          ← 审 change 本身（新增）
  Leader 并行审（全局视角）
  Coder 并行审（实现视角，worktree）
  两者都能直接改 change 产出物
  Leader 合并、汇总判断
     │
     │  用户决定进入
     ▼
agent-apply                  ← Coder 实现 + Debug 审查
  Coder 实现（轻输入，保持实现自由）
  Debug 审查 + 修复
  可选：切换到 duel 模式替代 Debug 审查
     │
     │  用户决定进入
     ▼
agent-verify                 ← Leader 工程化验收 + Tester 验证
  Leader 验收（6 维）
  4 类路由
  Tester 最终运行验证

环节之间由用户操控衔接，不需要自动冻结机制。

agent-change-review（新增）

目标： 审 change 产出物（proposal/design/specs/tasks）是否能安全进入实现。

参与者： Leader + Coder（并行）

Leader 视角：

全局上下文、项目方向、架构边界
术语一致性
变更范围是否合理
发现问题 → 直接改 change 产出物 → 说明原因

Coder 视角：

读 change + 代码现状
实现可行性、任务粒度、隐性依赖、边界条件
发现问题 → 直接改 change 产出物 → 说明原因

合并： Leader 收到 Coder 结果后合并（复用现有 worktree merge 模式）。

吸收 figuretu/my-skills 精华：

来源仓库：https://github.com/figuretu/my-skills

代码驱动审查（from spec-review-with-codex）
- 审 change 时不能只看文档，必须独立探索项目代码
- 探索范围：项目元信息、相关模块现有实现、接口与类型定义、测试代码、相似功能
- 以代码现状为基准评判 spec，而不是凭文档想象
- 审查维度按优先级：完整性(CRITICAL) > 一致性(HIGH) > 代码对齐(HIGH) > 清晰度(HIGH) > 可行性(MEDIUM) > 范围(MEDIUM) > 可维护性(LOW)
结构化问题格式（from spec-review-with-codex）
- 每个发现的问题必须包含四要素：位置 / 问题 / 影响 / 建议
- 按 severity 从高到低排列
- 跨产出物对齐检查：proposal→specs→design→tasks 是否链路完整
协作纪律（from cooperation-with-codex）
- 每次委派前做 checkpoint，便于回滚
- 审查时读完整文件，不只看 diff
- 对 worker 输出做批判性评估，把它当同事，不当权威
前置决策（from code-review-with-codex）
- 正式审查前先判断审查范围、获取方式、匹配编码规范
- 不是一上来就审，而是先确定"这次到底该怎么审"
- 适合作为 Leader 在各环节的前置步骤
显式自检清单（from preferred-coding-style）
- 把注释风格、命名规范、反模式识别写成显式可检查规则
- 反模式清单：翻译代码式注释、AI 味模板注释、废话注释、过度注释
- 规范不只寄托在 Leader 临场感觉上，而是固化成可复用 skill/checklist
Skill 设计原则（from skill-crud）
- Skill 不是长 prompt，而是角色操作契约 + 可复用资源集合
- 三级渐进加载：metadata（始终在上下文）→ SKILL.md（触发时加载）→ references/scripts/assets（按需加载）
- Skill 结构：SKILL.md + scripts/ + references/ + assets/
- 保持 SKILL.md 精简，详细参考资料放到 references/ 下

agent-apply（现有，微调）

补充规则：

Leader 给 Coder 的输入保持"轻而硬"：只给 change、边界、风险点、不可碰红线，不给实现方案
Coder 保持实现自由，交付必须结构化（复用 nanoworker JSON 输出）
Debug 继续承担"谁发现谁修"，质量回收在后置审查，不在前置微操

agent-apply-duel 定位：

agent-apply 中 Debug 审查的可选替代，不是独立主线
不默认全开，只在高风险场景启用
触发场景：核心域逻辑、权限/鉴权/安全、跨模块公共接口、并发/状态/缓存、数据迁移

agent-verify（现有，待升级）

Leader 验收升级为 6 维：

维度	检查内容
范围一致性	有没有超 scope 或漏 scope
功能覆盖	spec / task 是否真正落地
正确性	正常流、边界、异常是否合理
命名/术语/用词	是否与项目语义一致、是否准确
结构合理性	文件是否膨胀、职责是否混杂、是否应拆分
可维护性	未来改动会不会越来越难

路由从 2 类扩到 4 类：

问题类型	路由
缺功能 / 实现未落地	回 agent-apply
明确 bug / 回归问题	走 Debug 修复
结构 / 命名 / 维护性	Leader 判断小修还是回 agent-apply
规格 / 变更定义有问题	回 agent-change-review

三、核心制度

1. 对 Coder：轻输入，不轻验收

Coder 默认是高能力实现者
Leader 不提前把实现方案说满，只定义目标、边界、红线和验收标准
系统通过后置审查保证质量，不通过前置细化指令限制创造力
多 agent 的优势：前面可以放开一点，后面用 Debug、Leader、Tester 把结果筛到足够稳

2. 不信 worker 一定会完整读文件

真正关键的信息，不只寄托在长 prompt 上
尽量变成流程里不可绕过的关卡：Leader 验收、Tester 最终验证、结构化交付协议
给 worker 的输入尽量短而硬（任务包，不是大段背景文）
重要检查放在后置门，不是只放前置提示

3. 主线是流程，辅线是底座工程

主线：agent-change-review → agent-apply → agent-verify
辅线：nanoworker 控制面硬化（工具边界、结果语义、交付协议）
流程层先稳定，底座层再补强

四、推进顺序

Phase 1：补流程主骨架

新增 agent-change-review 流程规范
定义 Leader + Coder 在此环节的分工与合并方式

Phase 2：升级 agent-verify

Leader 验收从"代码正确性"扩到"工程质量验收"（6 维）
路由分类从 2 类扩到 4 类
结构 / 命名 / 可维护性进入正式验收项

Phase 3：硬化底座协议

统一 JSON 输出 schema
修正 status 语义（如 max_iterations 不应返回 success=True）
files_changed 追踪更可靠
角色工具边界更严格（如 Tester 的 write 权限）

Phase 4：策略调优（靠数据）

什么时候启 agent-apply-duel
哪类任务值得并行
哪类任务 change-review 要更重
指标：一次通过率、回流率、Debug 挽救率、Tester 拦截率、wall-clock、token 成本

五、明确不做什么

不因为一个新问题就加一个新基础角色
不让 Leader 膨胀成"实现方案总指挥"
不默认所有任务都开 duel
不在这一轮展开 AI-CONTEXT 体系重构

六、背景与演进脉络

本规划源自对现有多 agent 协作体系的完整复盘与讨论，核心洞察：

从 OpenClaw 到 nanoworker：早期用 OpenClaw 作为副 agent，发现它自带 1w token 上下文、负担过大；魔改 nanobot 的 spawn 功能，独立为 CLI 调用，去掉非编程部分，每次调用全新会话避免上下文污染
从单 agent 到四角色：单 agent 上下文会把自己带偏，不是智力问题而是上下文污染问题；拆成 Leader/Coder/Debug/Tester 四个基础角色，各司其职
从"多角色"到"少角色强流程"：角色数不是越多越好，真正要演进的是流程编排和门禁机制
从"信任 worker"到"信任流程"：系统可靠性模型从信任个体翻转到信任流程关卡与交付协议

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Multi-Agent Workflow Blueprint

总纲

一、角色积木

Leader — 控制核

Coder — 实现引擎

Debug — 修复引擎

Tester — 验证引擎

二、流程图纸

总流程

agent-change-review（新增）

agent-apply（现有，微调）

agent-verify（现有，待升级）

三、核心制度

1. 对 Coder：轻输入，不轻验收

2. 不信 worker 一定会完整读文件

3. 主线是流程，辅线是底座工程

四、推进顺序

Phase 1：补流程主骨架

Phase 2：升级 agent-verify

Phase 3：硬化底座协议

Phase 4：策略调优（靠数据）

五、明确不做什么

六、背景与演进脉络

FilesExpand file tree

BLUEPRINT.md

Latest commit

History

BLUEPRINT.md

File metadata and controls

Multi-Agent Workflow Blueprint

总纲

一、角色积木

Leader — 控制核

Coder — 实现引擎

Debug — 修复引擎

Tester — 验证引擎

二、流程图纸

总流程

agent-change-review（新增）

agent-apply（现有，微调）

agent-verify（现有，待升级）

三、核心制度

1. 对 Coder：轻输入，不轻验收

2. 不信 worker 一定会完整读文件

3. 主线是流程，辅线是底座工程

四、推进顺序

Phase 1：补流程主骨架

Phase 2：升级 agent-verify

Phase 3：硬化底座协议

Phase 4：策略调优（靠数据）

五、明确不做什么

六、背景与演进脉络