FlowKit - Flow 轻量编排

Flow Skill 是 FlowKit 的轻量编排引擎,将多个技能串联为”优化 → 思考 → 规划 → 执行”管道,通过参数灵活控制每个阶段。
本文是 FlowKit 系列教程第四篇。

GitHub: FrizzleFur/flowkit | 系列导航

目录


整体流程

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
用户输入 (任务表述)


┌─────────────────────┐
│ Stage 1: Prompt 优化 │ --no-prompt 跳过
│ 调用 /prompt 技能 │
└─────────┬───────────┘
│ 优化后的任务表述

┌─────────────────────┐
│ Stage 1.5: 需求探索 │ 条件触发(3+ 不确定项时)
│ AskUserQuestion │
└─────────┬───────────┘
│ 明确后的任务表述

┌─────────────────────┐
│ Stage 2: 深度思考 │ --think / --mermaid / --discuss
│ (可选预处理) │ 默认跳过,按需开启
└─────────┬───────────┘
│ 深度分析结论

┌─────────────────────┐
│ Stage 3: 确定性规划 │ --no-plan 跳过
│ EnterPlanMode │ Plan Mode 默认启用
│ planning-with-files │
└─────────┬───────────┘
│ task_plan.md / findings.md / progress.md

┌─────────────────────┐
│ Stage 3.5: Plan Review│ --plan-review 启用
│ 独立 Agent 审查 │ 消除沉没成本偏差
└─────────┬───────────┘
│ 审查报告 + 用户确认

┌─────────────────────┐
│ Stage 4: 并发执行 │ --no-multi 改为串行
│ /multi-agent │ 含退回 Plan 协议
└─────────┬───────────┘


┌─────────────────────┐
│ Stage 5: 完成验证 │ --no-verify 跳过
│ verification │ 新鲜证据铁律
└─────────┬───────────┘


┌─────────────────────┐
│ Stage 5.5: 迭代优化 │ --iterate N 启用
│ auto-iterate │ keep/revert 循环
└─────────────────────┘

Stage 1: Prompt 优化

调用: /prompt <任务表述>(系列教程 Part 2 介绍的评分工具)

大多数任务描述质量堪忧 —— “帮我重构一下这个模块”这样的描述太模糊。Stage 1 先对任务表述评分和优化,确保后续阶段有清晰的输入。

  • 评分 >= 8/10 → 提示用户原始表述已足够好,询问是否跳过
  • 评分 < 8/10 → 自动优化,生成更清晰的版本

跳过: --no-prompt

Stage 1.5: 需求探索

触发条件: Stage 1 完成后,存在 3+ 不确定项或明确度 < 7 的关键决策点。

不是所有任务都需要这一步。当你明确说”重构支付模块”且范围清晰时,直接进入 Stage 2。但当任务模糊(”优化一下用户体验”)或涉及多个技术选型时,先追问。

追问要点: 问题要具体,每个问题提供 3-4 选项含推荐默认值。

  • “支持哪些登录方式?邮箱+密码 / OAuth2 / 手机号?” (推荐: 邮箱+OAuth2)
  • “数据库选型?PostgreSQL / MySQL / MongoDB?” (推荐: PostgreSQL)

跳过: 不确定项 < 3 或所有不确定项明确度 >= 7

Stage 2: 深度思考

三个可选的预处理工具,按需组合:

–think / –think-hard

调用 Sequential Thinking MCP 进行结构化思考,覆盖 6 个维度:

  1. 任务分解 → 2. 依赖分析 → 3. 风险评估 → 4. 资源需求 → 5. 执行策略 → 6. 技能匹配

--think 使用 4K 上下文,--think-hard 使用 10K(更深度分析)。

–mermaid

生成任务结构的可视化图表(架构图 / 依赖关系图 / 执行流程图)。

–discuss

三角色讨论模式,根据任务类型自动匹配角色,经两轮讨论后综合最佳方案。

全部跳过: Stage 2 默认不启用(这是 /flow 轻量化的体现)。需要显式指定参数。

Stage 3: 确定性规划

核心纪律: “先想后做” —— 进入 Plan Mode(只读沙箱)。

Plan Mode 的约束

1
2
可以: Read、Glob、Grep、AskUserQuestion、写 plan 文件
不可以: Edit、Write(项目文件)、Bash、修改代码库

Plan Mode 的价值不是限制能力,而是防止”边想边改”的冲动。在只读模式下,Agent 被迫先完成设计再动手。

规划输出

  • task_plan.md — 分阶段任务计划
  • findings.md — 研究发现
  • progress.md — 执行进度追踪

规划要点:

  • 每个 Phase 标注可否并行
  • Phase 间依赖关系要明确
  • 每个 Phase 有明确完成标准

跳过: --no-plan

Stage 3.5: Plan Review

为什么用独立 Agent 审查? 消除沉没成本偏差。第一个 Claude 花了很多时间设计 Plan,心理上不愿推翻。审查 Agent(全新上下文)没有这个包袱,更容易发现盲点。

审查维度:

  • 架构合理性
  • 遗漏边界情况
  • 安全风险
  • 性能影响
  • Plan 假设验证
  • 可执行性

用户决策:APPROVED / APPROVED_WITH_NOTES / NEEDS_REVISION

跳过: 不使用 --plan-review 参数

Stage 4: 并发执行

调用: /multi-agent 技能(系列教程 Part 3 介绍的并行引擎)

识别可并行的子任务组,为每个子任务分配合适的 Agent 类型,并发启动执行。

按需注入技能指令:

  • --tdd: Agent 注入 TDD 工作流
  • --review: 完成后触发代码审查

串行替代: --no-multi 在当前会话中按 task_plan.md 顺序执行。

Stage 5: 完成验证

铁律: No completion claims without fresh verification evidence.

禁止 “should work”、”probably”、”应该可以了”。必须运行验证命令并展示实际输出。

跳过: --no-verify

退回 Plan 协议

执行中遇到意外时的处理框架:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
执行遇到异常

├─ 小偏差 ────────────▶ 直接修复,继续

├─ Plan 假设有误 ─────▶ Plan Fallback
│ │
│ 暂停执行
│ 记录偏差
│ 更新 Plan
│ 用户确认
│ 继续执行

└─ 同一 Phase 失败 2 次


退回 Stage 2 重新分析

核心理念: 遇到意外时,第一反应是”Plan 哪里假设错了”,而不是”让我直接修”。

参数速查

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
/flow [options] <任务表述>

阶段控制:
--no-prompt 跳过 Stage 1
--no-plan 跳过 Stage 3
--no-multi 跳过 Stage 4(串行执行)

思考增强:
--think Sequential Thinking (4K)
--think-hard Sequential Thinking (10K)
--mermaid Mermaid 图可视化
--discuss 三角色讨论

Plan 质量:
--strict-plan Stage 3 进入 Plan Mode(默认开)
--plan-review Stage 3.5 独立 Agent 审查
--code-plan Stage 3.6 代码级细化

执行控制:
--tdd Agent 注入 TDD 工作流
--review 代码实现完成后审查

迭代增强:
--iterate N Stage 5.5 迭代 N 轮
--guard <cmd> 迭代防回归命令
--ralph Stage 5.7 Ralph Loop

预设(互斥):
--quick ≡ --no-prompt --no-plan --no-multi
--standard 完整三步流程(默认)
--deep ≡ --think --mermaid --discuss + 并行分发

系列导航

FlowKit 系列教程

# 文章 内容
1 总览:AI 原生工作流编排的设计哲学 动机、架构、Iron Laws、社区对比
2 Prompt 量化评分:乔哈里视窗 x 3S 原则 四象限、3S、7维评分、第四象限陷阱
3 Multi-Agent 协作:tmux 分屏并行引擎 角色匹配、文件隔离、Phase复用
4 Flow 轻量编排:5 阶段管道按需启用 Stage流程、Plan Mode、Fallback协议
5 Flow-Deep 深度管道:全量质量保障引擎 Plan Review、Auto-Decide、STATE.md、Ralph Loop

FlowKit 使用 MIT 协议开源。如果对 AI Agent 工作流编排感兴趣,欢迎 Star 和交流。

文章作者: MichaelMao
文章链接: http://michaelmaomao.github.io/2026/05/26/FlowKit-Flow%E8%BD%BB%E9%87%8F%E7%BC%96%E6%8E%92/
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 MMao
我要吐槽下