OpenClaw + Codex Agent Swarm:一人开发团队完整搭建指南
我不再直接使用 Codex 或 Claude Code 了。
我用 OpenClaw 作为编排层。我的编排 Agent Zoe 负责派生子 Agent、编写 prompt、为每个任务选择合适的模型、监控进度,并在 PR 准备好合并时通过 Telegram 通知我。
过去 4 周的数据:
- 单日 94 次 commit。 我最高产的一天——当天有 3 个客户电话,我一次编辑器都没打开。日均约 50 次 commit。
- 30 分钟内 7 个 PR。 从想法到生产极快,因为编码和验证基本全自动化。
- Commits → MRR: 我用这套系统构建真实的 B2B SaaS——配合创始人主导的销售,当天交付大多数功能请求。速度把潜在客户转化成付费用户。
我的 git 历史看起来像刚雇了一个开发团队。实际上只有我一个人——从直接管理 Claude Code,进化到用 OpenClaw Agent 管理一批 Claude Code 和 Codex Agent。
成功率: 系统对几乎所有中小任务一次性完成,无需人工干预。
成本: Claude 约 $100/月 + Codex $90/月,但你可以从 $20 起步。
为什么一个 AI 无法同时做两件事
上下文窗口是零和博弈。你必须选择放什么进去。
塞满代码 → 没有业务上下文的空间。塞满客户历史 → 没有代码库的空间。这就是两层系统有效的原因:每个 AI 只加载它需要的内容。
通过上下文实现专业化,而不是通过不同的模型。
完整的 8 步工作流
第 1 步:客户需求 → 与 Zoe 确定范围
客户电话结束后,我和 Zoe 讨论需求。因为所有会议记录自动同步到我的 Obsidian vault,无需额外解释。然后 Zoe 做三件事:
- 充值额度,立即解除客户阻塞——她有管理员 API 访问权限
- 从生产数据库拉取客户配置——只读生产 DB 访问,获取现有设置
- 派生一个 Codex Agent——附带包含所有上下文的详细 prompt
第 2 步:派生 Agent
每个 Agent 有自己的 worktree(隔离分支)和 tmux session:
# 创建 worktree + 派生 Agent
git worktree add ../feat-custom-templates -b feat/custom-templates origin/main
cd ../feat-custom-templates && pnpm install
tmux new-session -d -s "codex-templates" \
-c "/path/to/worktrees/feat-custom-templates" \
"$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high"
启动 Agent 的命令:
# Codex
codex --model gpt-5.3-codex \
-c "model_reasoning_effort=high" \
--dangerously-bypass-approvals-and-sandbox \
"Your prompt here"
# Claude Code
claude --model claude-opus-4.5 \
--dangerously-skip-permissions \
-p "Your prompt here"
用 tmux 的核心优势是任务中途重定向:
# 方向错了,直接纠正:
tmux send-keys -t codex-templates "Stop. Focus on the API layer first, not the UI." Enter
# 需要更多上下文:
tmux send-keys -t codex-templates "The schema is in src/types/template.ts. Use that." Enter
任务状态追踪在 .clawdbot/active-tasks.json:
{
"id": "feat-custom-templates",
"tmuxSession": "codex-templates",
"agent": "codex",
"status": "running",
"notifyOnComplete": true
}
第 3 步:循环监控
每 10 分钟运行一个 cron job,读取 JSON 注册表并检查:
- tmux session 是否存活
- 追踪分支上是否有待处理 PR
- 通过
ghCLI 检查 CI 状态 - 自动重启失败的 Agent(最多 3 次)
- 只在需要人工介入时发出告警
我不盯着终端。系统告诉我什么时候该看。
第 4 步:Agent 创建 PR
Agent 提交、推送,并通过 gh pr create --fill 开 PR。完成标准:
- PR 已创建 + 分支已同步到 main
- CI 通过(lint、类型检查、单元测试、E2E)
- Codex review 通过
- Claude Code review 通过
- Gemini review 通过
- 如有 UI 变更,必须包含截图
第 5 步:自动化代码审查
每个 PR 由三个 AI 模型审查:
- Codex Reviewer — 擅长边界情况、逻辑错误、竞态条件。误报率极低。
- Gemini Code Assist — 免费,能发现安全问题和可扩展性问题。必装。
- Claude Code Reviewer — 倾向过度谨慎。除非标记为 critical,否则跳过。
第 6 步:自动化测试
CI 流水线:Lint + TypeScript → 单元测试 → E2E 测试 → 针对预览环境的 Playwright 测试。
新规则:如果 PR 修改了任何 UI,必须包含截图,否则 CI 失败。
第 7 步:人工审查
这时我收到 Telegram 通知:"PR #341 ready for review。"
我的审查只需 5-10 分钟。很多 PR 我不看代码直接合并——截图告诉了我所有需要知道的。
第 8 步:合并
PR 合并。每日 cron job 清理孤立的 worktree 和任务注册表 JSON。
Ralph Loop V2:Agent 失败时怎么办
当 Agent 失败时,Zoe 不会用相同的 prompt 简单重启。她带着完整的业务上下文分析失败原因:
- Agent 上下文耗尽?"只关注这三个文件。"
- Agent 方向跑偏?"停。客户要的是 X,不是 Y。"
- Agent 需要澄清?"这是客户的邮件和他们公司的业务。"
Zoe 还会主动找工作:
- 早上: 扫描 Sentry → 发现 4 个新错误 → 派生 4 个 Agent 修复
- 会议后: 扫描会议记录 → 为功能请求派生 Agent
- 晚上: 扫描 git log → 派生 Claude Code 更新 changelog 和文档
如何选择合适的 Agent
| Agent | 适用场景 | 占比 |
|---|---|---|
| Codex | 后端逻辑、复杂 bug、多文件重构 | 90% |
| Claude Code | 前端、git 操作,速度更快 | ~8% |
| Gemini | 设计感知,先生成 HTML/CSS 规范,再由 Claude Code 实现 | ~2% |
如何快速搭建这套系统
把这篇文章完整复制到 OpenClaw,然后说:"为我的代码库实现这套 Agent Swarm 配置。"
它会读取架构、创建脚本、设置目录结构、配置 cron 监控。10 分钟搞定。
意想不到的瓶颈:内存
每个 Agent 需要自己的 worktree + node_modules。我的 16GB Mac Mini 在 4-5 个 Agent 时就开始 swap。我买了一台 128GB 内存的 Mac Studio M4 Max($3,500)来支撑这套系统。
如果你刚起步,4-5 个并发 Agent 已经足够强大。
原文:https://x.com/elvissun/status/2025920521871716562 | 作者:@elvissun | 数据:👍 10,127 | 👁 3,919,563