当前位置：首页 > news >正文

Codex 子代理：串行 vs 并行，快多少

news 2026/6/1 2:04:07

系列：AI 编程工具生态挖掘｜字数：约 2800 字｜预计阅读：7 分钟

前面几篇都在 Claude Code 生态里打转。但 Codex 这边有一个 Claude Code 不具备的能力——原生子代理（Sub-Agent）并行编排。

Codex 支持在.codex/agents/下定义专用 Agent，每个有独立的系统提示、工具权限和模型。Codex 可以同时启动多个 Agent 并行执行不同任务，然后汇总结果。

社区做了大量封装——136+ 预定义子代理、50+ 可复用工作流、跨 LLM 编排。这篇文章不列清单，做一个实战对比：同一个需求，串行做 vs 并行做，差距到底多大。

Codex 子代理工作原理——.toml 定义，主 session 调用

在.codex/agents/下定义一个 Agent 文件：

# .codex/agents/test-writer.toml name = "test-writer" description = "Writes pytest tests for Python functions" tools = ["read", "write", "bash"] model = "gpt-5.1" system_prompt = """ You are a test engineer. Given a Python source file, write comprehensive pytest tests. Focus on edge cases, boundary values, and error conditions. Use parametrize for combinatorial coverage. Output ONLY the test file content — no explanations. """

然后在主 Codex session 里调用：

用户: 用 test-writer 给 src/utils/date_utils.py 写测试 同时用 code-reviewer 审查 src/utils/date_utils.py 的代码质量 然后我去泡杯咖啡

Codex 会同时启动 test-writer 和 code-reviewer 两个 Agent，并行运行。Agent 之间没有上下文共享——各干各的。

串行 vs 并行实测——同一需求，两种跑法差多少

任务：给一个中等复杂度的 Python 工具模块（date_utils.py，180 行，12 个函数）做三个操作——写测试、代码审查、生成文档。

串行模式：

一个接一个来。先让 Codex 写测试，完了再审查，完了再生成文档。

Step 1: Write tests → 4 min 12 sec Step 2: Code review → 3 min 48 sec Step 3: Generate docs → 2 min 05 sec Total: 10 min 05 sec

测试覆盖了 12 个函数中的 11 个（漏了一个私有 helper），审查发现了 3 个问题（2 个类型标注缺失、1 个潜在的时区 bug），文档准确描述了 12 个函数的参数和返回值。

并行模式：

三个 Agent 同时启动：

Agent 1 (test-writer): → Writing tests... → 4 min 52 sec Agent 2 (code-reviewer): → Reviewing code... → 4 min 18 sec Agent 3 (doc-writer): → Generating docs... → 2 min 35 sec All agents completed. Total: 4 min 52 sec (wall clock)

并行模式墙钟时间约 5 分钟，比串行快了接近一半。但有两个代价：

test-writer 慢了 40 秒（Agent 并发竞争资源，模型推理排队）
test-writer 没看到 code-reviewer 发现的问题——审查发现的时区 bug，测试里刚好也漏了

并行什么时候划算

划算的场景：

多个任务操作不同文件，互不依赖
代码审查 + 测试编写——这两个天然独立
大型重构——拆成多个子模块，每个 Agent 处理一个
多语言项目——一个 Agent 改前端，一个 Agent 改后端

不划算的场景：

任务之间有顺序依赖——Agent A 的输出是 Agent B 的输入，并行等于乱序
操作同一个文件——两个 Agent 同时改同一个文件会产生冲突
需要全局视角的任务——并行 Agent 各自为政，看不到其他人的分析

值得装的 6 个子代理

从 VoltAgent 的 136+ 子代理里，挑了几个最实用的：

Agent	用途	一句话
`code-reviewer`	代码审查	按漏洞、风格、性能逐项审查
`test-writer`	测试生成	自动 parametrize 组合覆盖率
`doc-writer`	文档生成	读函数签名和 docstring，输出 Markdown
`security-scanner`	安全扫描	OWASP Top 10 检查，硬编码密钥检测
`refactor-agent`	大型重构	拆解重构计划，分步执行，每步验证
`dependency-checker`	依赖审计	检查过时的包、已知漏洞、许可证冲突

安装单个 Agent：

npx skills@latestaddVoltAgent/awesome-codex-subagents

然后在 Codex session 里通过/agent test-writer调用。

Agent 之间的通信——别指望他们会聊天

并行 Agent 最大的陷阱：你不会自动得到"综合报告"。

三个 Agent 各自输出了结果——测试代码、审查报告、文档。但它们不会互相沟通。你得做汇总的人：

用户: 汇总 test-writer、code-reviewer 和 doc-writer 的输出， 合并成一个完整的 PR 准备报告

或者用社区工具——agent-sh/agentsys提供了一个编排层，定义了 Agent 间的输入/输出协议，自动汇总。但它还在 preview 阶段，文档不全。

目前的建议：并行 Agent 用来生成，人用来汇总。不要指望 Agent 之间自动协调。

Codex 子代理 vs Claude Code 并行——调度方式和隔离程度不同

Codex 子代理	Claude Code 并行
调度方式	原生支持，`.toml`配置	通过 SubAgent tool，内置支持
Agent 隔离	独立上下文，独立执行	共享上下文，子 Agent 可传结果
适用场景	完全独立的任务并行	需要主 Agent 汇总的并行
配置复杂度	需要定义每个 Agent 的系统提示	自动继承 CLAUDE.md 规则