当前位置: 首页 > news >正文

Codex 子代理:串行 vs 并行,快多少

系列:AI 编程工具生态挖掘 | 字数:约 2800 字 | 预计阅读:7 分钟


前面几篇都在 Claude Code 生态里打转。但 Codex 这边有一个 Claude Code 不具备的能力——原生子代理(Sub-Agent)并行编排。

Codex 支持在.codex/agents/下定义专用 Agent,每个有独立的系统提示、工具权限和模型。Codex 可以同时启动多个 Agent 并行执行不同任务,然后汇总结果。

社区做了大量封装——136+ 预定义子代理、50+ 可复用工作流、跨 LLM 编排。这篇文章不列清单,做一个实战对比:同一个需求,串行做 vs 并行做,差距到底多大。


Codex 子代理工作原理——.toml 定义,主 session 调用

.codex/agents/下定义一个 Agent 文件:

# .codex/agents/test-writer.toml name = "test-writer" description = "Writes pytest tests for Python functions" tools = ["read", "write", "bash"] model = "gpt-5.1" system_prompt = """ You are a test engineer. Given a Python source file, write comprehensive pytest tests. Focus on edge cases, boundary values, and error conditions. Use parametrize for combinatorial coverage. Output ONLY the test file content — no explanations. """

然后在主 Codex session 里调用:

用户: 用 test-writer 给 src/utils/date_utils.py 写测试 同时用 code-reviewer 审查 src/utils/date_utils.py 的代码质量 然后我去泡杯咖啡

Codex 会同时启动 test-writer 和 code-reviewer 两个 Agent,并行运行。Agent 之间没有上下文共享——各干各的。


串行 vs 并行实测——同一需求,两种跑法差多少

任务:给一个中等复杂度的 Python 工具模块(date_utils.py,180 行,12 个函数)做三个操作——写测试、代码审查、生成文档。

串行模式:

一个接一个来。先让 Codex 写测试,完了再审查,完了再生成文档。

Step 1: Write tests → 4 min 12 sec Step 2: Code review → 3 min 48 sec Step 3: Generate docs → 2 min 05 sec Total: 10 min 05 sec

测试覆盖了 12 个函数中的 11 个(漏了一个私有 helper),审查发现了 3 个问题(2 个类型标注缺失、1 个潜在的时区 bug),文档准确描述了 12 个函数的参数和返回值。

并行模式:

三个 Agent 同时启动:

Agent 1 (test-writer): → Writing tests... → 4 min 52 sec Agent 2 (code-reviewer): → Reviewing code... → 4 min 18 sec Agent 3 (doc-writer): → Generating docs... → 2 min 35 sec All agents completed. Total: 4 min 52 sec (wall clock)

并行模式墙钟时间约 5 分钟,比串行快了接近一半。但有两个代价:

  • test-writer 慢了 40 秒(Agent 并发竞争资源,模型推理排队)
  • test-writer 没看到 code-reviewer 发现的问题——审查发现的时区 bug,测试里刚好也漏了

并行什么时候划算

划算的场景:

  • 多个任务操作不同文件,互不依赖
  • 代码审查 + 测试编写——这两个天然独立
  • 大型重构——拆成多个子模块,每个 Agent 处理一个
  • 多语言项目——一个 Agent 改前端,一个 Agent 改后端

不划算的场景:

  • 任务之间有顺序依赖——Agent A 的输出是 Agent B 的输入,并行等于乱序
  • 操作同一个文件——两个 Agent 同时改同一个文件会产生冲突
  • 需要全局视角的任务——并行 Agent 各自为政,看不到其他人的分析

值得装的 6 个子代理

从 VoltAgent 的 136+ 子代理里,挑了几个最实用的:

Agent用途一句话
code-reviewer代码审查按漏洞、风格、性能逐项审查
test-writer测试生成自动 parametrize 组合覆盖率
doc-writer文档生成读函数签名和 docstring,输出 Markdown
security-scanner安全扫描OWASP Top 10 检查,硬编码密钥检测
refactor-agent大型重构拆解重构计划,分步执行,每步验证
dependency-checker依赖审计检查过时的包、已知漏洞、许可证冲突

安装单个 Agent:

npx skills@latestaddVoltAgent/awesome-codex-subagents

然后在 Codex session 里通过/agent test-writer调用。


Agent 之间的通信——别指望他们会聊天

并行 Agent 最大的陷阱:你不会自动得到"综合报告"

三个 Agent 各自输出了结果——测试代码、审查报告、文档。但它们不会互相沟通。你得做汇总的人:

用户: 汇总 test-writer、code-reviewer 和 doc-writer 的输出, 合并成一个完整的 PR 准备报告

或者用社区工具——agent-sh/agentsys提供了一个编排层,定义了 Agent 间的输入/输出协议,自动汇总。但它还在 preview 阶段,文档不全。

目前的建议:并行 Agent 用来生成,人用来汇总。不要指望 Agent 之间自动协调。


Codex 子代理 vs Claude Code 并行——调度方式和隔离程度不同

Codex 子代理Claude Code 并行
调度方式原生支持,.toml配置通过 SubAgent tool,内置支持
Agent 隔离独立上下文,独立执行共享上下文,子 Agent 可传结果
适用场景完全独立的任务并行需要主 Agent 汇总的并行
配置复杂度需要定义每个 Agent 的系统提示自动继承 CLAUDE.md 规则

Codex 的子代理更适合"不同视角"的并行——安全 Agent 看安全、测试 Agent 看测试、文档 Agent 看文档。Claude Code 的子代理更适合"分块处理"的并行——主 Agent 拆任务,子 Agent 各领一块。


技能超市:1400+ 个技能里的质量筛选

GitHub 上 1400+ 个 Codex/Claude Code 技能,社区测试了 100 个,70% 不合格。几个筛选标准:

过滤掉:

  • "用最佳实践"类——空泛,没具体行为约束
  • 只做一件事但描述不清的——装完不知道什么时候触发
  • 跟其他已有技能功能重复的

留住的:

  • 有明确的触发条件(“当 X 时做 Y”)
  • 有具体的输出格式要求
  • 有已知的限制说明(“不适用于 Z 场景”)

两个网站帮你找:

  • claudeskills.info— 151+ 技能,支持中文,兼容 14+ 平台
  • skillsmp.com— 多平台技能市场

下一篇

并行多 Agent 能提效,但也扩大了攻击面——多个 Agent 同时跑,安全风险被放大了。下一篇同时测 AgentShield(安全扫描)和 cozempic(token 成本优化),看看防守端和成本端社区做了什么。

http://www.gsyq.cn/news/1437691.html

相关文章:

  • 2026年白色硅灰厂家选型技术推荐:纳米级微硅粉/超细微硅粉/四川微硅粉厂家/四川硅灰/核心指标解析 - 优质品牌商家
  • AI写论文的宝藏工具!4款AI论文写作助手,让你的写作过程更顺畅
  • 如何用VinXiangQi打造你的智能象棋AI助手:从零开始到专业级分析
  • 深入xv6内核:为每个进程创建独立内核页表到底解决了什么问题?
  • 保姆级教程:在Linux上从零配置TongLINKQ 8.1.15.2客户端,实现与服务端通信
  • Beyond Compare 5逆向工程:RSA非对称加密授权机制深度解析与密钥生成器实战
  • 2026年台州税务代理公司选对=合规高效 企赢税务智能财税推荐(含联系方式) - 本地品牌推荐
  • 2026年Trae与Claude Code优缺点对比:深度横评解析
  • Cora和Citeseer数据集上可直接运行的GCN链路预测代码包(含预处理、训练与评估)
  • 2026 年郑州化妆品柜展柜厂家技术与服务分析报告
  • STM32F103扫地机器人实战工程:FreeRTOS多任务调度+IAP远程升级+电池与传感器全链路管理
  • 告别系统升级焦虑:Ubuntu 22.04 LTS 到 24.04 LTS 保姆级升级指南(含 do-release-upgrade 详解)
  • 告别Ubuntu 22.04默认Dock:这几个gsettings命令和Gnome扩展让你效率翻倍
  • 十年 PM 走心总结:职场管理者的底层逻辑
  • C++如何与C语言混合编程_在C++项目中调用C库函数的extern “C“方法
  • MATLAB版LMS自适应滤波实操包:带运行录像、可调参数源码与收敛效果可视化
  • 从零开始搭建知识问答系统
  • 【Redis】 五大基础数据类型 底层原理深度解析
  • 2026年5月更新:武汉优秀船闸防撞装置生产厂家的选择策略与深度解析 - 2026年企业资讯
  • 从‘宋体.ttf’到屏幕显示:一个汉字在Windows/Linux系统里经历了什么?
  • Spring AI企业级RAG优化|Redis会话记忆持久化+混合检索权重调优(大幅提升问答准确率)
  • 2026年越南公司注册新规解读及合规实操技术分享:海外ODI备案代办/马达加斯加公司注册/上海境外投资备案ODI/选择指南 - 优质品牌商家
  • css常用知识
  • Win10黑屏只剩鼠标?别急着重装!用这条sfc命令5分钟救活你的桌面
  • 代驾司机加盟入职流程是怎样 - mypinpai
  • Ubuntu 22.04 LTS下,三种NVIDIA驱动安装方法怎么选?保姆级对比与避坑指南
  • Bootstrap方法避坑指南:从原理到R实战,告诉你什么时候该用,什么时候会翻车
  • 开封高大空间专用冷热机组性价比高的厂家
  • 2026年苏州家庭外墙漏水维修专业服务企业特征与主流服务主体梳理 专业防水公司排名推荐(2026年6月防水补漏最新TOP权威排名) - 鼎壹万修缮说
  • 支付通道长久稳定,只靠这两大核心