当前位置: 首页 > news >正文

从Codex更新看AI Agent未来:通用智能体正在崛起

从Codex更新看AI Agent未来:通用智能体正在崛起

AI Agent、Codex、Cloud Code、通用智能体、垂直智能体、Multi-Agent、MCP、ReAct Loop、强化学习、Minus

Codex客户端下载

Codex客户端下载地址:

https://codexdown.cn/

最近看到 Codex 再次更新了一批能力,包括数据分析、销售支持、投资研究、产品设计等多个方向。

原本已经非常疲惫,刚从外面回来,但看到这次更新后,还是决定把自己的想法整理出来。

因为这次更新,再一次验证了我在半年前就反复表达过的一个观点:

真正的未来不是无数垂直智能体,而是越来越强大的通用智能体。

当时很多人并不认可这个判断,甚至遭到过不少质疑。

但随着 OpenAI、Anthropic、Google 等厂商不断推进 Agent 能力,这个趋势正在变得越来越清晰。

今天就结合 Codex 的这次更新,聊聊我去年就坚持的几个判断。


目录

  • 前言
  • 为什么我认为编程 Agent 本质就是通用 Agent
  • 垂直智能体最大的壁垒其实并不存在
  • Skill 正在被高估
  • Multi-Agent 的价值为什么在下降
  • 为什么我一直看好 Minus
  • 给 AI 从业者的两个建议
  • 总结

前言

去年 11 月的时候,我曾经和很多朋友聊过一个观点:

Cloud Code、Codex 这类产品最终一定会从 Coding Agent 演变成 General Agent(通用智能体)。

当时很多人的认知还停留在:

  • 写代码是写代码
  • 做销售是做销售
  • 数据分析是数据分析
  • 产品设计是产品设计

似乎每个领域都需要一个独立 Agent。

但我的判断恰恰相反:

当模型足够强时,大多数工作最终会收敛到同一种 Agent 架构。

而今天 Codex 的更新,恰恰印证了这一点。


为什么我认为编程 Agent 本质就是通用 Agent

直到今天,很多技术从业者依然不认可这个观点。

但只要认真看过任何一个 Agent 框架源码,就会发现一个事实:

Coding Agent 和 General Agent 背后的技术几乎完全一致。


工具层完全通用

以常见 Coding Agent 为例:

工具能力

Read File Write File Edit File Execute Bash Search Browser Terminal

这些工具其实并不属于编程领域。

例如:

数据分析

读取CSV 执行Python 生成图表 输出报告

产品设计

读取需求文档 分析竞品 整理PRD 生成原型

投资研究

搜索资料 分析数据 输出结论

本质上依然是:

Read Write Search Execute

同样的工具组合。


Agent 的核心一直是 ReAct Loop

目前绝大多数 Agent 都遵循类似逻辑:

思考 ↓ 调用工具 ↓ 观察结果 ↓ 再次思考 ↓ 继续调用工具

即经典的:

Reason + Act

也就是大家熟悉的:

ReAct Loop

其流程如下:

用户任务

模型推理

工具调用

获取结果

输出答案

很多人以为 Agent 框架存在某种神秘能力。

事实上并没有。

真正决定 Agent 上限的,一直是:

模型能力

而不是框架能力。


为什么 Coding Agent 正在变成通用 Agent

原因其实很简单。

过去强化学习主要集中在 Coding 场景。

因为代码结果天然可验证。

例如:

编译是否通过 测试是否通过 结果是否正确

因此 RL 更容易 Scale。


但近一年最大的变化是:

通用任务上的强化学习正在快速进步。

例如:

  • 长任务执行
  • 浏览器操作
  • 文档处理
  • 数据分析
  • 商业研究

这些能力正在被不断强化。

所以很多人误以为:

Agent 框架变强了

实际上是:

模型变强了

Agent Framework 从一开始就已经 Ready。

真正缺的是大脑。

而现在,大脑正在快速升级。


垂直智能体最大的壁垒其实并不存在

我一直有个问题。

如果今天的大模型已经比绝大多数人更聪明。

那么:

垂直智能体 VS 通用智能体

最大的区别到底是什么?

我认为只有两个:

第一:工具

例如:

CRM系统 ERP系统 数据库 企业内部API

但 MCP 的出现已经解决了这个问题。

MCP = 标准化工具接入

工具正在变成公共能力。

因此:

工具 ≠ 壁垒

第二:提示词

很多垂直 Agent 的核心竞争力是 Prompt。

例如:

律师 Prompt 医生 Prompt 销售 Prompt 运营 Prompt

但这里有一个问题。

如果模型已经足够聪明。

那么:

写 Prompt 本身是不是也可以由模型完成?

答案显然是可以。

甚至很多团队的 Prompt:

本来就是模型写的

那么最终会出现什么情况?

Prompt ↓ 被模型优化 Prompt Engineering ↓ 被模型内化

这就是我认为:

大量垂直 Agent 护城河并没有想象中那么深。


Skill 正在被高估

这是我一直比较坚持的观点。

很多人认为:

Skill = 核心竞争力

但我觉得:

真正重要的 Skill 最终都会被模型吸收。

例如:

  • 写代码
  • 数据分析
  • 文案创作
  • 研究总结

这些高频能力一定会不断被模型内化。


而那些不会被模型内化的 Skill 呢?

往往又价值有限。

因此长期来看:

Skill ↓ 模型能力

正在发生融合。


Multi-Agent 的价值为什么在下降

这是目前依然存在争议的话题。

很多团队还在疯狂做:

Agent Team Multi-Agent Agent Society

但我一直持保留态度。


Multi-Agent 成立的前提

必须满足:

Agent之间能力差异足够大

例如:

律师Agent 程序员Agent 财务Agent 设计师Agent

各自拥有明显优势。


但问题来了。

随着模型越来越强。

Agent 之间的能力差距正在缩小。

最终会变成:

Agent A IQ 190 Agent B IQ 195 Agent C IQ 200

此时协作收益开始下降。


一个简单类比

假设有两个绝顶聪明的人。

你给他们:

  • 不同教材
  • 不同计算器
  • 不同参考书

会对考试结果产生巨大差异吗?

答案大概率不会。

因为:

智力水平 >>> 工具差异

同样的逻辑也适用于 Agent。

未来主航道依然是:

模型越来越聪明

而不是:

Agent越来越多

为什么我一直看好 Minus

提到 Agent,就不得不提 Minus。

我一直是 Minus 的长期付费用户。

在我看来:

Minus 是行业里被严重低估的产品之一。


去年 6 月左右。

Minus 已经能够实现很多今天才被大规模讨论的能力:

  • 自动执行任务
  • 浏览网页
  • 信息收集
  • 长流程工作流
  • 自动交付结果

甚至某些体验今天依然领先。


最让我认可的是交互设计

很多 AI 产品的问题是:

能力很强 体验很差

而 Minus 最大优势之一是:

能力 × 体验

同时在线。

从产品角度看。

这比单纯堆模型参数更难。


所以我一直认为:

对真正做出创新的团队,应该给予更多耐心。

行业需要的是:

尊重创新

而不是:

先否定 再嘲讽 最后跟随

给 AI 从业者的两个建议

建议一:远离低质量信息源

这些年参加过很多创新创业活动。

也听过很多所谓的大咖分享。

我的感受越来越强烈:

很多内容的信息密度极低。

甚至只是重复行业共识。


相比之下。

真正有价值的是:

一线 Builder

因为他们每天都在:

  • 做产品
  • 跑实验
  • 调模型
  • 接触用户

他们掌握的是第一手信息。


建议二:多做多看,少空想

AI 行业最大的特点就是:

变化速度极快

昨天正确的认知。

一个月后可能已经失效。

因此最重要的能力不是预测未来。

而是:

快速更新认知

而更新认知最好的方法永远是:

实践

形成这样一个循环:

实践 ↓ 获得反馈 ↓ 更新认知 ↓ 再次实践 ↓ 继续迭代

这才是成长最快的路径。


总结

Codex 这次更新,在我看来不仅仅是新增了几个功能。

更重要的是再次验证了一个趋势:

Agent 的未来不是越来越细分,而是越来越通用。

回顾这一年的发展:

趋势变化
Agent框架基本稳定
MCP生态快速扩张
工具能力标准化
Prompt工程逐渐被内化
模型能力持续提升
通用Agent快速成型

很多人仍然在讨论:

哪个Agent更强

但我更关注的是:

模型还能变得多聪明

因为最终决定上限的,从来不是工具本身。

而是那个使用工具的大脑。

或许未来几年后再回头看:

真正改变行业的,不是某个垂直 Agent。

而是一个足够聪明、足够通用、能够完成绝大多数工作的超级 Agent。

http://www.gsyq.cn/news/1463745.html

相关文章:

  • 深圳 ai 智能开发公司哪家便宜:独家排名最新深度推荐 - 17322238651
  • 计算机毕业设计之基于LSTM模型的NBA小前锋综合实力分析与预测
  • 终极Windows系统清理工具:免费快速解决C盘爆红问题
  • 2026年当下,如何甄别一家真正可靠的废钢回收企业? - 2026年企业资讯
  • 外贸独立站技术复盘:无货源代购订单履约技术实现
  • 保姆级教程:Quartus II 16.0在Win10/Win11下的完整安装与破解流程(含网卡ID获取与License配置)
  • java键盘录入
  • 深圳办公 ai 培训机构哪家口碑好:权威榜单专业测评攻略 - 19120507004
  • 2026年当前,临沂企业如何选择专业财税咨询品牌?深度解析山东儒蒙企业服务有限公司 - 2026年企业资讯
  • 深圳办公 ai 培训机构哪家值得选择:独家榜单专业必读攻略 - 17329971652
  • 广州搬家公司哪家保护措施做的好:最新 TOP5 深度推荐 - 13425704091
  • 当数据消失时:TestDisk与PhotoRec如何成为你的数字救生员
  • 3步搞定安卓应用安装:APK Installer让你的Windows电脑变身移动应用中心
  • 2026 年 GEO 优化公司推荐名单:6 月国内 TOP10 服务商综合测评 + GEO 概念详解 - 玖叁鹿
  • CSAPP=系统硬件组成 + CPU 如何执行程序
  • [智能体-264]:Embedding 通俗发展史(四段式,大白话,从远古→现在 RAG)
  • 深圳办公 ai 培训机构哪家值得信赖:五大机构最新专业测评 - 17329971652
  • 别再死记ResNet了!用PyTorch从零实现DenseNet-121,搞懂‘密集连接’到底好在哪
  • 被37所重点中小学内部传阅的《AI教学整合避坑手册》(含18个真实失败案例+可审计整改清单)
  • 【结果+代码】2026中青杯B题第一问建立无参考图像质量评价(NR-IQA)的数学模型
  • B站成分检测器:智能用户分析工具,让评论区身份一目了然
  • WCH-Link Utility隐藏功能挖掘:不止烧录,还能一键读保护、读Flash和批量操作
  • low-memory-server-swap-20260601
  • 从EFPLMN到EFFPLMN:实战解析USIM卡如何影响你的手机搜网与信号
  • 保姆级教程:用Altium Designer导出Gerber文件,一次搞定PCB打样(附常见错误排查)
  • STM32CubeMX实战:用按键和RTC闹钟唤醒你的低功耗设备(附完整代码)
  • 【字节跳动】巨量引擎第二层内核 纯工业级机密参数201-500
  • 直接用 CTP 做期货自动交易太乱:天勤式状态管理思路
  • AI工具如何72小时内重构对账流程?揭秘头部金融机构已验证的4层智能校验架构
  • 避坑指南:STM32低功耗停止模式唤醒后时钟配置的那些事儿