当前位置：首页 > news >正文

为什么说 Agent 时代已经来了？Codex 正在改变程序员的工作方式

news 2026/5/25 11:58:53

来自：

推荐一个程序员编程资料站：

http://cxyroad.com

副业赚钱专栏：https://xbt100.top

2024年IDEA最新激活方法

后台回复：激活码

CSDN免登录复制代码插件下载：

CSDN复制插件

以下是正文。

我是小路。

最近认真读了一篇来自 Codex 团队的长文分享，看完之后我最大的感受是：

很多人还把 AI Agent 当成一个高级代码补全工具，但 OpenAI 想做的，已经不是帮你写函数了，而是想把它变成一个真正能长期协作的数字同事。

以前大家理解的 Agent，大多还是：

你给一个 prompt，它返回一段代码；
你让它改 bug，它吐一个 diff；
你让它写 PR，它帮你生成提交内容。

本质上还是一次性调用。

但 Codex 现在明显在往另一个方向演化：长期线程、外部记忆、自动执行、目标驱动、多工具协同。

它已经越来越不像一个聊天机器人，而像一个长期在线的执行系统。

01 | 过去的 AI 是函数，现在的 Agent 更像同事

以前我们调用 AI，其实很像调用函数：

输入 prompt；
等待结果；
上下文结束；
下次重新开始。

所以很多人会发现一个问题：

AI 明明刚刚还懂你的项目，聊久了之后突然失忆了。

原因其实很简单。

因为旧模式里，对话只是临时上下文，不是真正的工作空间。

但 Codex 现在引入了持久线程这个概念。

一个 Thread 不再是一次聊天，而是一个长期存在的工作区。

比如你可以长期维护：

一个发布线程；
一个架构评审线程；
一个日报线程；
一个监控线程；
甚至一个专门帮你整理 Slack 和 Gmail 的线程。

这件事特别像什么？

像你在团队里养不同角色的员工。

有的人负责发版；
有的人负责 review；
有的人负责同步信息；
有的人负责监控线上。

线程开始拥有角色感，而不是一次性会话。

这一点我自己感触特别深。

现在我用 Agent 最大的问题，其实不是能力不够，而是任务会散落在不同窗口里。

今天聊一点；
明天改一点；
后天重新开线程。

最后上下文碎了一地。

持久线程本质上是在解决：

AI 如何拥有连续工作能力。

02 | Steering 和 Queuing，才是真正的人机协作

这篇文章里我最喜欢的一个点，是它把用户和 Agent 的关系重新定义了。

以前很多人幻想的是：

AI 自动干活，人类躺着等结果。

但现实不是这样。

真正高效的人机协作，更像带新人。

你不会一句话丢过去就彻底不管。

而是：

中途纠偏；
随时调整；
临时追加任务；
阶段性 review。

Codex 里面有两个特别重要的能力：

Steering
Queuing

Steering 本质上是：

正在执行的时候直接打断。

比如：

这个按钮太大了；
间距不对；
这个方案跑偏了；
先别做这个，优先处理另外一个。

它特别像你站在员工旁边实时纠偏。

而 Queuing 则是：

当前任务结束后，继续做下一件事。

比如：

等测试结束后，把结果发 Slack；
做完预览后，通知产品；
生成文档后，再自动开 PR。

这个设计其实特别关键。

因为它意味着：

Agent 不再只是执行命令，而是开始进入任务流。

以前 AI 是：

问一句，答一句。

现在开始变成：

一个持续推进的工作过程。

我现在自己用 Goal 功能的时候，经常会配合 Steering。

原因很简单。

Agent 最大的问题从来不是不会干活，而是容易漂移。

你必须周期性让它汇报：

当前计划；
执行状态；
偏离情况；
下一步目标。

这和管理真实团队几乎没区别。

03 | 真正的突破，不是写代码，而是接管整个工作流

很多人还以为 Codex 只是个写代码工具。

但实际上，它已经开始接管整个电脑工作流。

现在它能做的事情已经越来越离谱：

浏览网页；
操作浏览器；
控制桌面 GUI；
调用 API；
连接 Slack；
连接 Gmail；
连接 Calendar；
操作 MCP Server；
执行自动化流程。

重点是：

这些能力不是孤立存在的。

而是开始串起来了。

比如：

Slack 收到需求；
Agent 自动分析；
去仓库改代码；
跑测试；
生成文档；
打开浏览器检查页面；
最后通知评审。

整个链路已经闭环了。

这时候你会发现：

代码只是中间媒介。

真正被重构的是整个数字工作流。

这一点其实特别重要。

因为很多公司的大量工作，本来就不是纯写代码。

真正耗时间的是：

找资料；
翻聊天记录；
整理上下文；
查历史决定；
同步状态；
做 review；
来回沟通。

而这些东西，现在正在逐步被 Agent 吃掉。

04 | Automation 本质上是让 Agent 长期在线

Automation 很多人第一反应是：

不就是定时任务吗？

但实际上它和传统 cron 差别非常大。

传统定时任务是：

固定脚本；
固定输入；
固定输出。

但 Thread Automation 不一样。

它是：

周期性唤醒一个有长期记忆的 Agent。

这件事的意义巨大。

因为它意味着：

Agent 开始具备持续推进能力。

比如：

每 30 分钟检查 Slack；
自动整理未回复消息；
分析优先级；
草拟回复；
监控 PR 评论；
跟踪文档反馈；
持续等待某个条件达成。

这已经不是脚本了。

而是一个长期在线的执行者。

尤其是：

它拥有上下文。

这一点和传统自动化完全不是一个量级。

以前自动化系统最大的痛点是：

没有记忆。

所以每次都得重新输入上下文。

但现在：

线程本身就是上下文。

05 | Goal 才是 Agent 能不能落地的关键

我特别认同原文里关于 Goal 的一句话：

没有验证器的目标，本质上只是愿望。

这一句其实直接点中了 Agent 最大的问题。

很多人觉得：

AI 不够聪明；
模型不够强；
推理不够好。

但实际上很多时候问题根本不在能力。

而在于：

没有明确终点。

比如：

帮我优化代码。

这句话其实没法验证。

什么叫优化完成？

快了多少？
减少多少内存？
通过哪些测试？
有没有副作用？

如果没有验证器，Agent 很容易无限漂移。

所以现在真正好用的 Goal，一定都有：

测试集；
benchmark；
验收标准；
端到端流程；
bug 复现；
指标约束。

比如：

把 Python 服务迁移到 Rust。

这个目标听起来很大。

但如果你的验证器是：

所有单元测试通过。

那整个任务突然就清晰了。

因为 Agent 能不断验证：

自己是不是在靠近终点。

这一点其实已经特别像自动驾驶了。

没有导航系统；
没有终点；
没有实时反馈。

再强的模型也会迷路。

06 | Shared Memory 才是整个系统真正的承重墙

整篇文章里，我觉得最重要的一部分，其实反而被放在了后面。

共享记忆。

因为前面所有能力：

持久线程；
自动化；
Goal；
浏览器控制；
桌面控制。

本质上都依赖一件事：

长期上下文不能丢。

只要上下文还只存在聊天记录里，所谓长期线程其实就是假的。

线程一长，必然崩。

所以现在所有 Agent 最后都在收敛到同一个方案：

外部记忆。

Codex 用 Vault；
Claude 用 CLAUDE.md；
很多 Agent 用 AGENTS.md；
本质都一样。

就是：

纯文本文件 + 可持久维护 + Version Control。

为什么一定是纯文本？

因为：

可读；
可改；
可迁移；
可同步；
可审计；
可长期保存。

这一点其实特别像程序员为什么爱 Markdown。

因为：

它不会被平台绑死。

你会发现：

真正重要的长期上下文，其实不是代码。

而是：

谁做了什么；
为什么这么做；
有哪些坑；
哪些决策已经定了；
哪些问题还没解决；
哪些人需要跟进。

这些东西以前都散落在：

聊天记录；
会议；
脑子里；
Slack；
邮件；
临时文档。

现在 Agent 开始尝试把这些东西结构化沉淀。

而这件事，可能比写代码本身还重要。

07 | Agent 时代，最重要的能力已经变了

以前大家拼的是：

谁写代码快；
谁 API 熟；
谁框架懂得多。

但未来可能越来越变成：

谁更会定义目标；
谁更会设计验证器；
谁更会管理上下文；
谁更会组织长期记忆；
谁更会拆解工作流。

因为 Agent 的能力已经足够强了。

真正限制它的，开始变成：

人类是否能把任务定义清楚。

现在越来越像：

你不是在操作工具。

而是在管理一个数字团队。

Steering 是实时纠偏；
Queuing 是安排下一步；
Automation 是持续在线；
Goal 是验收标准；
Vault 是长期记忆。

整个体系，其实已经非常像组织管理。

而且我越来越觉得：

未来真正重要的，可能不是谁会用哪个模型。

而是谁能构建自己的长期上下文系统。

因为模型会越来越强。

但你的：

知识库；
工作流；
记忆体系；
验证机制；
项目沉淀。

这些才是真正属于你的东西。

<END>

推荐阅读：

副业赚钱推荐：让你的时间开始变现！

免费体验AI图片生成，就在 Image Generator Hub！

程序员在线工具站：cxytools.com 推荐一个自己写的工具站：https://cxytools.com，专为程序员设计，包括时间日期、 JSON处理、SQL格式化、随机字符串生成、UUID生成、文本Hash...等功能，提升开发效 率。 ⬇戳阅读原文直达！ 朕已阅

查看全文

http://www.gsyq.cn/news/1378244.html

大润发购物卡回收实测，这5个途径到账快得让人意外 - 京顺回收

终极免费Switch模拟器yuzu：3小时从零到畅玩任天堂游戏

Unity RTS Starter Kit：工业级实时战略游戏开发脚手架

无锡顺恒搭建：惠山毛竹架搭建推荐几家 - LYL仔仔

开源吉他谱编辑神器TuxGuitar：从新手到专业编曲的完整指南

基于流式数据处理与可解释AI的实时预测系统架构实战

别再为验证码发愁了！用DdddOCR+浏览器插件，5分钟搞定自动化测试的验证码识别

收藏｜2026 年 AI 招聘重心大变！120w 年薪大模型应用开发岗，小白程序员必看

光伏板/太阳能电池板缺陷检测数据集（多模态版）【适用场景】工业缺陷检测、多模态图像融合（RGB+Thermal）、无人机巡检算法、YOLO/R-CNN系列目标检测

从 Java SE 到微服务架构：互联网大厂面试实战

智慧无人机巡检-6类无人机目标检测数据集普通回定翼无人机 2 无尾翼型固定翼无人机 3 巡飞弹 4 战斗机固定翼无人机 5 长机翼固定翼无人机的训练及应用

千鸿黄金回收：金价涨跌不定，你的金条和首饰何时变现最合适？ - 润富黄金珠宝行

NanaZip深度解析：现代Windows压缩工具的技术演进与实践探索

不止于GCD：用欧几里得算法玩转RSA加密、链表判环与倒水问题

终极Windows激活神器：KMS_VL_ALL_AIO完整使用指南

Taotoken控制台的用量分析与账单追溯功能使用初体验

Inventor许可利用率不到一半，四个角度帮你提上去

Web渗透测试七工具实战作战地图：从信息收集到报告生成

从黑箱到白盒：基于SHAP与KAN的水库水温简约可解释预测模型

如何快速提升macOS生产力：终极窗口置顶工具Topit完全指南

避开数字电路仿真那些坑：用Proteus复现加减运算器时，关于74HC48驱动和74HC283进位的几个实用技巧

n8n表达式注入漏洞CVE-2025-68613深度解析与RCE防御

如何通过窗口置顶技术实现300%工作效率提升？Topit重新定义macOS多任务体验

别再用BLEU和ROUGE了！2024最前沿的DeepSeek评估范式：基于认知对齐度（CA-Score）的三维量化体系

2026重庆成人学历提升权威推荐榜（权威数据版） - 资讯纵览

如何快速搭建个人数字阅读库：番茄小说下载器完整使用指南

保姆级教程：用OpenWrt 22.02搞定IPTV内网融合，让电视盒子在局域网任意看

数据链路层介绍和DNS协议

WarcraftHelper终极指南：三步解决魔兽争霸3现代适配难题

2026年5月珠海黄金回收变现实录：慧珠黄金（免费上门）双店覆盖高新区与香洲区，闲置金饰卖出好价钱全攻略 - 润富黄金珠宝行

相关文章：