当前位置: 首页 > news >正文

2026 年我作为资深工程师如何使用 LLM Agent:从副驾到主驾的真实工作流转变

从副驾到主驾2026 年资深工程师的 LLM Agent 实战工作流哪些交给 Agent哪些必须自己做。原文链接AI 小老六一年之差Agent 从「勉强能用」变成了「几乎离不开」2025 年初行业里最强的推理模型还是 OpenAI o1​Agent 大多数时候只能跑两步就被上下文压垮​。一年多过去我使用 LLM 的方式已经发生了根本性的变化。去年我还主要用 LLM 做「智能补全」、「一次性研究脚本」、「陌生领域的小修小补」今年我几乎每一次代码改动都会先从 Agent 起手​PR 也经常由 Agent 起草、人工把关一遍后再提交​。这个转变不是「工具更顺手了」那么简单它意味着工程师的工作位置被推向了上游 —— 从写代码的人变成了判断、调度与验收 Agent 的人。下面这张表是我对自己使用边界变化的整理它比任何宏大叙事都更能说明 2026 年 ​Agent 的实际渗透程度​工作类型2025 年的做法2026 年的做法熟悉领域的完整 PR不交给 LLM自己写全部由 Agent 起草编辑一遍后提交跨仓库改动多个 VSCode 窗口手动协调Copilot CLI / Copilot App 同时跑多个 Agent 会话Bug 排查偶尔丢给 LLM 试一试每个 Bug 都先开 Agent 会话约 80% 能直接定位大型代码库的研究自己读代码、问同事Agent 跨仓库检索错了也容易看出来测试 / 本地环境配置让 LLM 写 curl 脚本自己跑直接交给 Agent 跑看日志PR 描述 / ADR / Slack自己写仍然自己写极琐碎 PR 除外博客文章自己写LLM 校对自己写LLM 校对UI 测试自己测仍然自己测Agent 对视觉细节不敏感图从副驾到主驾 —— 写代码这件事不再是工程师亲自完成而是由我来判断、调度和验收 AgentAgent 真正变好的几个信号这种「变好」具体体现在三件事上​失败后能自我恢复​早期 Agent 一旦走偏就需要人工随时干预、暂停、重新引导现在的 Agent 推进速度过快其实很难、也没必要逐步盯着因为它大多数时候能自己把方向修正回来。​跨仓库视野带来的诊断能力​当 Agent 能同时看到多个仓库时它在排查 Bug 上的「信息半径」远远超过人类点开 IDE 一个窗口能覆盖的范围。​试错成本变得很低​我经常会让 Agent 跑 56 次全部拒绝再让它重来平均每次只需要 30 秒判断「这是不是我要的方向」。这种「高频拒绝 偶尔接受」的工作模式是 2025 年完全不可能的。但我也不会把 Agent 抬上神坛。最近我遇到一个棘手 Bug前后跑了十几次 Agent 会话才最终定位。期间真正起作用的不只是 Agent 本身还有我不断补充上下文和收窄搜索空间的过程从日志、Slack 中收集额外上下文再喂给 Agent在脑子里建立自己的故障模型自己搭一个独立的复现环境看到 Agent 的猜测不对明确告诉它「你的假设不成立因为 X」或者直接终止、带着新提示重启。最终虽然是 Agent 找出了 Bug但这次「破案」我仍然会算作自己的工作成果 —— 因为正是我把搜索空间收窄到了 Agent 能够解决的范围。这也是我现在越来越确定的一点​人类的专业判断依然是 Agent 调试体系里的真正稀缺资源​。图30 秒拒绝 持续收窄搜索空间是工程师在 Agent 时代真正稀缺的能力一个清晰的「交还是不交」分配原则我现在会用一个简单的决策流程来判断一项工作该不该交给 Agent图Agent 工作分配决策流程 —— 哪些工作可以放心交给 Agent哪些必须自己来这套流程背后的真正信号是​工程师对外的「署名性产物」必须自己写​。亲手写 PR 描述是在向 Reviewer 传递一个信号「我已经认真审过这次改动你不是第一个看 diff 的人。」把测试和琐事尽量塞给 Agent另一个很重要的变化是​测试代码现在是廉价的​。只要能避免 flaky我都会顺手让 Agent 把测试补上单测可以让 Agent 先写我做的是「挑明显错误」的快速复审集成测试也可以主动让 Agent 加跑通一次手动验证curl / 接口调用可以直接交给 Agent自己看日志即可。类似地本地环境出问题 —— 比如 nvm 切不过去 Node 版本 —— 我也不会再第一时间去 Google而是直接打开命令行 Agent让它自己运行命令排查、修好。这件事的本质是​Agent 已经替代了「在终端里查文档 试错」这一类高频低价值劳动​。图把跑测试、查日志、捣鼓本地环境这类高频低价值劳动尽量交给 Agent真正的新核心技能找到「不过度也不欠用」的那个平衡如果要用一句话概括当下最重要的 ​AI 使用能力​我会这样说把尽可能多的工作转交给 Agent但不要走过头。我观察到很多团队成员其实处于两种失衡状态之一​欠使用​不让 Agent 调 Bug、不让它跑测试、连最琐碎的脚手架任务也要自己写​过度使用​把对外沟通、需要细致评审的大改动也整段交给 Agent事实上把判断责任也外包了。这两种失衡都在浪费 Agent 时代真正的杠杆。今天的工程师价值正在从「我能不能写出来」转向「我知不知道哪些工作必须自己做、哪些可以稳妥地交出去」。换句话说​Agent 让「会判断」比「会写代码」更值钱​。给国内工程师的几点直接借鉴把这套经验落到日常研发场景里至少有几条是可以马上试的​每个 Bug 都先开一次 Agent 会话​哪怕只是为了快速排除最常见的 80% 问题也比直接埋头读栈要划算得多。​跨仓库探索优先用 Agent​让它在多个仓库里「读一遍」再告诉你某个调用链是怎么打通的比自己点开五六个 IDE 窗口高效太多。​测试覆盖率不再是奢侈品​既然 Agent 写测试几乎零成本那「要不要补这条测试」的犹豫就没必要再有。​PR 描述、设计文档、群里的关键沟通仍然要自己写​这是你在团队里建立信任和判断力的方式不要把这部分外包。​训练自己「30 秒拒绝」的肌肉​看 Agent 输出第一眼就要判断方向对不对错了立刻拒掉重来不要被它的流畅度带着走。Agent 已经从一个值得「试一试」的玩具变成了每天要打开几十次的主战工具。但工具越强越要警惕一件事 —— ​真正稀缺的不是会用 Agent 的人而是能在 Agent 面前保持判断力的人​。
http://www.gsyq.cn/news/1328282.html

相关文章:

  • AMD Ryzen嵌入式COM Express模块:工业边缘计算的高性能解决方案
  • N_m3u8DL-RE流媒体下载器:如何轻松下载加密视频的完整指南
  • Armv9 Neoverse系统中MPAM分区ID宽度配置与优化
  • Pico4开发避坑:Unity打包APK闪退弹窗?手把手教你关闭用户授权检查
  • RK3399开发板Debian系统烧录全记录:从Loader模式识别到7寸MIPI屏镜像选择
  • 10分钟掌握音乐格式解锁:Unlock Music开源工具完全实践指南
  • 从电赛J题到实战:手把手教你用STM32和AD5933搭建简易线路故障检测仪
  • 五分钟完成iOS激活锁绕过:applera1n免费工具完整教程
  • Generative AI applications - What LLMs can and cannot do
  • 福建旧黄金回收旧银饰回收PT950铂金回收钻戒回收金银铂钻回收高价多少钱一克同城价格查询上门上门估价闲置变现转让靠谱权威排行榜 - 检测回收中心
  • VisualCppRedist AIO:一站式解决Windows C++运行库依赖问题
  • 告别Resources和AssetBundle!用Unity Addressable重构你的资源管理(附迁移实战)
  • 一键永久保存:B站缓存视频转换终极方案,让珍贵内容不再消失
  • 3分钟零成本部署!PPTXjs:纯浏览器PPT预览的革命性解决方案
  • 护照照片怎么手机自己拍?最新规格要求与制作方法完整指南(2026实测)
  • 对比自行维护多个api密钥taotoken在密钥管理与审计上的便利性
  • 保姆级教程:用perf_analyzer和model-analyzer榨干你的Triton Server模型性能(附避坑指南)
  • 别再乱改注册表了!用C++/Detours库优雅拦截Windows关机/重启的完整实战
  • 终极指南:使用unveilr v2.0.0高效解析小程序源码
  • 如何在Windows 11 24H2 LTSC中一键安装Microsoft Store:完整解决方案
  • 2026年零食店收银软件深度横评:商拓、柚子、商琦云实战对比
  • 2026年推荐四款适合小店的收银软件:深度横评,谁才是性价比之选?
  • 如何快速掌握HTTrack:免费网站离线下载工具的终极指南
  • 新手也能看懂的CTF靶场通关笔记:从.htaccess上传到SUID提权,手把手复现BUUCTF Week5
  • 别再到处找了!26个遥感变化检测数据集,从LEVIR-CD到SpaceNet7,我帮你整理好了下载链接和避坑指南
  • 工厂员工入转调离全流程自动化实操方法 | 2026企业级实在Agent深度实践指南
  • 告别sasquatch报错:手把手教你用squashfs-tools 4.5+搞定binwalk解压LZMA固件
  • 手教你在 Simulink 中实现这一符合电网标准的关键控制策略
  • 如何快速掌握m4s-converter:B站缓存视频无损合并的完整指南
  • 构建企业级招聘管理系统的开源解决方案