当前位置: 首页 > news >正文

给到夯,Claude Code重磅更新:Auto Mode 与 ultracode 是个什么东西

Claude Code 放了两个大招:Auto Mode 和 ultracode workflows

怎么说呢,我本来只是想更新一下自己 Claude Code 的版本,结果一翻 changelog 直接愣住了。

5 月 25 日到 29 日,Anthropic 在 Claude Code 里一口气塞了两坨重磅东西。一个叫Auto Mode,一个叫 Dynamic Workflows(关键词是 ultracode)。这两个东西单拎出来都已经够炸的了,放在一起用,直接把 Claude Code 从「一个能写代码的终端工具」推到了「一个能在你睡觉的时候自己干活的工程团队」这个量级。

我这几天把它们翻了个底朝天,今天在这里把研究出来的东西全部交代清楚。

先说 Auto Mode,它到底是个啥

在讲 Auto Mode 之前,先回到一个很多人用 Claude Code 都会撞上的场景。

你正在用它改代码。它想跑个测试,它停下来问你。删个文件,它停下来问你。装个依赖,它又停下来问你。改三五行配置,它会连续问五次。一次两次还行,问多了你真的想把键盘摔了。这就是默认 permission mode 的代价,安全,但打断感极强。

Auto Mode 就是来治这个毛病的。

按照官方 permission-modes 文档的说法,Auto Mode 是一项 research preview 功能,需要 Claude Code v2.1.83 或更高版本。它让 Claude 可以在没有 permission prompt 的情况下直接执行操作,但会有一个独立的 classifier 模型在每个动作执行前先过一遍,把那些「超出你请求范围」、「指向你没授权的基础设施」、或者「被 Claude 读到的恶意内容驱动」的动作直接拦下来

说人话就是,它不是真的放手让 Claude 随便干,而是「放手 + 一只看不见的手在兜底」。

想一启动就进 Auto Mode,可以在 settings 里把 claudeCode.initialPermissionMode 配成 auto。

我研究出了几个挺有意思的细节。

第一,它会顺便降低 Claude 主动跟你确认问题的次数。也就是说,它不光很少问你“能不能做”,连“你到底想干啥”都问得少了。不过呢,要是你在提示信息里明确说了要确认的地方,Claude 还是会停下来的。

第二,它在开启和关闭的时候会重置你的权限规则。就是那种“允许执行任意代码”这种宽泛的允许规则,在开启的时候会自动被丢弃,退出 Auto Mode 之后又会恢复。这设计挺实在的,就好像是承认 Auto Mode 是个更危险的状态,主动把那些大刀阔斧的权限收一收。

第三,它有熔断机制。文档里写得明明白白的,“如果分类器连续 3 次或者累计 20 次阻止某个操作,Auto Mode 就会暂停,Claude Code 会回到普通确认模式,你手动批准一次之后才能再开启”。这两个次数的上限是不能自己设置的。

第四,它本身可不保证安全。官方明确说了这只是研究预览版,还不能用于正式生产。文档建议你用它来运行那些“你大体上信任,但又懒得每一步都盯着”的任务,可别用它来替代对敏感操作的审查。

第五,企业用户可以用强制拒绝规则来无条件屏蔽某些操作。普通用户也能告诉分类器你信任哪些代码库、存储桶、域名,这样它对内部操作的判断会更准。这一条是文档专门给团队管理员留的办法。

我看到这五条的时候,心里就一个念头,这东西的设计逻辑不是“我相信 Claude”,而是“我相信一个比 Claude 谨慎得多的裁判”。这种分层的信任模型,挺值得好好琢磨琢磨的。

再说 Dynamic Workflows,这是把单兵变军团

如果说 Auto Mode 是「让一个 Claude 干得更快」,那 Dynamic Workflows 就是「让一群 Claude 一起干一件大事」。

按照 workflows 文档的说法,Dynamic Workflows 也是 research preview,而一个动态 workflow 就是一段 JavaScript 脚本,由 Claude 写出来,然后一个 runtime 在后台跑它,调度一大堆 subagent 去干活。

关键点来了,这段脚本不是预设的模板,是 Claude 现场根据你的任务现编的。你描述一个任务,Claude 给你写一段编排脚本,runtime 在后台执行,你的 session 还能继续干别的事,不会被卡住。

适合什么场景?文档列了四个很典型的,全是我过去最头疼的那种活。

第一,codebase-wide 的 bug 扫描。整个仓库几千个文件挨个看有没有某个模式的 bug。

第二,500 个文件的迁移。一次改几百个 import 路径或者签名。

第三,需要交叉验证的研究问题。不是一个搜索能搞定的,要多个角度查再互相印证。

第四,需要从几个独立角度起草一个严肃方案。在你下决心之前让几个不同视角的草稿互相 PK。

传统 subagent 模式干这些活是「Claude 现场决定下一步派谁」,编排逻辑全在 Claude 脑子里,没法复用也容易断。Workflow 把这一步从「Claude 的脑子里」搬到了「一段可以读、可以改、可以重跑的代码里」。

而且 workflow 还能跑出传统 subagent 跑不出来的质量模式,比如让几个独立 agent 互相 adversarial review 对方的结论,最后再汇总。这其实就是把学术 peer review 的模式塞进 AI 工作流里。

最让我兴奋的是,workflow 是有内建质量模式的,文档里专门强调了这一点。它能做的不是「多派几个 agent 一起堆」,而是让这些 agent 互相挑刺、互相印证,从几个角度起草方案再权衡,最后给你的不是一个原始结果,是一个经过内部对抗验证的结果。这一点对严肃任务太关键了。

ultracode 怎么用

先解释一下背景,Claude Code 有一个 /effort 命令控制推理强度,从低到高一般是 low、medium、high、xhigh、max 几档。

ultracode 不是单独一档 effort,而是文档原话「Ultracode is a Claude Code setting that combines xhigh reasoning effort with automatic workflow orchestration」,也就是把 xhigh 推理强度和「自动编排 workflow」打包在一起的一个 setting。

怎么开?两种方式。

第一种,在 prompt 里直接用关键词。输入「ultracode: 把 src/routes/ 下每个 API endpoint 都审计一下有没有缺鉴权」这种 prompt,Claude Code 会把 ultracode 这个词高亮(紫色),然后直接给你写一段 workflow 脚本,而不是按 turn 一句一句来。

第二种,用 /effort ultracode 全局开。开了之后,Claude 自己判断哪些任务值得用 workflow,一个简单请求可能自动变成连续好几个 workflow 串起来跑,一个理解代码、一个动手改、一个验证改得对不对。每个任务都比低 effort 多花 token、慢一点,但质量上一个台阶。

我自己的两点冷静思考

虽然挺兴奋的,但我研究完之后还是想给大家泼点冷水。

第一,关于 token 消耗。ultracode 是高工作量加上工作流程编排,每个任务消耗的 token 可不是普通模式的 1 点几倍,而是好几倍呢。文档里原话是“每次请求会消耗更多的 token,而且比低工作量水平时花费的时间更长”。要是你订阅的是按使用量付费,或者有月度使用上限,那用的时候可得悠着点,别一上来就把 ultracode 设成默认模式。

第二,调试的复杂度。当一个工作流程运行失败时,你看到的可不是“Claude 说了句错话”,而是“这段编排脚本在第几个子代理的哪一步出错了”。调试的步骤变多了。文档里给的建议是用 /workflows 命令,通过上下箭头选择,按回车键进入进度视图,这样就能看到每个代理的提示信息、工具调用情况和结果。虽然有这个功能,但熟悉它还得花点时间。

写在最后

这周 Anthropic 做的那些事儿,来来回回其实就是在回答一个问题:“AI 编程工具到底能帮人干多少活儿”。

Auto Mode 给出的答案是,尽量少打扰你。Dynamic Workflows 给出的答案是,让一群 AI 一起干活儿。ultracode 给出的答案是,尽最大努力把上面这两件事打通。

把这三样东西合在一起,Claude Code 就不再是那种得你手把手教着用的工具了,它更像是一个小型工程团队,你只要下达目标,它自己就能拆解目标、组织人手,还能自己验收结果。

这个转变意义可大了,从这儿开始,AI 编程比拼的就不再是“单兵作战能力”,而是“工程组织能力”了。

http://www.gsyq.cn/news/1494703.html

相关文章:

  • 小米把 1T 模型干到 1000 TPS?这事 Groq 看了得沉默
  • 嵌入式硬件设计:Kinetis K53引脚复用与LQFP/MAPBGA封装对比实战
  • Vue+Spring Boot双端可运行的学生信息管理项目(含前后端独立模块与启动说明)
  • 终极指南:如何轻松解密和提取RPG Maker游戏资源文件
  • GitCode个人技术开发者总结完整使用指南
  • 告别CNN与RNN:用SpectralFormer(Transformer)为高光谱图像分类打开新思路
  • NXP IW623P Wi-Fi 6/蓝牙5.x组合芯片硬件设计与调试实战指南
  • WechatBakTool:基于C的微信聊天记录备份与数据库解密技术方案
  • 我测了 6 个大模型写中文文章:GPT-4 vs Claude vs DeepSeek vs 通义千问 vs Kimi vs 豆包,谁最像人写的
  • 高校掌纹识别课程实践包:PCA降维+CNN分类+多模型融合全流程Python代码
  • 【嵌入式必知】内联函数(inline)和宏定义(#defne)
  • 专业数据可视化工具实战指南:3步创建交互式图表
  • 终极无损视频修复指南:5分钟学会使用untrunc拯救损坏的MP4文件
  • 嵌入式低功耗设计实战:从Kinetis K26电气特性到功耗优化策略
  • 告别Verilog代码乱糟糟:在Windows上用VSCODE一键美化格式的完整流程
  • 更便捷地提取梅露露的炼金工房资源
  • 别再只盯着CPU了!用Node Exporter监控Linux服务器,这5个内存和磁盘IO的指标更关键
  • CICERO双引擎架构:语言模型与规划器协同的AI谈判系统
  • ARM Cortex-M4引脚复用实战:从K60配置到嵌入式系统设计
  • 小程序毕设选题推荐:基于springboot+微信小程序的演唱会售票演唱会购票系统小程序【附源码、mysql、文档、调试+代码讲解+全bao等】
  • 麻将AI助手Akagi:实时分析雀魂对局的终极指南
  • 完整步骤:Ubuntu 内网 192.168.0.111 → Cloudflare 二级域名(CLI 方式)
  • i.MX 6处理器电气特性实战:从手册参数到稳定硬件设计
  • 小程序毕设选题推荐:【附源码、mysql、文档、调试+代码讲解+全bao等】
  • 计算机小程序毕设实战-微信小程序校园反诈骗基于Springboot的防诈骗管理系统小程序【完整源码+LW+部署说明+演示视频,全bao一条龙等】
  • DayZ社区离线模式完整教程:打造专属末日沙盒的终极指南
  • 终极华硕笔记本性能调校指南:5分钟掌握G-Helper完整使用教程 [特殊字符]
  • BiliBili-UWP:Windows平台原生化B站体验终极指南
  • Simulink跑完仿真别关!5分钟教你用MATLAB脚本批量处理多组波形并自动保存高清图
  • 如何永久保存微信聊天记录:WeChatMsg完整备份方案