当前位置：首页 > news >正文

给到夯，Claude Code重磅更新：Auto Mode 与 ultracode 是个什么东西

news 2026/6/9 19:19:10

Claude Code 放了两个大招：Auto Mode 和 ultracode workflows

怎么说呢，我本来只是想更新一下自己 Claude Code 的版本，结果一翻 changelog 直接愣住了。

5 月 25 日到 29 日，Anthropic 在 Claude Code 里一口气塞了两坨重磅东西。一个叫Auto Mode，一个叫 Dynamic Workflows（关键词是 ultracode）。这两个东西单拎出来都已经够炸的了，放在一起用，直接把 Claude Code 从「一个能写代码的终端工具」推到了「一个能在你睡觉的时候自己干活的工程团队」这个量级。

我这几天把它们翻了个底朝天，今天在这里把研究出来的东西全部交代清楚。

先说 Auto Mode，它到底是个啥

在讲 Auto Mode 之前，先回到一个很多人用 Claude Code 都会撞上的场景。

你正在用它改代码。它想跑个测试，它停下来问你。删个文件，它停下来问你。装个依赖，它又停下来问你。改三五行配置，它会连续问五次。一次两次还行，问多了你真的想把键盘摔了。这就是默认 permission mode 的代价，安全，但打断感极强。

Auto Mode 就是来治这个毛病的。

按照官方 permission-modes 文档的说法，Auto Mode 是一项 research preview 功能，需要 Claude Code v2.1.83 或更高版本。它让 Claude 可以在没有 permission prompt 的情况下直接执行操作，但会有一个独立的 classifier 模型在每个动作执行前先过一遍，把那些「超出你请求范围」、「指向你没授权的基础设施」、或者「被 Claude 读到的恶意内容驱动」的动作直接拦下来。

说人话就是，它不是真的放手让 Claude 随便干，而是「放手 + 一只看不见的手在兜底」。

想一启动就进 Auto Mode，可以在 settings 里把 claudeCode.initialPermissionMode 配成 auto。

我研究出了几个挺有意思的细节。

第一，它会顺便降低 Claude 主动跟你确认问题的次数。也就是说，它不光很少问你“能不能做”，连“你到底想干啥”都问得少了。不过呢，要是你在提示信息里明确说了要确认的地方，Claude 还是会停下来的。

第二，它在开启和关闭的时候会重置你的权限规则。就是那种“允许执行任意代码”这种宽泛的允许规则，在开启的时候会自动被丢弃，退出 Auto Mode 之后又会恢复。这设计挺实在的，就好像是承认 Auto Mode 是个更危险的状态，主动把那些大刀阔斧的权限收一收。

第三，它有熔断机制。文档里写得明明白白的，“如果分类器连续 3 次或者累计 20 次阻止某个操作，Auto Mode 就会暂停，Claude Code 会回到普通确认模式，你手动批准一次之后才能再开启”。这两个次数的上限是不能自己设置的。

第四，它本身可不保证安全。官方明确说了这只是研究预览版，还不能用于正式生产。文档建议你用它来运行那些“你大体上信任，但又懒得每一步都盯着”的任务，可别用它来替代对敏感操作的审查。

第五，企业用户可以用强制拒绝规则来无条件屏蔽某些操作。普通用户也能告诉分类器你信任哪些代码库、存储桶、域名，这样它对内部操作的判断会更准。这一条是文档专门给团队管理员留的办法。

我看到这五条的时候，心里就一个念头，这东西的设计逻辑不是“我相信 Claude”，而是“我相信一个比 Claude 谨慎得多的裁判”。这种分层的信任模型，挺值得好好琢磨琢磨的。

再说 Dynamic Workflows，这是把单兵变军团

如果说 Auto Mode 是「让一个 Claude 干得更快」，那 Dynamic Workflows 就是「让一群 Claude 一起干一件大事」。

按照 workflows 文档的说法，Dynamic Workflows 也是 research preview，而一个动态 workflow 就是一段 JavaScript 脚本，由 Claude 写出来，然后一个 runtime 在后台跑它，调度一大堆 subagent 去干活。

关键点来了，这段脚本不是预设的模板，是 Claude 现场根据你的任务现编的。你描述一个任务，Claude 给你写一段编排脚本，runtime 在后台执行，你的 session 还能继续干别的事，不会被卡住。

适合什么场景？文档列了四个很典型的，全是我过去最头疼的那种活。

第一，codebase-wide 的 bug 扫描。整个仓库几千个文件挨个看有没有某个模式的 bug。

第二，500 个文件的迁移。一次改几百个 import 路径或者签名。

第三，需要交叉验证的研究问题。不是一个搜索能搞定的，要多个角度查再互相印证。

第四，需要从几个独立角度起草一个严肃方案。在你下决心之前让几个不同视角的草稿互相 PK。

传统 subagent 模式干这些活是「Claude 现场决定下一步派谁」，编排逻辑全在 Claude 脑子里，没法复用也容易断。Workflow 把这一步从「Claude 的脑子里」搬到了「一段可以读、可以改、可以重跑的代码里」。

而且 workflow 还能跑出传统 subagent 跑不出来的质量模式，比如让几个独立 agent 互相 adversarial review 对方的结论，最后再汇总。这其实就是把学术 peer review 的模式塞进 AI 工作流里。

最让我兴奋的是，workflow 是有内建质量模式的，文档里专门强调了这一点。它能做的不是「多派几个 agent 一起堆」，而是让这些 agent 互相挑刺、互相印证，从几个角度起草方案再权衡，最后给你的不是一个原始结果，是一个经过内部对抗验证的结果。这一点对严肃任务太关键了。

ultracode 怎么用

先解释一下背景，Claude Code 有一个 /effort 命令控制推理强度，从低到高一般是 low、medium、high、xhigh、max 几档。

ultracode 不是单独一档 effort，而是文档原话「Ultracode is a Claude Code setting that combines xhigh reasoning effort with automatic workflow orchestration」，也就是把 xhigh 推理强度和「自动编排 workflow」打包在一起的一个 setting。

怎么开？两种方式。

第一种，在 prompt 里直接用关键词。输入「ultracode: 把 src/routes/ 下每个 API endpoint 都审计一下有没有缺鉴权」这种 prompt，Claude Code 会把 ultracode 这个词高亮（紫色），然后直接给你写一段 workflow 脚本，而不是按 turn 一句一句来。

第二种，用 /effort ultracode 全局开。开了之后，Claude 自己判断哪些任务值得用 workflow，一个简单请求可能自动变成连续好几个 workflow 串起来跑，一个理解代码、一个动手改、一个验证改得对不对。每个任务都比低 effort 多花 token、慢一点，但质量上一个台阶。

我自己的两点冷静思考

虽然挺兴奋的，但我研究完之后还是想给大家泼点冷水。

第一，关于 token 消耗。ultracode 是高工作量加上工作流程编排，每个任务消耗的 token 可不是普通模式的 1 点几倍，而是好几倍呢。文档里原话是“每次请求会消耗更多的 token，而且比低工作量水平时花费的时间更长”。要是你订阅的是按使用量付费，或者有月度使用上限，那用的时候可得悠着点，别一上来就把 ultracode 设成默认模式。

第二，调试的复杂度。当一个工作流程运行失败时，你看到的可不是“Claude 说了句错话”，而是“这段编排脚本在第几个子代理的哪一步出错了”。调试的步骤变多了。文档里给的建议是用 /workflows 命令，通过上下箭头选择，按回车键进入进度视图，这样就能看到每个代理的提示信息、工具调用情况和结果。虽然有这个功能，但熟悉它还得花点时间。