当前位置：首页 > news >正文

AI 开发经济学改写：从行政驱动到技术质变，Token 消耗策略大转变

news 2026/7/1 21:21:26

【导语：去年 Meta 将员工 Token 消耗量纳入绩效考核，引发无意义消耗现象。如今，Tokenmaxxing 迎来第二阶段，由技术质变驱动，改写了 AI 开发的经济学，同时也带来了安全攻防和权力分配的新变化。】

Tokenmaxxing 第一阶段：行政驱动的无意义消耗

去年 Meta 把员工的 Token 消耗量写进绩效考核，导致员工让两个 Agent 互相对话一整天来刷量，这种现象被称为 tokenmaxxing。这是因为大量资历老的员工抗拒 AI 工具，公司只能用行政手段推动团队使用 AI。

Tokenmaxxing 第二阶段：技术质变带来新逻辑

如今，Tokenmaxxing 的第一阶段已经结束，第二阶段开始，逻辑恰恰相反。这次是技术本身出现了质变，模型质量越过临界点，token 烧得越多，输出质量越好。以前让 Agent 长时间跑会出现 compounding error，现在“loops”模式基本是每多跑一轮就更好一点。

这个变化直接改写了 AI 开发的经济学，成本效率的计算不再是哪个模型单次调用最便宜，而是哪个模型能在等预算下跑更多轮。

不同模型成本效率对比

以 Claude Opus 和 GLM 5.2 为例，Claude Opus 每轮迭代带来 1.1× 的提升，GLM 5.2 带来 1.05×，但 GLM 的价格只有 Claude 的 1/5。多跑几轮之后，便宜模型反而在前头。GLM 5.2 约 $1.40/M 输入、$4/M 输出；Opus 4.X 是 $5/M 输入、$25/M 输出。GLM 5.2 在部分 benchmark 上已经超过 GPT 5.5，Haiku 4.5 更是被碾压。

安全攻防与权力分配新变化

Anthropic 的 Mythos 模型在 AISI 的网络安全测试里，100M token 预算下没有出现任何边际收益递减的迹象，这意味着安全攻防正在变成经济战，谁能比对手多烧 token 谁就赢。

OpenAI 发布了首款自研推理芯片 Jalapeño，和 Broadcom 合作，专门针对自有推理负载优化，模型参与了芯片设计。GPT 5.6 系列通过了美国政府协调的预览，这表明 AI 能力的分配权力正在从行业转移到政府。

编辑观点：Tokenmaxxing 的转变反映了 AI 技术的快速发展，从行政驱动到技术驱动，将对 AI 开发和应用产生深远影响。开发者需重新考虑成本效率，行业竞争也将更加激烈。

http://www.gsyq.cn/news/1610222.html

相关文章：

Vue.Draggable架构演进：从Sortable.js集成到现代Vue组件设计

3分钟掌握FlicFlac：免费Windows音频格式转换终极指南

如何高效下载番茄小说：打造个人数字图书馆的完整方案

PostgreSQL 绿色运行

数字孪生网络（DTN）技术架构、标准化演进与全场景工业应用研究报告

AI时代自动化测试进阶：从脚本执行到智能策略的实战指南

企业级来访管理系统管理系统源码｜SpringBoot+Vue+MyBatis架构+MySQL数据库【完整版】

Java SpringBoot+Vue3+MyBatis 旅游出行指南_ms ()abo系统源码｜前后端分离+MySQL数据库

零样本学习的本质是类比推理：从邓克尔问题到AI工程实践

Selenium弹框处理全攻略：从基础操作到健壮框架设计

DSPy规模化few-shot优化：从提示工程到AI编程范式

电商票务自动化开发实战｜基于聚合CPS+AI识图的电影票自动出票系统设计与代码实现

【2027最新】基于SpringBoot+Vue的乡村政务办公系统管理系统源码+MyBatis+MySQL

MoE混合专家架构：稀疏激活与路由机制深度解析

Deep Research 2.0：面向研究者思维的AI认知范式

Dev-Browser vs Playwright：浏览器自动化性能优化实战解析

UI自动化测试实战：从Selenium到Page Object，构建稳定高效的测试框架

跨平台UI自动化测试框架：从设计到实战的完整指南

免费开源AMD Ryzen调试工具SMUDebugTool终极指南：硬件工程师级的精准控制

【2027最新】基于SpringBoot+Vue的影城会员管理系统管理系统源码+MyBatis+MySQL

机器学习中Prediction与Inference的本质区别与工程实践

MySQL数据分析实战：从零入门到销售报表可视化全流程

Selenium与ChromeDriver自动化测试：从环境搭建到POM框架实战

AI思想共享：让大模型的中间表征可观察、可验证、可协作

机器学习学习曲线：诊断模型欠拟合与过拟合的核心工具

如何快速掌握AMD Ryzen调试工具：SMUDebugTool新手完整指南

GD25Q64EQJGR，8MB 四线 SPI，133MHz 高速 XiP 工业存储

AI编码生产力悖论：上下文丢失、意图漂移与责任模糊

UI自动化测试中动态元素定位与状态管理的实战策略

Selenium自动化测试：从WebDriver协议到企业级框架搭建实战