当前位置: 首页 > news >正文

AI 开发经济学改写:从行政驱动到技术质变,Token 消耗策略大转变

【导语:去年 Meta 将员工 Token 消耗量纳入绩效考核,引发无意义消耗现象。如今,Tokenmaxxing 迎来第二阶段,由技术质变驱动,改写了 AI 开发的经济学,同时也带来了安全攻防和权力分配的新变化。】


Tokenmaxxing 第一阶段:行政驱动的无意义消耗

去年 Meta 把员工的 Token 消耗量写进绩效考核,导致员工让两个 Agent 互相对话一整天来刷量,这种现象被称为 tokenmaxxing。这是因为大量资历老的员工抗拒 AI 工具,公司只能用行政手段推动团队使用 AI。

Tokenmaxxing 第二阶段:技术质变带来新逻辑

如今,Tokenmaxxing 的第一阶段已经结束,第二阶段开始,逻辑恰恰相反。这次是技术本身出现了质变,模型质量越过临界点,token 烧得越多,输出质量越好。以前让 Agent 长时间跑会出现 compounding error,现在“loops”模式基本是每多跑一轮就更好一点。

这个变化直接改写了 AI 开发的经济学,成本效率的计算不再是哪个模型单次调用最便宜,而是哪个模型能在等预算下跑更多轮。

不同模型成本效率对比

以 Claude Opus 和 GLM 5.2 为例,Claude Opus 每轮迭代带来 1.1× 的提升,GLM 5.2 带来 1.05×,但 GLM 的价格只有 Claude 的 1/5。多跑几轮之后,便宜模型反而在前头。GLM 5.2 约 $1.40/M 输入、$4/M 输出;Opus 4.X 是 $5/M 输入、$25/M 输出。GLM 5.2 在部分 benchmark 上已经超过 GPT 5.5,Haiku 4.5 更是被碾压。

安全攻防与权力分配新变化

Anthropic 的 Mythos 模型在 AISI 的网络安全测试里,100M token 预算下没有出现任何边际收益递减的迹象,这意味着安全攻防正在变成经济战,谁能比对手多烧 token 谁就赢。

OpenAI 发布了首款自研推理芯片 Jalapeño,和 Broadcom 合作,专门针对自有推理负载优化,模型参与了芯片设计。GPT 5.6 系列通过了美国政府协调的预览,这表明 AI 能力的分配权力正在从行业转移到政府。

编辑观点:Tokenmaxxing 的转变反映了 AI 技术的快速发展,从行政驱动到技术驱动,将对 AI 开发和应用产生深远影响。开发者需重新考虑成本效率,行业竞争也将更加激烈。

http://www.gsyq.cn/news/1610222.html

相关文章:

  • Vue.Draggable架构演进:从Sortable.js集成到现代Vue组件设计
  • 3分钟掌握FlicFlac:免费Windows音频格式转换终极指南
  • 如何高效下载番茄小说:打造个人数字图书馆的完整方案
  • PostgreSQL 绿色运行
  • 数字孪生网络(DTN)技术架构、标准化演进与全场景工业应用研究报告
  • AI时代自动化测试进阶:从脚本执行到智能策略的实战指南
  • 企业级来访管理系统管理系统源码|SpringBoot+Vue+MyBatis架构+MySQL数据库【完整版】
  • Java SpringBoot+Vue3+MyBatis 旅游出行指南_ms ()abo系统源码|前后端分离+MySQL数据库
  • 零样本学习的本质是类比推理:从邓克尔问题到AI工程实践
  • Selenium弹框处理全攻略:从基础操作到健壮框架设计
  • DSPy规模化few-shot优化:从提示工程到AI编程范式
  • 电商票务自动化开发实战|基于聚合CPS+AI识图的电影票自动出票系统设计与代码实现
  • 【2027最新】基于SpringBoot+Vue的乡村政务办公系统管理系统源码+MyBatis+MySQL
  • MoE混合专家架构:稀疏激活与路由机制深度解析
  • Deep Research 2.0:面向研究者思维的AI认知范式
  • Dev-Browser vs Playwright:浏览器自动化性能优化实战解析
  • UI自动化测试实战:从Selenium到Page Object,构建稳定高效的测试框架
  • 跨平台UI自动化测试框架:从设计到实战的完整指南
  • 免费开源AMD Ryzen调试工具SMUDebugTool终极指南:硬件工程师级的精准控制
  • 【2027最新】基于SpringBoot+Vue的影城会员管理系统管理系统源码+MyBatis+MySQL
  • 机器学习中Prediction与Inference的本质区别与工程实践
  • MySQL数据分析实战:从零入门到销售报表可视化全流程
  • Selenium与ChromeDriver自动化测试:从环境搭建到POM框架实战
  • AI思想共享:让大模型的中间表征可观察、可验证、可协作
  • 机器学习学习曲线:诊断模型欠拟合与过拟合的核心工具
  • 如何快速掌握AMD Ryzen调试工具:SMUDebugTool新手完整指南
  • GD25Q64EQJGR,8MB 四线 SPI,133MHz 高速 XiP 工业存储
  • AI编码生产力悖论:上下文丢失、意图漂移与责任模糊
  • UI自动化测试中动态元素定位与状态管理的实战策略
  • Selenium自动化测试:从WebDriver协议到企业级框架搭建实战