当前位置: 首页 > news >正文

面向token编程,一夜百万账单,还能抗的住吗?

最近经常听到说现在token的成本已经超过人工了,意味着养一个后端工程师甚至比Vibe Coding更便宜。

Uber就是个典型的例子,5000名工程师人均token账单500-2000美元,四个月用完了全年的AI预算,算一算帐,上千万美金的AI费用,可以养活多少工程师。

还有的企业没有对token限流,导致一夜之间几十、上百万token账单。

花了很多钱后,Agent的产出是什么样呢?现在Github上上星很快的开源项目多是纯Vibe coding,但翻车的不少,用户体验并不好。

比如像前段时间的DeepSeekTUI,这是老美一个音乐专业的学生用AI手搓的Coding Agent(和DeepSeek没什么关系),虽然已经很厉害,但实际用起来bug非常多。

这就引出了Agent的2个瓶颈,上下文碎片化和可验证性缺失。

这是Notion创始人Ivan Zhao在文章中《Steam, Steel, and Infinite Minds》中提出的,几乎是现在各种Agent的通病。

上下文碎片化会导致3个问题。

1、token消耗奇高。因为信息到处分散,数据库、云文档、本地文件等,Agent为了查全信息会塞进超长的上下文,每次请求都会浪费很多token。

如果你用过OpenClaw龙虾,相信会有这样的体会,让它翻译个ppt内容,可能几块钱没了。

2、容易出错,说胡话。上下文不足,或者上下文太长,AI就会胡编乱造,像豆包就会经常出现幻觉。

3、成果很难落地。Agent只会在有限的框框里去完成任务,它不知道一件事的前因后果,背景细节,开发一个货物瑕疵检测小工具容易,但是搭建物流系统就很难,因为涉及很多的流程、规范、变数。

Ivan Zhao的原话是:

聊天、战略文档、仪表盘数据、只存在老员工脑子里的隐性组织经验;现在人类充当 “人肉胶水”,靠复制粘贴、切换浏览器标签拼凑信息。上下文无法统一聚合前,AI Agent 永远被困在碎片化小场景,做不了全链路工作。

举个很简单的例子,你让Agent去修复某张数仓表的bug,告诉它这张表的结构、用途,Agent确实把问题解决了,能run起来,但是另一张下下下游表却出bug,因为某字段字段属性/逻辑被更改,导致无法关联。

结果不可验证同样是致命的问题。

Code 可通过单元测试、运行报错客观验证对错,因此编程 AI 能靠强化学习持续迭代变强;但项目管理、战略方案、业务汇报没有统一客观评判标准,没法量化好坏,AI 缺少闭环反馈,无法自主优化能力,必须人类全程人工校验兜底。

意思是说,Agent执行非代码任务,没有办法自己纠错,因为没有评判标准,遇到问题不会自动停任务,只会反复重试,不断循环,这样会拉爆token。

写代码其实也会出现同样问题,Agent确实会单元测试,但是一个代码项目涉及相当多的业务流程、复杂的判断、循环,Agent虽然能知道哪里有语法bug,但是不知道每个模块之间的业务联系。

所以现在很多AI项目代码出现屎山的情况,需要大量程序员去维护、调试。

我理解针对上下文碎片化和可验证性缺失的瓶颈,解决方案会越来越多,不然也不会出现Claude Code和Codex独树一帜的局面,它们的优化做的确实好。

所以我对Agent的发展是积极乐观的,不光编程,未来大部分工作都可能有Agent参与进来。

http://www.gsyq.cn/news/1464310.html

相关文章:

  • 别光看教程了!用Qt6+CMake亲手打造一个跨平台桌面小工具(附完整源码)
  • 新手福音:用快马AI生成你的第一个软件安装包,轻松掌握打包全流程
  • 实测对比:T94-2与T106-2磁环在无线充电LCC电感中的效率差异(附200股利兹线绕制心得)
  • Flutter项目上架AppStore,我踩过的permission_handler权限描述大坑(附完整Podfile配置)
  • 用MATLAB复现激光TEM模式光斑:从基模到高阶厄米特-高斯光束的完整仿真教程
  • 当markdown遇见快马AI:用自然语言描述生成带智能特性的复杂应用
  • ANSYS Fluent实现SLM/EBSM熔池仿真:小孔动态与锥形高斯热源参数配置指南
  • 2026年知名的食品彩箱/日用品彩箱/彩盒彩箱厂家综合对比分析 - 行业平台推荐
  • 613张真实室内盆栽图像数据集,含YOLOv5/v8兼容txt与PASCAL VOC标准xml标注
  • 初学者可用的LBM流动模拟代码包:含Poiseuille、Couette、液膜、圆柱绕流和Shan-Chen多相算例
  • 告别‘No FileSystem for scheme hdfs‘:HDP/CDH集群外客户端程序连接HDFS的完整配置流程
  • 多租户 RAG 权限绕过漏洞:元数据过滤被拼接注入,我们差点赔掉客户
  • 2026年知名的饮料彩盒彩箱/水果彩箱/化妆品彩盒彩箱/食品彩箱高口碑品牌推荐 - 品牌宣传支持者
  • 谷歌排名点击率重要吗?改了30个Title,老站流量直接翻倍
  • 2026年靠谱的临沂工商注册公司/临沂注册公司哪家强 - 品牌宣传支持者
  • 从手机充电到汽车BMS:聊聊那些被你忽略的‘低压部分’电路设计要点
  • 几何无衬线字体革命:Bebas Neue 开源项目的技术深度解析
  • 新手福音:通过快马ai生成带详解的ubuntu python入门项目,轻松跨出第一步
  • nuScenes数据集深度解析:从sample_annotation到instance,搞懂自动驾驶数据标注的核心逻辑
  • 告别手动提取,用快马AI一键生成链接批量处理工具,效率飙升
  • 谷歌排名点击率重要吗?B2B工厂站CTR低于2%怎么救
  • 别再混淆了!一文搞懂Camera Sensor的Line Time、VBlank与FPS计算(附MTK/高通平台公式对照)
  • 别再用官方源了!给Jetson Nano换清华源+安装Python全家桶,速度提升10倍
  • 告别混乱布线!用PADS这几个隐藏快捷键和单位切换技巧提升PCB设计效率
  • (良心整理)亲测靠谱的AI论文软件,毕业党收藏备用
  • 规范流程,打造闭环的考核任务管理
  • 深入TMS320F28379D中断:从PIE映射表到高效ISR设计的实战解析
  • 2026年6月市场上做得好的小型冻干机怎么选择推荐,小型冻干机/工业冻干机/压盖款冻干机,小型冻干机品牌推荐 - 品牌推荐师
  • 国内大学生高频使用的AI写作辅助软件是哪款?
  • 别再乱调参数了!直流电机PI控制器参数整定实战(附Simulink模型)