当前位置: 首页 > news >正文

全球Token降价潮启动:AI大模型API价格雪崩,最高降幅达99%

时间:​ 2026年5月22日 → 6月中旬(集中爆发期,仍在持续演进)

地点/范围:​ 始于中国大模型市场,迅速向全球AI产业链传导——涉及中美两国主流模型厂商及公有云服务商。

核心人物与机构:

  • 导火索发起方:​ DeepSeek(深度求索)——其官方于5月22日宣布旗舰级通用大模型 V4-Pro​ 开启永久性降价,整体降幅达 75%(即调至原价约 1/4);
  • 快速跟进者:​ 小米(MiMo-V2.5 全系列 API 永久下调,部分场景降幅逼近 99%)、腾讯云(6月2日公告,6月3日起 DeepSeek-V4 系列同步下调,最高降幅 97.5%);
  • 国际连锁反应:​ 头部 AI 公司 OpenAI​ 被曝正权衡大幅下调 Token 计费标准,以应对企业客户成本不满并争夺市场,外界预期对标竞品 Anthropic​ 将被迫跟进;
  • 监管与产业层面: ​ 工信部印发普惠算力专项行动,三大运营商推出"词元(Token)套餐",推动 AI 算力向标准化、普惠化计费演进。

发生了什么事——事件脉络:

本轮降价潮并非孤立促销,而是一次结构性定价重构。时间线清晰地呈现为一条"点燃→扩散→倒逼国际巨头"的传导链:

  1. 5月22日,DeepSeek 率先将 V4-Pro 的 API 价格永久压至原价的 1/4。依托缓存加速技术,其输入侧缓存命中单价跌至 0.025 元/百万 Token,成为当时全球公开报价最低的顶级能力大模型,直接击穿了行业心理价位。

  2. 5月27日,小米旗下 MiMo-V2.5 全系列 API 跟进永久降价,部分细分调用场景降价比例逼近 99%,并推出"加量不加价"策略——Agent/Code 场景可用 Token 数量提升至原来 5–8 倍。

  3. 6月2–3日,腾讯云发布公告,平台内 DeepSeek-V4 全系列同步下调调用价格,同时明确模型推理速度、上下文窗口、输出准确率等核心参数不做改动,强调这是纯计费调整而非服务缩水。

  4. 6月上旬起,海外媒体援引华尔街日报报道称 OpenAI 正考虑重大 Token 价格削减,CEO Sam Altman 公开承认成本已成为企业客户的"巨大问题"(a huge issue),且多家企业已开始控制甚至缩减 AI 预算(如 Uber 被曝已用完全年 Agentic AI 预算)。

深层驱动因素(为什么是现在):

  • 技术红利兑现:​ MoE(混合专家)稀疏激活架构、推理框架深度优化、量化与缓存加速技术的规模化部署,已将单位 Token 计算成本推入阶梯式下降通道——成本结构的改变给了厂商"敢降价"的硬支撑。
  • 竞争格局逼宫:​ DeepSeek 以开源+极低定价证明"顶级能力不必贵",迫使闭源巨头在"保利润率"与"保市场份额/生态入口"之间做出取舍。
  • 商业模式换挡:​ 头部厂商营收结构已从自研模型授权(占比由 58% 降至约 22%)转向算力租赁与按量计费 API(占比升至约 61%),逻辑从"卖模型"变成"靠持续消耗换取长期现金流",降价其实是用薄利多销锁住用量
  • IPO 节点的估值叙事:​ OpenAI、Anthropic 均处于上市前夜(报道称 OpenAI 已秘密提交 IPO 申请),市场对 AI 公司的估值锚点正从"技术光环"切换为"可规模化盈利的单元经济"。

影响与后续走向:

维度 具体影响
开发者/企业侧​ AI 部署门槛骤降——之前因 Token 账单膨胀而犹豫的企业,重新评估大规模 Agent 化部署的可行性;但同时也面临"选型焦虑"与"等等党"效应(预期明年更便宜而推迟投入)
厂商侧​ 行业从"拼跑分"转向"拼综合运营"——分层定价成型:基础通用 API 走普惠低价引流,长上下文/多模态/旗舰专属维持高溢价,形成"基础款拉流量、高端款赚利润"的结构
产业链侧​ 算力租赁价格(上游)仍在高位甚至上行,但下游 Token 单价雪崩,利润空间从"模型层"向"推理工程层 + 云服务层"转移;同时三大运营商切入 Token 套餐赛道,推动计费标准化
宏观信号​ 这轮降价被视为 AI 产业从 "技术狂热"→"商业理性"​ 的分水岭时刻——Token 经济学的核心命题已从"能不能造出更好的模型"变为"能不能以更低成本交付可衡量的业务价值"​

总结

2026年5月下旬至6月的这轮 Token 降价潮,表面看是价格战,本质上是一场行业定价逻辑的范式转换:底层推理效率的突破让"便宜"有了工程依据,而 DeepSeek 的极致低价策略又把"贵"变成了不可辩护的立场。OpenAI 和 Anthropic 的被迫应战,意味着全球 AI 核心竞争力正在从"谁的模型最强"重新定义为"谁能以最低单位成本持续交付价值"。对企业和开发者而言,这是一个从"用不起"到"用不停"的历史性拐点;但对中小模型厂商而言,这也是一道生死线——打不起价格战的人,会被挤出牌桌

http://www.gsyq.cn/news/1548003.html

相关文章:

  • 丽水GEO城市合伙人选型推荐哪家靠谱:源头厂商、合伙人权益与区域保护怎么选? - 小随科技
  • LX Music桌面版:一站式跨平台音乐聚合播放器终极指南
  • 2026瑞安黄金回收市场调查:卖金套路多,市民直呼“水太深” - 微城市网络
  • 计算机毕业设计之学生信息管理系统
  • 应急响应实战:从挖矿木马入侵到系统加固的完整处置流程
  • 上海黄金回收防坑指南|五区正规门店实测与交易全流程拆解 - 昌福黄金回收
  • AI应用开发面试题精讲(四):系统架构与生产落地高频15问
  • 5分钟免费激活Windows和Office:告别激活弹窗的完整指南
  • WPS虚拟打印机消失?系统级排查与修复全指南
  • 【共创季稿事节】HarmonyOS7 互动卡片开发实践:写一个能加载页面的最小 LiveForm Ability
  • 美妆博主分享:2026年适合新手的6款粉饼推荐 - 品牌测评鉴赏家
  • M2.7开源模型深度解析:Agentic-first架构与非商业许可下的工程实践
  • 工业4.0下的设备维保时间智能测算:基于时序AI与Agent自动化架构的损耗预判实战
  • 告别单调:用250+配色方案打造你的专属终端工作空间
  • 基于MC68HC908MR32的永磁同步电机正弦波驱动与死区补偿技术详解
  • 嵌入式功能安全实战:基于NXP IEC60730库的GPIO短路与Flash CRC校验
  • 杰理之USB SPK位宽设置24bit,插PC会死机【篇】
  • B站视频解析技术深度解析:多协议支持与智能缓存实现
  • 嵌入式异构多核硬件设计实战:TWR-VF65GS10开发板深度解析
  • 3步掌握OpenSlide:从零开始高效处理虚拟切片图像
  • 杭州思亿欧智能体科技有限公司靠谱么?公司综合实力深度解析 - 栗子测评
  • 考软考中项报培训班一般多少钱?哪家性价比高
  • 哈尔滨本土门窗厂家排行:适配寒地需求的实力之选 - 起跑123
  • 长沙VI设计品牌推荐
  • 3分钟极速上手:Windows上最轻量级的安卓应用安装器终极指南
  • CodeWarrior IDE编译与链接实战:从源码到可执行文件的构建全解析
  • 衡阳高口碑黄金铂金回收白银回收实体老店排行 5 家靠谱门店电话地址全收录
  • 终极Flash浏览器指南:如何在现代系统上完美运行经典Flash内容
  • Framer 3.0 高保真原型设计与落地实战指南
  • 嵌入式调试实战:从断点原理到Trace跟踪的深度解析