Token海啸下的算力链变局:从金山云50%涨价到MaaS的生死棋局
2026年6月12日,金山云官网发布了一则看似不起眼的公告:“因全球AI算力需求攀升,硬件成本上涨,将部分产品价格进行调整。AI算力相关产品服务价格上调约15%-50%,文件存储相关产品服务价格上调约30%-50%。”-这则公告将于7月12日正式生效,涨幅之高在过去几年的云计算行业中堪称罕见。而就在金山云宣告涨价的两个月前,中国云市场的主角们已经完成了更猛烈的价格调整——2026年3月,腾讯云、阿里云、百度智能云、谷歌云、亚马逊云在10天内相继发布调价公告,核心AI算力与存储服务价格普遍上调30%至50%,腾讯云旗下Tencent HY2.0 Instruct模型的价格涨幅竟高达463%。-
这不是云厂商的临时提价。这是一场正在全速展开的算力链成本传导,是整个云计算商业模式从IaaS向MaaS(模型即服务)加速转型的信号弹,也是AI产业进入残酷淘汰赛的集结号。
一、涨价真相:成本、需求与失衡的三重奏
金山云的涨价,不是孤立事件,而是持续了近半年的算力调价潮中的最新一环。在此之前,国内所有主流云厂商已完成了一轮大规模价格上调。这一轮全球性算力涨价的根源,来自三个相互咬合、层层传导的齿轮:供给的刚性约束、需求的范式切换,以及由此撬动的价格机制复位。
供给端最棘手的并非英伟达GPU本身,而是它背后的两条“命门”。算力涨价的底层动因在于:HBM高带宽内存由SK海力士、三星、美光三家垄断,2025年下半年以来价格涨幅超过50%,直接推高AI芯片成本;CoWoS先进封装产能同样供不应求,台积电2025年产能翻倍后仍无法满足需求,2026年订单已排至年底。6月7日晚间,英伟达CEO黄仁勋在首尔与SK集团高层会面时明确表示:“从晶圆到封装到硅光子,整个产业供应链的一切都处于短缺状态,因为需求实在太高。”TrendForce集邦咨询数据显示,2026年第二季度一般型DRAM合约价将继续环比大涨58%至63%。一条被垄断的供应链上,任何一个环节的瓶颈都足以引爆全链条的价格。
硬币另一面是需求的指数级膨胀。AI应用已从“训练为主”转向“推理为王”——算力消费从过去相对封闭、可预期的训练项目制,转变为面向公众的、永不停止的永续刚需。Token的日均调用量最能说明问题:中国日均Token调用量已突破140万亿,而这一数字在2024年初仅为1000亿,两年间增长超千倍。全球年度Token消耗量预计从2025年的0.0005 PetaTokens增至2030年的15.27万PetaTokens,年复合增长率达3418%。
需求端的天量膨胀对上了供给端的物理瓶颈,价格机制的自我修复便成为无法回避的结果。早期的“亏本铺路”模式——云厂商用资本把算力价格压到成本线以下来抢用户——终于走到了尽头。
而看清这一点之后,大规模追加投资的局面也就变得可以理解了。北美五大CSP(云服务提供商)2026年资本开支预计合计7600亿美元,同比增长102.56%——微软1900亿美元,亚马逊2000亿美元——几乎全部投向高效能GPU集群、自研ASIC芯片和新一代数据中心。-而这7600亿美元的投资——叠加巨大的供给缺口——意味着算力价格在可预见的未来仍将处于上行通道。
算力不是成本,是AI产业的硬通货。HBM和CoWoS不是涨价的诱因,而是卡脖子的命门。
二、价格双轨与行业洗牌:谁在涨价中受益
但从表面数据看,情况并没有那么简单。云厂商的公告并不完整地反映着不同类型的用户群体真实面对的价格水平。一个深刻的行业真相在于:“价格双轨”已经确立。头部企业通过长期协议和大规模算力储备锁定成本,而中小企业只能用现货价购买——这个价差正在无声地重写AI产业格局。数据显示,腾讯云混元系列部分模型涨幅达463%,阿里云平头哥真武810E等算力卡产品涨价5%至34%,百度智能云AI算力相关服务上调5%至30%。-头部厂商之间固然也在涨价,但对内部生态伙伴和大规模长协客户的涨价幅度远低于公告上限。真正承受“涨价风暴”的,是没有议价能力的中小AI应用公司和开发者。
据IT桔子数据,2026年第一季度,已有超过10家AI应用初创公司停止运营或转型——样本覆盖约200家纯API创业公司。投资人的态度也随之逆转:“这个季度看了我们被投的账单,真是两眼一黑又一黑。2026年不打算再投软件了,准备转投硬件。”一位投资人说得更直白:“在现行的算力成本结构下,无论软件应用是什么方向,都跑不通良性的经营模型。”
这是一场马太效应极其明显的结构性洗牌。算力价格的长期上行,正在迫使AI应用层从“烧钱抢用户”转向“算细账抓利润”。没有自有算力储备、没有生态护城河的纯应用公司,面临的是被算力成本挤出牌桌的现实危机。
涨价不是短期回调,是AI产业的刮骨疗毒。纯应用公司的好日子,彻底结束了。
三、从“卖资源”到“卖模型”:金山云的品牌转身
在这一轮调价潮中,有一个公司的故事格外值得一读:金山云。
这家公司从来不是中国云市场的绝对主角。中国公有云IaaS市场被阿里云、华为云、天翼云等头部厂商牢牢占据,金山云始终处在边缘。它的基本盘在视频云——业务稳定但毛利偏低,长期依赖“小米-金山”生态的输血来维持。
但AI彻底改写了它的命运。2025年Q4,智算云(AI业务)收入9.3亿元,同比增长95%,占公有云收入近一半;调整后经营利润连续两个季度转正。到了2026年Q1,智算云业务账单收入达10亿元,同比增长90%,首次占据公有云收入比重超过50%。AI业务已从锦上添花变成压舱石。
金山云的转型,恰恰是行业趋势的微观缩影:云计算正从以IaaS为主导的“资源买卖”模式,走向以MaaS(模型即服务)为核心的“能力输出”模式。传统IaaS业务拼的是机房规模、网络带宽、硬件成本控制,利润薄如蝉翼;而在MaaS时代,云厂商的核心价值变成了提供模型训练、微调、推理和调用的全生命周期服务,计费单位从“台数”变成“Token数”。-
这一转型已不再停留在概念阶段。2025年,中国公有云MaaS市场规模达到30.7亿元人民币;IDC预计,2026年全年Token消耗量较2025年将再增长约20倍。-火山引擎在2025年全年的MaaS收入还只有15亿元左右,而2026年的营收目标已经被上调到了150亿元——增长近十倍,而其中仅Seedance 2.0一个视频模型,就贡献了单月超过10亿元的收入。阿里云也正在完成从IaaS领导者向MaaS核心参与者的战略转身:其AI相关收入实现三位数同比增长,通过阿里云调用大模型的日均频次在过去一年增长了15倍。计费方式也从包年包月转向按Token计费,“用量即收入”的商业模式终于找到闭环。
在这一转型中,金蝶天燕作为国内基础软件与中间件领域的长期深耕者,自然也站上了AI重构IT架构的历史交汇点。AI应用的大规模落地,不仅依赖底层的GPU算力和上层的模型服务,更需要一个能够连接模型、数据、业务系统与基础设施之间的智能化中间件层。无论云端智能体还是企业级AI应用,都需要可靠的数据集成、服务编排和业务协同能力来承载新型AI负载,这正是中间件在MaaS时代不可替代的价值所在。
MaaS不是“把模型搬上云”,而是一场从资源型商业模式到能力型商业模式的范式转移——卖的是智能本身,而不是承载智能的铁皮柜子。
四、算力经济展望:电力还是石油?淘汰赛的下半场
一个更根本的问题摆在面前:AI算力将像电力一样走向普惠,还是会像石油一样被地缘政治绑架?
从成本曲线上看,“普惠说”似乎更符合直觉。规模化效应和硬件迭代确实在持续拉低边际成本。但现实的另一个维度不容忽视——HBM、先进封装等关键环节的寡头垄断格局短期内无法打破,高端算力的供给弹性极弱。加之AI已经从“可选”功能变为生产工具的核心组件,推理需求正成为永不间断的刚性消耗——这在算力经济学上意味着需求的长期价格弹性偏低,供给方拥有更强的定价权。
因此更可能的图景是:AI算力经济将呈现“分层定价”格局。普惠层的基础算力(如非实时推理、轻量级模型调用)价格会持续走低,由规模摊薄和国产芯片替代来主导;而高端层(如实时大模型推理、千亿参数以上模型调用)则将长期维持高价,由HBM、先进工艺、优质能源等资源的稀缺性定价。
无论如何,涨价的浪潮已经席卷而来。算力成本的上行正在重塑整个AI产业链的利益分配格局:底层芯片厂商和头部云厂商将从价涨中直接受益,而AI应用层的企业——尤其是中小企业——必须学会在算力账本上精打细算。技术能省多少?据NVIDIA 2025年GTC大会数据,通过量化加KV Cache优化,推理成本可降低50%至70%;但与此同时,用户调用量增长了5倍,“技术优化追不上需求膨胀”成为新的常态。
云计算行业“持续降价二十年”的黄金时代已经终结。AI算力从“烧钱抢市场的内卷定价”走向“由供需关系决定的理性定价”,MaaS转型则是这一宏观变局下的战略应答。而在这场重构中,无论是上游的芯片厂商、中游的云服务商与中间件厂商,还是下游的AI应用开发者,都必须重新思考自己的核心竞争力。金山云的突围故事告诉我们:在AI算力带来的大浪潮中,即使是边缘玩家也能抓住新增长曲线跃迁到牌桌中央;而那些依然依赖资源套利的旧逻辑、却无法在新的算力经济时代找到差异化定位的玩家,终将被淘汰。毕竟,Token的浪潮不会停下,它只会继续翻滚——而能在这片浪潮中找准方向的人,才能穿越周期的风浪抵达彼岸。
