当前位置: 首页 > news >正文

英伟达AI Compute Partnership:从“卖铲人“到“收租人“的算力金融化革命

引言:GPU皇帝的"中央银行"时刻

2026年7月1日,英伟达正式宣布推出AI Compute Partnership Program——以收入分成(Revenue-sharing)和信用支持(Credit-support)双机制为核心的AI基础设施合作新模式。

同一天,Meta被曝计划推出云基础设施业务向外部出售算力,引发半导体板块暴跌6%。截然相反的市场信号两相映照,勾勒出AI算力产业最深层的结构性变革:英伟达正在从"铲子供应商"变成算力世界的"中央银行"

更直白地说:英伟达不再只满足于把GPU卖给你,它要参与你每一次算力出租的利润分成。


一、新模式全景:英伟达的算力金融化双引擎

1.1 双机制架构

┌──────────────────────────────────────────────────────────┐ │ NVIDIA AI Compute Partnership Program │ │ │ │ ┌─────────────────────────┐ ┌─────────────────────────┐ │ │ │ 收入分成机制 │ │ 信用支持机制 │ │ │ │ Revenue-sharing │ │ Credit-support │ │ │ ├─────────────────────────┤ ├─────────────────────────┤ │ │ │ 英伟达从云服务商营收中 │ │ 英伟达利用自身资产负债 │ │ │ │ 抽取约定比例的分成收入 │ │ 表为新兴云厂商提供财务 │ │ │ │ 分成比例随合同期推进 │ │ 担保和算力信用额度 │ │ │ │ 逐步阶梯递减 │ │ 降低初始CapEx门槛 │ │ │ └─────────────────────────┘ └─────────────────────────┘ │ │ │ │ 核心条款(The Information披露) │ │ ┌──────────────────────────────────────────────────────┐ │ │ │ 若云服务商无法找到足够租户 → 英伟达以约定价格回租 │ │ │ │ 未售出的GPU产能 │ │ │ │ │ │ │ │ 等价于:英伟达用自己的资产负债表为算力需求兜底 │ │ │ └──────────────────────────────────────────────────────┘ │ │ │ │ 底层架构:DSX AI Factory │ │ - 基于NVIDIA DSX数据中心平台 │ │ - 大规模多租户AI工厂设计 │ │ - 原生支持Blackwell系列GPU(GB300) │ └──────────────────────────────────────────────────────────┘

1.2 首批合作伙伴

合作伙伴地区部署规模电力规划
Sharon AI澳大利亚(纳斯达克上市)最高40,000块GB300 GPU(远期>55,000)
Firmus印度尼西亚·巴淡岛最高170,000块英伟达GPU360 MW可扩展园区

1.3 模式对比:从一次性交易到持续性收益

NVIDIA商业模式三重跃迁 ┌──────────────┬───────────────────┬──────────────────────┐ │ 维度 │ 过去 │ 现在 │ ├──────────────┼───────────────────┼──────────────────────┤ │ 角色 │ 硬件供应商 │ 信用中介 + 财务投资者 │ ├──────────────┼───────────────────┼──────────────────────┤ │ 收入来源 │ 一次性芯片销售 │ 持续性使用量挂钩分成 │ ├──────────────┼───────────────────┼──────────────────────┤ │ 风险承担 │ 不承担下游需求 │ 主动承担算力过剩风险 │ │ │ 风险 │ 换取下游利润分成 │ ├──────────────┼───────────────────┼──────────────────────┤ │ 客户关系 │ 卖完即止 │ 长期深度绑定 │ ├──────────────┼───────────────────┼──────────────────────┤ │ 盈利质量 │ 波动性高 │ 经常性收入占比提升 │ └──────────────┴───────────────────┴──────────────────────┘

二、算力供需的真实图景:过剩还是紧缺?

2.1 市场价格信号

英伟达兜底承诺的时机恰好发生在Meta"算力过剩"恐慌引发硬件股暴跌的同一天。但供需数据给出了截然相反的信号:

GPU租赁市场价格走势(2025年10月 → 2026年3月) H100 一年期租赁: $1.70/小时 ───→ $2.35/小时 (+38%) B200 高端GPU租赁: ───→ 涨幅最高94% 所有GPU按需租赁: ───→ 容量100%售罄 高端千卡算力交付周期: ───→ 12-15个月 GPU云端供应商反馈: 供需比 ≈ 1:10(每10个需求只有1个能被满足) 租赁价格半年涨幅 > 25%

2.2 融资障碍 vs 需求不足

新兴云服务商面临的核心障碍不是"算力没人要",而是"没钱买":

算力采购的"鸡生蛋"困境: AI模型团队需要GPU训练模型 ↓ 但GPU太贵,需要云服务商提供算力租赁 ↓ 云服务商需要采购大规模GPU集群 ↓ 但采购需要巨额资本支出(CapEx),银行不愿贷款 ↓ 新兴云服务商信用评级低,融资成本高 ↓ 算力供给无法跟上需求增长 英伟达的解决方案: 用自己的资产负债表为新兴云服务商提供信用增级 → 降低融资门槛 → 加速GPU出货 → 获得持续性分成收益

2.3 Meta卖算力 ≠ 算力过剩

同日Meta被曝计划出售算力,被市场恐慌性解读为"算力过剩"。但细究逻辑:

角度Meta卖算力英伟达兜底
市场反应恐慌性抛售硬件股被忽视的利多信号
隐含判断算力供过于求算力需求确定性极高
深层逻辑Meta CapEx 1250-1450亿美元/年英伟达愿用自有资金为需求兜底
真相Meta需要多元化收入来源融资瓶颈而非需求瓶颈

英伟达用自己的资产负债表为算力需求兜底——如果它对AI算力前景缺乏信心,绝不会做这件事。


三、DSX AI Factory:多租户算力工厂架构

3.1 架构全景

DSX AI Factory是英伟达为大规模算力共享设计的新一代数据中心架构:

┌────────────────────────────────────────────────────────────┐ │ DSX AI Factory 架构 │ │ │ │ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │ │ │ AI租户A │ │ AI租户B │ │ AI租户C │ ... │ │ │ (训练任务) │ │ (推理服务) │ │ (微调任务) │ │ │ └──────┬──────┘ └──────┬──────┘ └──────┬──────┘ │ │ │ │ │ │ │ ▼ ▼ ▼ │ │ ┌──────────────────────────────────────────────────┐ │ │ │ 多租户GPU调度层(Multi-Tenant Scheduler) │ │ │ │ - 动态资源分配 - 优先级队列 - 抢占恢复 │ │ │ │ - 租户隔离 - QoS保障 - 计费计量 │ │ │ └──────────────────────┬───────────────────────────┘ │ │ │ │ │ ▼ │ │ ┌──────────────────────────────────────────────────┐ │ │ │ GB300 GPU 算力池(可扩展至17万卡) │ │ │ │ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ │ │ │ │ │DGX │ │DGX │ │DGX │ │DGX │ │DGX │...│ │ │ │ │SuperPod│SuperPod│SuperPod│SuperPod│SuperPod│ │ │ │ │ └──────┘ └──────┘ └──────┘ └──────┘ └──────┘ │ │ │ └──────────────────────────────────────────────────┘ │ │ │ │ │ ▼ │ │ ┌──────────────────────────────────────────────────┐ │ │ │ 存储层(NVMe + 分布式并行文件系统) │ │ │ └──────────────────────────────────────────────────┘ │ │ │ │ │ ▼ │ │ ┌──────────────────────────────────────────────────┐ │ │ │ 网络层(NVLink + InfiniBand 800G) │ │ │ └──────────────────────────────────────────────────┘ │ │ │ │ 供电层:360 MW 可扩展 │ │ 冷却:液冷(直接-to-芯片) │ └────────────────────────────────────────────────────────────┘

3.2 多租户GPU调度器实现

以下是DSX AI Factory核心组件的Go实现——支持资源隔离、动态分配和抢占恢复的多租户调度器:

// DSX AI Factory - Multi-Tenant GPU Scheduler// Core scheduling engine for NVIDIA's AI factory architecturepackageschedulerimport("container/heap""context""fmt""sync""time")// GPU资源单元typeGPUUnitstruct{IDstringModelstring// GB200, GB300, H100, etc.MemoryMBint64ComputeCapfloat64// TFLOPSStatusstring// free, allocated, reserved, maintenancePodIDstring// 所属DGX SuperPodNodeIDstring}// 租户定义typeTenantstruct{IDstringNamestringPriorityint// 优先级(0-100,越高越优先)GuaranteedGPUint// 保证GPU数MaxGPUint// 最大GPU数(弹性上限)BurstEnabledbool// 是否允许突发弹性使用ContractLevelstring// premium, standard, basicRevenueSharefloat64// 收入分成比例}// 任务定义typeTaskstruct{IDstringTenantIDstringTypestring// training, inference, finetuneGPUCountintMinGPUintMaxGPUintDuration time.Duration PriorityintSubmittedAt time.Time Deadline time.Time Preemptiblebool// 是否可被抢占Statestring// queued, running, preempted, completed, failed}// 资源分配记录typeAllocationstruct{TaskIDstringGPUIDs[]stringStartTime time.Time EndTime time.Time Costfloat64// 累计费用}// MultiTenantScheduler 多租户GPU调度器typeMultiTenantSchedulerstruct{mu sync.RWMutex gpuPoolmap[string]*GPUUnit tenantsmap[string]*Tenant taskQueue PriorityQueue runningmap[string]*Allocation metrics*SchedulerMetrics// 调度策略参数config SchedulerConfig}typeSchedulerConfigstruct{OvercommitRatiofloat64// 超分比(默认1.2)PreemptionGrace time.Duration// 抢占宽限期MaxQueueDepthintAccountingPeriod time.Duration// 计费周期}typeSchedulerMetricsstruct{TotalGPUHoursfloat64UtilizationRatefloat64PreemptionCountint64AvgQueueWaitTime time.Duration TenantUtilizationmap[string]float64}// PriorityQueue 优先级队列(堆)typePriorityQueue[]*Taskfunc(pq PriorityQueue)Len()int{returnlen(pq)}func(pq PriorityQueue)Less(i,jint)bool{// 优先级高的先调度;同优先级下提交时间早的先调度ifpq[i].Priority!=pq[j].Priority{returnpq[i].Priority>pq[j].Priority}returnpq[i].SubmittedAt.Before(pq[j].SubmittedAt)}func(pq PriorityQueue)Swap(i,jint){pq[i],pq[j]=pq[j],pq[i]}func(pq*PriorityQueue)Push(xinterface{}){*pq=append(*pq,x.(*Task))}func(pq*PriorityQueue)Pop()interface{}{old:=*pq n:=len(old)item:=old[n-1]old[n-1]=nil*pq=old[0:n-1]returnitem}// NewScheduler 创建新的多租户调度器funcNewScheduler(config SchedulerConfig)*MultiTenantScheduler{return&MultiTenantScheduler{gpuPool
http://www.gsyq.cn/news/1637614.html

相关文章:

  • Codex桌面客户端:零代码接入DeepSeek等大模型,打造本地AI助手
  • CubeSandbox 快照、克隆、回滚部署实操体验|OC城市行深圳站
  • 剑星 全内容 中文全DLC 脱离虚拟机 即点即玩
  • 我在腾讯云 CVM 上实操 CubeSandbox:从部署到体验快照、克隆和回滚分享
  • 好无聊上班的一天
  • 学习嵌入式Day3
  • 从粉丝项目到技术实践:构建自动化内容管理流水线
  • 实战指南:如何用开源工具永久保存你的QQ空间数字记忆
  • 救命!UniApp上架App Store踩4.3a红线,我靠这招3天逆袭过审了[特殊字符]
  • Fable 5复活引争议!“内心戏”暴露,AI意识大讨论升温!
  • 基于大数据爬虫+Hadoop用户偏好迁移的电影推荐系统
  • 斯坦福CS231n计算机视觉课程:从理论到Kaggle实战的完整指南
  • eclipse ditto 学习笔记
  • 完美搞定微博,2026 批量下载微博内容/图片/视频,导出word和pdf,微博内容发布时间链接/点赞/评论/转发等数据导出excel
  • 地平线6 单机+联机版 全DLC车辆包 附存档免肝解锁
  • Claude Code 大规模封号,美团免费提供 GLM-5.2
  • ubuntu 26.04 k8s 1.36 ceph
  • AI技能管理新范式:告别手动复制,实现提示词工程化与资产化
  • 破界悦己:WATERFLY 如何重新定义当代出行生活
  • 手动拍单容易违规?抖店一键下单、密文下单自动拍单售后合规采购发货模式详解
  • 技术娱乐化时代,AI创业者如何用IP构建第二曲线
  • 大疆光学专利Zemax复现
  • 【小白也能轻松玩转龙虾】虾壳云一键部署轻量化安装包(附最新安装包)
  • 自媒体标题关键词效果分析:从零代码ETL到Lift提升度实战
  • 讯灵、摘星、今立智能对比:AI营销软件到底怎么选?
  • wget 1.24.5 整站镜像实战:3个关键参数组合应对 5 种常见网站结构
  • DeepSeek接入指南:从零到一,轻松集成AI编程助手
  • 当我们在浏览器里点开一把小锁:SSL/TLS是怎么保护我们的
  • 精馏塔背压波动总坏泄压件?ZOOK爆破片分材质选型方案
  • 防止对话上下文腐败(Context Corruption)的策略