当前位置: 首页 > news >正文

AI动态简报之算力基建篇(2026.06.03)


⚡ 第1条:NVIDIA发布RTX Spark超级芯片——个人AI计算机迈入"千万亿次"时代

核心信息

COMPUTEX 2026首日,NVIDIA正式发布RTX Spark超级芯片,将Blackwell架构GPU与20核Grace CPU通过NVLink-C2C融合为统一芯片。该芯片配备6144个CUDA核心、第五代Tensor Core(支持FP4精度),最高可搭载128GB统一内存,AI算力达1 Petaflop(千万亿次浮点运算/秒)。

性能指标

参数

RTX Spark

AI算力

1 Petaflop

CUDA核心

6144个

CPU

20核Arm(联发科定制)

统一内存

最高128GB

本地运行大模型

1200亿参数/100万token上下文

上市时间

2026年秋季(华硕/戴尔/联想/微软Surface首发)

对开发者/企业的影响

单机即可本地运行千亿参数大模型,彻底打破"跑大模型必须上云"的壁垒。超过100家Windows软件商(含Adobe、Blackmagic Design)已启动适配,AI PC生态进入爆发前夜。

信息来源:腾讯新闻 | 2026-06-02


⚡ 第2条:黄仁勋预言Marvell成"万亿公司",高速互联成AI算力新主线

核心信息

COMPUTEX 2026次日,英伟达CEO黄仁勋与Marvell CEO Matt Murphy同台对谈。黄仁勋指出,随着Agent AI大规模落地,AI计算正从"单GPU竞赛"进入"数据中心协同计算"时代——高速互联、交换芯片、光通信的重要性正快速超越GPU本身。他公开称Marvell可能成为"下一家万亿美元公司"。

股价表现

标的

表现

Marvell (MRVL)

前日涨超7%,夜盘一度暴涨12%+

英伟达 (NVDA)

领涨科技股,美股再创新高

对开发者/企业的影响

AI基础设施投资逻辑正在转向——CPO(共封装光学)、midplane互联、800V DC电源等"连接层"技术将成为下一轮算力基建的核心标的。数据中心从"买更多GPU"变为"建更高效的互联网络"。

信息来源:新浪财经 | 2026-06-02


⚡ 第3条:2026全球AI算力报告发布:全球102GW,2030年翻倍至220GW

核心信息

5月29日天津世界智能产业博览会上,《2026全球AI算力发展研究报告》重磅发布。报告指出:全球算力中心总容量达102GW(其中AI负载62GW),预计2030年翻倍至220GW(AI负载占71%)。AI芯片正从GPU向TPU、NPU多元演进,算力中心迈入吉瓦级超大规模绿色集群阶段。

关键数据

指标

2026年

2030年(预测)

全球算力中心总容量

102GW

220GW

AI负载占比

61%

71%

美国年耗电量

292TWh

606TWh(占全美11%)

中国算力中心容量

接近60GW(AI占48%)

全球耗电量

415TWh(2024)

945TWh(年均增15%)

十大趋势方向:算力架构升级、多智能体推理需求爆发、能源供给变革(风光储→核能→氢能)、太空算力、词元经济学等。

信息来源:CSDN / 智东西 | 2026-06-01


⚡ 第4条:中国移动19亿服务器大单落定,国产ARM算力加速崛起

核心信息

中国移动2026-2027年PC服务器集采结果公布,武汉长江计算独揽全部4个ARM架构标包,税前中标金额超19亿元。截至2026年3月底,我国智能算力规模达每秒1882百亿亿次,但当前训练算力仍占70-80%,未来推理算力预计将占70%以上。

产业链景气验证

公司

算力相关采购/合同金额

东阳光

160亿-190亿元

华策影视

不超过33亿元

盛视科技

约60亿元

杰创智能

约3.6亿元

74只算力概念股年内平均涨幅接近43%,融资余额较去年末增加近35%。

对开发者/企业的影响

运营商级ARM服务器大规模采购标志着国产ARM生态从"可用"迈向"好用",华为昇腾、昆仑芯等国产AI芯片的配套服务器部署有望加速。

信息来源:新浪财经 | 2026-06-02


⚡ 第5条:小米MiMo-V2.5 API最高降99%,大模型价格战进入"分时代"

核心信息

5月27日,小米宣布MiMo-V2.5系列API永久降价,最高降幅达99%。MiMo-V2.5-Pro缓存命中仅0.025元/百万tokens,标准版更是低至0.02元。同时取消上下文窗口分级定价,Token Plan套餐Token用量提升5-8倍。这是继DeepSeek-V4-Pro永久降价75%后,又一家头部厂商加入价格战。

价格对比

模型

缓存命中(元/百万tokens)

输入(元/百万tokens)

输出(元/百万tokens)

MiMo-V2.5-Pro

0.025

3

6

MiMo-V2.5标准

0.020

1

2

DeepSeek-V4-Pro

0.025

3

6

对开发者/企业的影响

大模型API已从"元时代"进入"分时代",中小企业AI应用开发成本大幅降低。但需注意:MiMo-V2-Pro和Omni系列维持原价未参与降价,厂商通过价格分层引导开发者迁移至最新架构。

信息来源:新浪科技 / ITBear | 2026-05-27


📌 本简报由 英辰朗迪GEO整理

http://www.gsyq.cn/news/1455537.html

相关文章:

  • STM32F103C8T6正交编码器角度采集工程:AB相计数+Z相归零,支持360°整圈映射与多线数适配
  • 2026海南高新技术企业认定代办机构排名|靠谱高企注册流程代办公司推荐 - GrowthUME
  • Arduino与DS18B20温度传感器实战:从单总线协议到多点监测
  • mg3680,mg3650,ts3440,g3800,ts3800,ts9020,ts8180报错5B00,P07,E08,5b02,1704,1700,5b04佳能V6.200,亲测有用。
  • 【ESP32-S3 从入门到精通-06】2026 最新 Wi-Fi 网络开发与配网技术全实战(Station/AP/TCP/UDP/SmartConfig)
  • Nintendo Switch Cleaner and Builder:Switch游戏文件管理的专业一站式解决方案
  • 国产之光 DeepSeek 把 AI 大佬全炸出来了,对 AI 行业竞争格局有何影响?
  • MATLAB脑网络分析专用BCT工具包,支持功能/结构连接矩阵全流程计算
  • 魔兽争霸3终极优化指南:如何让经典游戏在现代电脑上完美运行
  • virtio-win:让Windows虚拟机在KVM/QEMU上实现原生级性能的驱动套件
  • PS去掉图片白色背景的5种方法,PS如何去白底变透明?
  • OpenVoiceV2实战指南:5分钟掌握开源语音克隆核心技术
  • 别再买AI采购SaaS了!真正降本增效的路径是这6种混合部署模式(含成本对比热力图与实施周期甘特图)
  • ESP32太阳能气象站:低功耗设计、云端同步与HomeKit接入全攻略
  • 终极Windows任务栏美化指南:3分钟让你的桌面焕然一新
  • 如何快速掌握云端数据库管理:CloudBeaver完全指南
  • 从“70%搭架子”到一键生成:飞算JavaAI如何重构上下文工程
  • 多智能体强化学习如何实现配电网主动电压控制的终极解决方案:MAPDN深度解析
  • 2026年6月线上一天完工的采暖供应商哪家可靠,暗装暖气片/暖气/地暖管/居家采暖/装修采暖/全屋采暖,采暖公司怎么选择 - 品牌推荐师
  • 【AI面试临阵磨枪-89】Skill 幻觉、参数缺失、格式错误、业务异常如何处理?
  • 深度解析Wine:突破性跨平台兼容技术实战指南
  • 在银河麒麟高级服务器上同步官网软件源并配置内网软件源的保姆级教程
  • 美团:去相关奖励优化多目标学习
  • 【AI面试临阵磨枪-90】Skill 之间如何调用、依赖、组合、编排?
  • 2026 武汉翡翠回收实测,原石玉器回收挑选靠谱商家 - 合扬奢侈品交易中心
  • PaperFlow项目进展记录:MinerU 全文精析与 Editor Pro 进展记录
  • KDiff3文件对比与合并工具:7个技巧让你成为版本管理高手
  • GetQzonehistory终极指南:3分钟学会QQ空间历史说说完整备份
  • 基于ESP32与Ubidots的远程温湿度监测系统实战指南
  • 洗不坏的新 e 选烤火罩,越用越顺手