当前位置: 首页 > news >正文

美光 CEO 放了一句狠话:别低估造内存,这玩意比你想的难得多

美光 CEO 放了一句狠话:别低估造内存,这玩意比你想的难得多

重点不是“内存很重要”,而是 AI 改变了存储行业的产能分配。

美光 CEO 桑杰·梅赫罗特拉最近对存储供需给出了一条很明确的判断:紧张会持续到 2026 年以后,而且不只是 HBM。

这不是泛泛地说“AI 需要更多内存”。他的逻辑是,AI 正在同时抬高 DRAM 的容量需求、带宽需求和单位晶圆的资源消耗,而新增供给没法在一两年内补上。

HBM 抢走的,不是一小块高端市场

HBM 是 AI 加速卡使用的高带宽内存。它的价值不只在售价高,更在于它会占用更多制造资源。

  • 高性能 DRAM 的裸片面积更大,单位可销售容量消耗更多晶圆;
  • 多层堆叠、测试和先进封装增加了后段工序;
  • 产品需要经过更长的客户验证,产能不能像消费级内存一样随时切换;
  • 良率要同时过前段晶圆、堆叠、封装和系统测试几道关。

因此,HBM 占比提升的结果不是“多了一条产品线”,而是同样的晶圆投入,能变成的可销售 bit 变少了。

这也是为什么市场会同时看到 HBM 紧、服务器 DRAM 紧,甚至 DDR4 也开始紧。DDR4 不直接受益于 AI,但供给端正在主动退出成熟产品,把资源转向更高增长、更高利润的产品;只要旧平台的需求退得没那么快,交期和价格就会重新承压。

真正的瓶颈是量产,不是设计一颗芯片

桑杰反复强调,存储制造不能被低估。

一颗逻辑芯片出了问题,可能影响一个模块;存储芯片里却有数以万亿计的 bit。它们要在性能、功耗、可靠性和可测试性之间同时达标,还要把良率爬到能够大规模交付的水平。

今天的难度还在增加:行业不再只靠制程缩小来取得明显的 bit 增长,同时还要面对更高带宽、更低功耗和更复杂封装。

所以存储的护城河并不只是 IP 或设备采购能力,而是长期积累的工艺、材料、良率和规模化运营能力。DRAM 市场最终只剩少数大型供应商,并不是偶然。

为什么扩产解决不了眼前问题

一座新存储晶圆厂,从破土到稳定出片通常要三到四年,之后仍要经历设备安装、工艺导入和良率爬坡。

但 AI 的需求变化按季度发生。

模型参数增加、上下文窗口变长、推理并发上升,都会推高内存占用。尤其是推理侧,KV Cache 会随着对话长度和并发请求持续占用资源。模型能否服务更多用户,不只取决于 GPU 数量,也取决于内存能否装下并持续读取这些上下文。

这就形成了典型错配:供给按“年”扩张,需求按“季度”变化。

2000 亿美元,投的是下一轮有效产能

美光的美国投资计划规模达到 2000 亿美元,马纳萨斯扩建、爱达荷和纽约项目是其中的关键节点。

这笔钱的重点不是立刻多卖多少内存,而是提前锁定厂房、基础设施和未来设备安装空间。设备投入仍会跟着需求预测和技术进展调整,这也是美光所说的“有纪律的投资”。

对服务器、云厂商和 AI 基础设施公司来说,需要盯住的不是单一内存价格,而是三件事:

  1. HBM 扩张是否继续挤压通用 DRAM 的有效供给;
  2. 服务器内存的交期和 BOM 成本是否开始影响整机交付;
  3. GPU、HBM、DRAM 和先进封装能否一起交付,而不是某一项单独到货。

桑杰的判断可以概括成一句话:AI 的需求不是一次性买卡,而是持续消耗存储容量、带宽和晶圆产能。

存储周期当然不会消失,供过于求仍可能发生。但 AI 已经改变了存储在系统中的位置:它不再是算力扩张的配角,而是决定 AI 集群能不能继续扩张的硬约束。

http://www.gsyq.cn/news/1586692.html

相关文章:

  • 汽车网络安全工程实践:从ISO/SAE 21434标准到TARA与安全设计落地
  • 30分钟构建与部署OpenEMS:从零搭建开源能源管理系统
  • 长肥网络下的单流拥塞控制对比:BBR vs KCC
  • Redis容器重启循环问题排查与数据持久化完整指南
  • 人机协作新范式:2026年不容错过的专业AI论文软件
  • 跨国出差网络自动切换方案的工程实践
  • 如何彻底移除Microsoft Edge:EdgeRemover工具完整指南
  • 如何快速上手Windows 12网页版:面向新手的终极在线体验指南
  • HarmonyOS NEXT和Android到底有什么区别?看完这篇你就懂了
  • 鸿蒙 ArkTS 实战:Morning Checklist 从状态建模到交互闭环完整解析
  • AI智能体落地实战:长时记忆与端云协同的工程突破
  • HarmonyOS应用<节气通>开发第50篇:应用上架全流程——从签名到审核通过
  • MPC885 MMU与TLB机制深度解析:从寄存器操作到性能优化实战
  • Rust WebSocket安全实践:基于rustls的TLS加密与生产环境部署
  • SpringBoot中文乱码终极解决方案:JVM、Logback与VSCode终端编码对齐
  • Wireshark抓包诊断Claude-Code本地执行失败
  • Claude Code+GLM-5+Superpowers:Windows本地智能编程工作流
  • OpenClaw:面向业务流程的智能体操作系统架构解析
  • Claude Code Auto Mode:CLI驱动的VS Code智能协同范式
  • MATLAB集成大语言模型:领域专家构建RAG与智能工作流实战
  • Wireshark 2025 安装与实战:从零掌握网络抓包分析
  • DDR内存控制器核心机制:时序、刷新与ECC原理详解
  • Trae Skills模式:面向Bug工程化的可验证修复工作流
  • CVE-2025-59718漏洞深度剖析:SAML SSO身份认证边界的攻防实战
  • Nginx实战:一键修复HTTPS混合内容警告的完整方案
  • DeepSeek导出插件深度指南:PDF/Word/Markdown无损导出方案
  • VChart Skills:前端图表开发的语义化工程范式
  • 资源约束下的创新:最小可行方案与工具链整合实践
  • 深入解析PowerPC MPC823中断、寄存器与指令执行机制
  • Arduino人体感应心跳灯:从HC-SR501传感器到WS2812B灯光控制