当前位置: 首页 > news >正文

OpenAI 9 个月自研芯片 Jalapeño,推理成本砍半,ChatGPT 体验将大升级!

【导语:OpenAI 刚刚推出了自研芯片 Jalapeño,专为大模型推理设计。仅用 9 个月就完成开发,还借助 AI 设计芯片。这一突破将大幅降低推理成本,改变 ChatGPT 用户体验,也让 OpenAI 迈向全栈 AI 公司。】


9 个月刷新 ASIC 开发纪录

OpenAI 推出的自研芯片 Jalapeño,专为大模型推理设计。从 9 个月前的白纸一张,到如今工程样片跑通 GPT - 5.3 - Codex - Spark,且频率和功耗均达量产目标。通常先进半导体行业设计高性能 ASIC 需 18 到 24 个月,如 Google TPU 两年一代,Amazon Trainium 也类似,但 OpenAI 仅用 9 个月,刷新了先进半导体领域最快的 ASIC 开发周期。

AI 助力芯片设计

Jalapeño 更值得关注的是其设计方式,OpenAI 自家 AI 模型参与了芯片的设计和优化。AI 设计芯片并非新鲜事,Google 2021 年就用强化学习做芯片布局,速度比人类快几个数量级,此后 AlphaChip 连续优化了三代 TPU 布局方案。OpenAI 硬件团队掌门人 Richard Ho 来自这个圈子,他参与发明了 ML 设计芯片架构的方法。芯片设计中最耗时的验证环节需跑成千上万次,AI 擅长读历史设计数据、生成 RTL 代码、辅助验证和 debug、优化布局布线,替人扛掉了大部分磨人的工作。

推理成本降低,ChatGPT 体验升级

OpenAI 每年算力支出达百亿美元级别,这些成本最终由用户承担。Jalapeño 使推理成本砍半,普通用户最先能感受到响应变快,因为现在 ChatGPT 高峰期排队、转圈、长对话变慢本质是算力不够。推理效率提升后,同等服务器能服务更多用户。其次,免费版能力有望放开,现在很多功能锁在 Plus 里,成本降低后下放给免费用户的可能性增大。长远来看,月费不变但用户获得的能力可能翻几番。

OpenAI 迈向全栈 AI 公司

OpenAI 要做全栈 AI 公司,模型自己训,芯片自己设计,推理自己优化,部署自己控制。此前和 Cerebras 合作推理部署,让 OpenAI 摸清了专用推理硬件的价值。现在自己下场做,把经验变成可控平台。与 Apple 和 Google 不同的是,OpenAI 用 AI 加速 AI 基础设施建设,再用更好的基础设施跑更强的 AI。首批 GW 级数据中心将和 Microsoft 等合作方从 2026 年底开始部署。Jalapeño 只是第一代,未来值得期待。

编辑观点:OpenAI 自研芯片的突破意义重大,不仅提升了开发效率,还将改善用户体验,推动 AI 应用普及。其全栈 AI 模式有望形成良性循环,加速 AI 技术发展。

http://www.gsyq.cn/news/1595924.html

相关文章:

  • 天河应用大讲堂 | 基于人工智能的天气预报技术发展趋势
  • 打通企微接口,构建适配 GEO 检索规则的结构化素材库
  • 从安装到调优,Strix Halo 本地大模型一周使用实录
  • C++跨平台(一):开发概述与策略选择
  • 合同系统智能化,让企业合同管理快人一步!
  • iOS网络安全实战:AFNetworking证书锁定防御中间人攻击
  • 《赣州市本级政府投资数字化项目费用编制指南》(赣市财审字〔2026〕2号)标准解读
  • 什么是企业号码认证?
  • Gogs高危漏洞实战:从原理到修复的完整安全加固指南
  • 开源编程Agent来了,企业AI选型三大新命题 - 微元算力(weytoken)
  • AI专著写作高效之道:借助AI工具,轻松打造20万字优质专著!
  • QuickQanava 源码阅读笔记(二):edge、容器适配器与 noexcept 的极致
  • 国家社科基金项目申报资料(含申报书范本,立项清单、各阶段报告及申报经验)
  • AI写论文有妙招!4款AI论文生成工具,解决你的写作难题!
  • QMCDecode:macOS上快速解密QQ音乐加密音频的终极指南
  • 山东先进网上阅卷公司有哪些
  • CAD Electrical 2027安装教程(2026年保姆级超详解)【附安装包+电气符号原理图指南】
  • 从Kac-Moody代数到群概形:构造、完备化与仿射型实现
  • 传统食品企业数字化转型案例:河北康贝尔的直播破局之路
  • 大厂Agent架构我拆了三遍,发现一人公司只需要3个文件(附模板)
  • Moto 手机自带天气不会用?桌面插件一键添加城市,不用下载第三方 APP
  • 半年估值暴增2.5倍!Baseten融资15亿美元,成AI推理时代基础设施宠儿
  • Visual C++ Redistributable AIO:一站式解决Windows运行库缺失问题的终极指南
  • 源头厂家优势凸显!无锡百瑞德TIG热丝堆焊设备厂家实力解读
  • 按键精灵实现HMAC-SHA512加密:突破自动化脚本加密验证瓶颈
  • Photoshop下载教程Photoshop PS2026 保姆级安装步骤(附安装包)
  • 1985-2024年各省市区县绿色低碳专利申请与授权量
  • 无线感知与分布式LLM:边缘计算下的高效智能决策系统
  • LosslessCut无损视频剪辑:3分钟掌握专业级无损编辑技巧,告别画质损失烦恼
  • 终极文本到图像生成工具:NMKD Stable Diffusion GUI深度解析