当前位置: 首页 > news >正文

AI设计芯片从论文走进现实:开源平台、强化学习与9个月流片的背后

Jalapeño的9个月流片不是孤例。

在OpenAI和Broadcom联手冲刺高性能ASIC的同时,另一条更安静但也更深远的路正在铺开——开源AI芯片设计平台、强化学习驱动的EDA工具、以及让普通人也能玩芯片的共享流片服务。这条路不只为巨头而建,而是试图把芯片设计的门槛降到让更多公司和个人都能参与的程度。

当"AI设计芯片"这个命题从Nature论文走向可部署的开源工具链,它对半导体行业的冲击可能比任何单颗芯片都大。

本文信息主要来源:OpenAI官网、DARPA IDEA/OpenROAD项目文档、OpenLane开源项目、Tiny Tapeout平台、Google Brain《A Graph Placement Methodology for Fast Chip Design》(Nature 2021)、Cadence/Synopsys公开产品资料。

一、DARPA的一盘大棋:OpenROAD

故事可以从2018年说起。

那一年,DARPA启动了IDEA(Intelligent Design of Electronic Assets)项目,其中一个核心子项目叫OpenROAD——“Foundations and Realization of Open, Accessible Design”。项目团队由加州大学圣地亚哥分校(UCSD)领头,Qualcomm和Arm参与,目标是打造一个完全自主、开源的数字SoC布局生成工具链。

DARPA对OpenROAD的要求极其激进:无人干预(No-Human-In-Loop)的芯片设计,24小时内完成,且功耗-性能-面积(PPA)不损失。

这意味着从RTL代码到GDSII版图的全流程,必须由机器自动完成,不需要人类工程师介入做Floorplan调整、时序收敛或DRC修复。

这背后的技术核心是机器学习。OpenROAD使用ML模型来预测和优化流片的各个阶段——在综合、布局和布线过程中,通过高效建模来替代传统上需要老工程师十几年经验才能做好的"直觉判断"。面对24小时的硬约束,系统还必须将大规模设计智能分解为可并行求解的子问题,再通过分布式计算资源重组结果。

OpenROAD在DAC-2019(EDA领域最顶级的学术会议)上发表了第一篇论文,目前已经在GitHub上积累了大量星标,并且成功流片了多个真实芯片——包括Google的OpenTitan安全SoC(使用GlobalFoundries 12nm工艺)。这意味着开源EDA工具链已经具备在先进工艺节点上完成真实商业芯片设计的能力。

二、OpenLane + Tiny Tapeout:让芯片设计变得像搭积木

在OpenROAD的基础上,一个更"接地气"的开源项目冒了出来:OpenLane。

OpenLane是一个完整的RTL-to-GDSII自动化流程,它将OpenROAD、Yosys(开源综合工具)、Magic(版图编辑器)、Netgen(LVS验证)、KLayout(版图查看器)等一系列开源工具整合成一条龙服务。用户只需要写好RTL代码和一个配置文件,OpenLane就能自动跑完从综合到最终版图的全流程。

当前OpenLane支持两个开源PDK:SkyWater 130nm(sky130)和GlobalFoundries 180nm(gf180mcu)。开源PDK的存在至关重要——传统芯片设计的一个巨大门槛就是工艺设计套件(PDK)的获取。台积电和三星的先进PDK需要签NDA、交数十万美元的许可费才能拿到。而SkyWater和GlobalFoundries将部分工艺的开源PDK放出,使得任何人在任何地方都可以用真实的Foundry工艺做芯片设计。

在此基础上,Tiny Tapeout的出现进一步降低了"做一颗真实芯片"的门槛。

Tiny Tapeout是一个共享流片平台。它的模式很简单:将一颗晶圆上的空间切割成数百个"小格子"(tiles),每个设计者提交自己的设计(可以小到一个逻辑门,大到一个小型SoC子模块),所有人的设计被拼接成一块完整的芯片,共享一次MPW流片的成本。

2026年,Tiny Tapeout被欧洲开源学院(European Open Source Academy)评为奖项得主,评价是"被广泛视为现代IC设计教育中不可或缺的平台"。在学术出版物TechRxiv上,Tiny Tapeout团队发表了一篇详细介绍其共享流片模式的论文。

这意味着什么?一个大学生,用浏览器上的Wokwi图形化工具画好电路图,点几下鼠标,几个星期后就能收到一颗自己设计的、在真实硅片上跑着的芯片。

这在五年前是不可想象的。

三、Google的Nature论文:用强化学习做芯片布局

2021年6月,Google Brain团队在Nature上发表了一篇封面文章:《A Graph Placement Methodology for Fast Chip Design》。这篇论文让"AI设计芯片"这个概念第一次进入公众视野。

论文的核心思路是用强化学习来解决芯片的宏单元布局(Macro Placement)问题。传统上,芯片布局是EDA流程中最依赖人类经验的环节之一——工程师需要反复调整SRAM、模拟IP等大模块的位置,试图在面积、布线拥塞、时序之间找到最优平衡。一次布局迭代可能需要数周。

Google的方法是将芯片布局建模为棋盘游戏:芯片版图是棋盘,宏单元是棋子,奖励函数是线长、拥塞和时序的加权组合。一个基于图神经网络的策略网络在数十亿次自我对弈中学会了如何布局。最终训练出的模型可以在6小时内完成一块谷歌TPU芯片的布局规划,而人类团队通常需要数周——并且AI方案在PPA指标上与人工方案相当甚至更优。

这篇论文之所以重要,不是因为谷歌用AI做了芯片——而是因为它证明了一个新范式:芯片设计的核心环节可以用机器学习自动化,而且质量不输人类老法师。

这是OpenROAD、Cadence Cerebrus、Synopsys DSO.ai和OpenAI Jalapeño背后共同的逻辑起点。

四、AI EDA的技术原理:三个范式

当前AI参与芯片设计的技术路线大致可以归纳为三个范式:

范式一:强化学习驱动优化。这是最成熟的路线。以Cadence Cerebrus和Synopsys DSO.ai为代表,AI代理在整个搜索空间中自动探索不同的布局、时钟树、布线方案,通过奖励信号(PPA改进)找到人类工程师难以手工穷举的最优配置。本质上是用机器的算力替代人类的经验——人可以尝试5种Floorplan,AI可以在同样的时间内尝试500种。

范式二:预测模型辅助决策。OpenROAD大量使用这种方法。机器学习模型在流程的各个阶段预测最终PPA结果——比如在综合阶段就预测布线后的时序收敛概率,或者预测某个区域的热点密度。这样可以在早期就发现潜在的"定时炸弹",而不必等到布线完成后才发现时序违规然后回退重做。预测模型的本质是"用学习替代重试"。

范式三:生成式AI辅助设计。这是2024-2025年兴起的新方向。大语言模型和扩散模型被用于辅助甚至自动生成RTL代码、测试用例和设计约束。典型场景是:设计师用自然语言描述一个接口协议,AI自动生成符合协议的Verilog代码和对应的UVM验证环境。在模拟/混合信号领域,生成式模型也被用于自动确定运放、Bandgap等模拟电路的初始尺寸——这些工作传统上需要资深模拟设计师手工计算和仿真迭代。

三个范式可以叠加使用。以Jalapeño为例,OpenAI提到"使用了自研模型加速设计的一部分"——这可能覆盖了从架构探索(范式三)、布局优化(范式一)到时序预测(范式二)的多个环节。正是这种叠加效应,才使得9个月流片成为可能。

五、对半导体行业的深层影响

当AI设计芯片从实验走向实用,半导体行业的游戏规则正在被重写:

设计效率的阶跃式提升。传统芯片设计周期18-24个月,而OpenROAD的目标是24小时,Jalapeño做到了9个月。虽然24小时"无人干预"的设计目前仅适用于中等规模芯片,但趋势是明确的——AI参与度越高,设计周期越短。如果设计周期压缩50%成为新常态,那么产品的迭代速度、对市场机会的响应速度都将发生质变。

设计民主化。OpenLane + SkyWater 130nm + Tiny Tapeout的组合,让一个没有流片预算的小团队也能做出真实芯片。这不是概念验证——已经有数百个设计通过Tiny Tapeout成功流片。当芯片设计的边际成本趋于零时,创新将从"谁能筹到几百万流片费"变成"谁有更好的创意"。

EDA工具链的重构。Cadence和Synopsys的AI EDA工具虽然强大,但每套许可证年费可达百万美元。而OpenROAD和OpenLane是开源的、免费的。开源EDA目前在先进工艺节点的支持上还不够完善(5nm/3nm的DRC规则尚未进入开源PDK),但130nm和180nm的开源PDK已经足够覆盖大量IoT、传感器、电源管理芯片的需求。对于年出货量数十亿颗的通用芯片市场而言,130nm不仅够用,而且是最佳的成本节点。

对行业竞争格局的影响。当芯片设计工具平民化、AI辅助设计成熟化,传统的"大公司才有能力做芯片"的壁垒正在被侵蚀。小团队可以更快地试错、更便宜地流片、更灵活地调整设计。这会倒逼大公司加速创新——如果不能比小公司快,就会被蚕食。

六、结语:工具民主化比单颗芯片更重要

Jalapeño是一个工程奇迹——9个月流片、每瓦性能远超SOTA。但真正改变游戏规则的,不是这一颗芯片。

是OpenROAD让芯片布局变成可并行求解的数学问题。

是OpenLane让任何人用一行配置文件就能跑完RTL到GDSII。

是Tiny Tapeout让一个学生花几十美元就能拥有一颗自己设计的硅片。

是Google的Nature论文让全世界相信AI可以比人类做得更好。

当工具不再被少数垄断者控制,当技术门槛降到"你会写代码就能做芯片",半导体行业的创新将不再是"我们有X亿研发预算所以我们可以做"的逻辑,而是"我们有一个新想法,所以我们马上可以验证"。

这才是AI设计芯片最深层的意义。


参考资料

[1] OpenAI, “OpenAI and Broadcom unveil LLM-optimized inference chip,” Jun. 24, 2026. https://openai.com/index/openai-broadcom-jalapeno-inference-chip/

[2] DARPA IDEA / OpenROAD Project, “Foundations and Realization of Open, Accessible Design,” UC San Diego, 2018-present. https://theopenroadproject.org/

[3] OpenROAD Team, “Toward an Open-Source Digital Flow: First Learnings from the OpenROAD Project,” DAC 2019. https://vlsicad.ucsd.edu/Publications/Conferences/371/c371.pdf

[4] OpenLane Documentation, “Automated RTL to GDSII Flow.” https://openlane.readthedocs.io/

[5] Tiny Tapeout, “Shared Silicon Tapeout Platform.” https://tinytapeout.com/

[6] M. Venn et al., “Tiny Tapeout: A Shared Silicon Tapeout Platform Accessible to Everyone,” TechRxiv, 2024. https://www.techrxiv.org/users/799365/articles/1165896

[7] A. Mirhoseini et al., “A Graph Placement Methodology for Fast Chip Design,” Nature, vol. 594, pp. 207–212, Jun. 2021.

http://www.gsyq.cn/news/1643632.html

相关文章:

  • 深入理解Go语言内存模型与优化
  • 探秘MIPI接口:高速低功耗的移动显示黑科技
  • 2026年上海同城搬家公司市场格局解析与选型指南:服务升维之战
  • Web渗透测试项目学习心得
  • 微信语音如何转发并保存为MP3格式?并下载本地
  • 使用OpenAPI生成前后端接口文档
  • 响应式设计与移动优先的前端开发策略研究
  • 腾讯智影数字人播报功能解析:3步定制AI主播与多场景应用
  • 基于51单片机 stm32单片机汽车胎压监测轮胎压力气压无线传输报警32(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_
  • 2026年艺术类教育小程序开发平台有哪些?艺术类教育小程序开发平台推荐
  • MFC 自定义纯色居中文字进度条控件
  • 组件驱动开发环境构建可复用用户界面库
  • Python实现跨境电商AI图片批量翻译流程解析
  • STM32工具软件
  • Scala的偏函数与模式匹配
  • 2026最新1款免费学生党平替AI原生IDE vibe coding权威实测实战指南
  • 百度翻译 JS 逆向 2024:3步定位 sign 加密函数与 Python execjs 调用实战
  • 松下伺服电子齿轮比计算:从脉冲当量到参数设置的 3 个实战案例
  • YOLOv1 损失函数代码实现:从公式到 PyTorch 5 大组件拆解与调试
  • Node-RED 2.3+ 安全加固实战:5步配置HTTPS与用户鉴权,告别1880裸奔
  • 2026 AI工程师路线图:从RAG到MCP的生产级实践
  • 免费BT下载加速终极指南:用trackerslist让下载速度提升300%
  • VGG16 特征提取实战:小数据集猫狗分类 89% 准确率,仅训练 32 轮
  • 基于EtherCat全总线方案的8轴喷涂拖拽示教方案
  • CA-MKD 置信度感知多教师蒸馏:PyTorch 复现与 CIFAR-100 3教师实验对比
  • Web 安全防御:从 4 个维度构建 XSS 防护体系(附代码示例)
  • JDBC 连接串安全配置指南:SSL/TLS 与 3 类敏感参数避坑实践
  • 深入浅出 DeepSeek 多轮对话系统设计:手把手打造智能聊天助手
  • 如何一键获取八大网盘真实下载地址:开源下载助手的终极解决方案
  • 把委托说透(2):深入理解委托