当前位置: 首页 > news >正文

揭秘 Intel 8087 浮点芯片加法器:69 位运算提速 100 倍,性能优化有何奥秘?

Intel 8087 浮点芯片核心的加法器

1980 年,Intel 推出了 Intel 8087 浮点协处理器,能让数学运算速度提升高达 100 倍。除基本算术和开方运算外,还能计算超越函数,这依赖于一个 69 位的加法器。专利中描述,浮点执行单元的算术核心围绕着一个由加法器及其相关寄存器、移位器和控制电路组成的纳米机器。显微镜下的 8087 芯片裸片,边缘键合线将芯片与 40 个外部引脚相连,裸片图案由金属布线、多晶硅和硅构成。芯片顶部的总线接口单元与系统其他部分相连,负责与主 8086 处理器和内存协调,指令由中间的大型微代码只读存储器定义。裸片下半部分是“数据路径”,分为指数和小数数据路径,加法器位于小数数据路径中间,指数加法需将指数复制到小数数据路径。

加法器的结构

构建二进制加法器不难,难的是让它运行更快,关键在于处理进位。8087 的加法器将加法运算拆分为 4 位一组的块,采用两种技术加快块内计算速度,减少进位步骤。加法器有两个输入,每一位的和通过对输入及进位进行异或运算得到,中间值被称为“传播”。1959 年,曼彻斯特大学研究人员为 Atlas 计算机开发了曼彻斯特进位链技术,基于生成、传播和删除的概念构建,信号可并行计算。8087 采用优化的曼彻斯特进位链电路,将生成和删除情况合并。进位链被分成 4 位一组的块,由“进位跳过”电路刷新进位。加法器为优化性能,使用 NMOS 晶体管,进位线预充电到 5V 再拉低,块中最后一个多路复用器有四个输入。生成“propagate”信号的电路存在复杂情况,“B”输入可被“forceZero”信号阻断。加法器划分为 4 位一组的块,使用曼彻斯特进位链和进位跳过电路优化性能,但仍需两个时钟周期完成一次加法运算。

硅片中的加法器

4 位块电路在裸片上垂直堆叠形成完整加法器。金属层呈现为白色线条,8087 只有一层金属层,金属布线紧密排列。左侧粗垂直金属走线是接地,右侧是电源,水平走线为加法器块内部提供布线,两侧垂直线是控制信号及与芯片底部电路的连接。移除金属层后,能看到硅和多晶硅电路,多晶硅与掺杂硅交叉形成晶体管,电路复杂不规则,通过水平金属线连接。图片左右两侧无晶体管,多晶硅线加宽以降低电阻,硅被“浪费”用于垂直布线。

加法器的规模

尽管 8087 名义上小数采用 64 位值,但加法器接收 69 位输入并生成 70 位输出。原因包括使用三个额外低位比特用于舍入,B 寄存器值可加倍需多一位,小数总线和 B 值取反需多一位。两个大数相加结果可能需多一位,和移位器可将输出右移两位缩减至 68 位,“额外”的位由专用寄存器支持。

周边电路

加法器输入来自小数总线和 B 寄存器,输出存储在和寄存器中。8087 为加快乘法运算使用基 4 Booth 乘法,乘数存储在跳过移位器中,根据位情况加上不同值,加法器输出由和移位器右移两位后存储在和寄存器。除法通过重复减法、加法和移位操作实现,结果比特位在商寄存器中累加。平方根实现类似手工开平方,跳过移位器提供两位附加到加法器输入右侧,进行减法或加法操作,平方根在 B 寄存器中形成。乘法、除法和开平方运算的循环操作在硬件中实现,指令需大量微代码准备参数、处理指数、处理特殊情况并存储结果。

结论

8087 专利强调加法器的重要性,其性能对 8087 整体性能至关重要。虽有更快加法方法,但对 8087 有限晶体管数量不可行,8087 在复杂度和性能之间平衡,采用带有进位跳过加法器的曼彻斯特进位链。

http://www.gsyq.cn/news/1523144.html

相关文章:

  • 遗传算法工程落地指南:从理论到可运行代码的实战降维
  • 抑郁症状动态建模:基于Reddit行为-语言耦合的临床级NLP分析
  • AI工程师必读的10篇底层论文:从Transformer到RAG的工程穿透力地图
  • 掌握AI教材写作技巧!低查重工具助力,轻松打造专属优质教材!
  • 如何用MAA明日方舟助手一键完成全日常任务:终极免费自动化指南
  • 题解:学而思编程 小明的U盘
  • 从‘半选’状态聊起:如何用QSS为PyQt5/PySide2的QCheckBox设计一套专业的UI组件库?
  • Ferret多模态模型:实现像素级UI理解与指哪打哪的视觉-语言对齐
  • 2026青岛七区三市逸程手表回收指南六大维度测评 - 逸程
  • 广州同城就近选宠攻略!六大门店分区详解,不用跑远就能挑靠谱萌宠 - 润富黄金回收
  • 2026湖北武汉高三复读集训营哪家好 分层教学+心理疏导|复读提分实操指南 - 善良的阿良
  • 2026年工业润滑油/液压油/齿轮油/切削液/导热油/长城卓力普力源头厂家品牌推荐:专业润滑与防腐性能深度解析 - 品牌发掘
  • 遗传算法工程实战:动态架构、自适应调参与收敛诊断
  • Hitboxer终极指南:专业级键盘重映射与SOCD解决方案
  • 2026淮安厂区电能质量测试评估放心机构 TOP + 实地测评 + 详细地址电话 - 中检检测集团
  • 2026合肥中考仅 200 分无缘普高,2026 技能特色班定向培养,不用打工也能升学 - cc江江
  • 2026安徽省中考 400 分临近建档线,寿春合作班 + 职教对口两条升本路 官方最新发布 - cc江江
  • 数据不平衡不是技术问题,而是业务理解的试金石
  • 网络研究观-严重漏洞允许以 root 用户身份执行任意命令:CVE-2026-0273 分析
  • 深度净化显卡驱动:Display Driver Uninstaller实战指南
  • Triton模型服务化实战:从Notebook到高可用生产部署
  • 从信息论到损失函数:KL散度和交叉熵在TensorFlow/Keras项目里到底怎么选?
  • 2026淄博大众首选贵金属回收商户名录 TOP 金条、铂金、白银线下回收门店信息一览 - 中业金奢再生回收中心
  • N皇后遗传算法实战:Python手写GA核心模块与调参指南
  • 广州家庭养宠适配测评!老人、小孩、上班族适合养什么猫狗?听劝不踩雷 - 润富黄金回收
  • LizzieYzy:围棋AI分析工具的终极指南,免费提升棋力的完整方案
  • 2026中山除甲醛公司服务实测测评:5家主流品牌价格效果售后全面对比报告 - 环保除醛知识库
  • 2026 年 6 月金价高位变现行情分析 - 润富黄金回收
  • 2026安康本地水质检测饮用水检测哪家强?TOP 正规机构榜单 + 联系方式 - 中安检测集团
  • 大模型幻觉治理实战:六类可落地的全链路防御方案