LeNet-5 是什么
LeNet-5 是深度学习先驱 Yann LeCun 等人在 1998 年提出的经典卷积神经网络(CNN),是现代 CNN 架构的奠基性开山之作。它最初设计用于 MNIST 手写数字识别任务,凭借「卷积提取特征 + 池化降维 + 全连接分类」的极简结构,成为了 FPGA 硬件加速入门的首选标准网络。
一、标准网络结构
LeNet-5 共 7 层可训练层(不含输入层),输入为 32×32 的单通道灰度图,最终输出 10 个分类结果(对应数字 0~9),完整层级如下:
| 层级 | 类型 | 核心参数 | 输出尺寸 |
|---|---|---|---|
| Input | 输入层 | 单通道灰度图 | 32×32×1 |
| C1 | 卷积层 | 6个5×5卷积核,无填充 | 28×28×6 |
| S2 | 池化层 | 2×2 平均池化,步长2 | 14×14×6 |
| C3 | 卷积层 | 16个5×5卷积核,无填充 | 10×10×16 |
| S4 | 池化层 | 2×2 平均池化,步长2 | 5×5×16 |
| C5 | 全连接卷积层 | 120个神经元 | 1×1×120 |
| F6 | 全连接层 | 84个神经元 | 84 |
| Output | 输出层 | Softmax 分类 | 10 |
它的核心设计范式沿用至今:用卷积层提取局部空间特征,用池化层压缩特征尺寸、扩大感受野,最后用全连接层完成分类输出。现在的 ResNet、YOLO 等复杂网络,本质都是在这个基础框架上做的扩展。
二、核心特点
- 结构极简,算子单一
整个网络只用到卷积、池化、全连接三种算子,没有残差、注意力、归一化等复杂结构,逻辑清晰,非常适合作为硬件加速的入门验证对象。 - 计算量小,资源门槛低
整体参数量仅约 6 万,计算量极低,在 Zynq-7000 这类中低端 FPGA 上就能完整实现纯 PL 端加速,不需要过高的资源储备。 - 验证标准成熟
配套 MNIST 手写数字数据集,有大量公开的参考模型、精度指标和测试用例,软硬件对齐有明确的对标依据。
三、和你当前项目的关联
你刚打通的「卷积 + 池化」级联卷积块,正好对应 LeNet-5 里的C1+S2、C3+S4两组核心单元,是实现 LeNet-5 硬件加速的核心底座。
从当前进度推进到完整 LeNet-5 推理,只需要补充 3 项能力:
- 多通道支持:将当前单通道卷积/池化 IP,扩展为支持多输入通道、多输出通道,匹配 C1→S2→C3→S4 的通道维度变化。
- 卷积核尺寸扩展:从当前 3×3 卷积扩展支持 5×5 卷积,适配 LeNet-5 的标准卷积核尺寸(也可以做简化版,用 3×3 替代)。
- 全连接层 IP:新增一个全连接层硬件加速模块,完成 S4 到最终分类输出的计算。
全部实现后,就可以在你的 Zynq 平台上跑通端到端的手写数字图片分类推理,从「单个算子验证」升级为「完整 AI 模型硬件加速」,是非常合适的下一阶段里程碑。
