【RT-DETR实战】152、改进二:引入BiFPN与ASFF增强特征融合
昨天深夜调一个产线瑕疵检测模型,FPN输出的特征图在微小缺陷上总是漏检。盯着热力图看了半天,发现深层特征确实抓到了缺陷轮廓,但浅层的位置信息却没能有效融合进来。
这让我想起两年前在部署YOLO时遇到的类似问题——特征金字塔的“暴力拼接”在复杂场景下确实力不从心。
一、为什么传统FPN在RT-DETR里不够用?
RT-DETR的骨干网络输出多尺度特征,传统FPN采用自上而下的单向融合。
但实际部署时发现三个问题:小目标在深层特征中几乎消失、不同尺度特征权重固定、计算量随着层数堆叠线性增长。上周测试车间传送带上的芯片划痕检测,传统FPN的mAP比论文指标低了7.8%,问题就出在这里。
二、BiFPN的实战改造
直接搬用EfficientDet的BiFPN会引入额外计算开销,这对实时检测是致命的。我们的改造方案是:
classLightBiFPN(nn.Module):def<