当前位置: 首页 > news >正文

目标检测算法——YOLO

YOLOYou Only Look Once 的缩写,是目标检测(Object Detection)领域一个革命性的系列模型,由 Joseph Redmon 等人在 2016 年首次提出。

YOLO 的核心理念与 SSD 类似,它是一个单阶段(One-Stage)检测器,但它的方法更加激进和统一。


🚀 YOLO 的核心思想:统一检测

YOLO 的主要目标是实现极高的速度和实时性,它通过将整个目标检测任务(区域建议、特征提取、边界框回归和分类)整合到一个单一的回归问题中来完成:

1. 划分网格 (Grid System)

YOLO 将输入图像划分为一个 $S \times S$ 的网格 (Grid)

  • 负责制: 如果一个目标的中心点落在哪一个网格单元内,那么这个网格单元就负责检测该目标。

2. 直接预测 (Direct Prediction)

每个网格单元都会直接预测出以下信息:

  • 边界框 (Bounding Boxes): 预测 $B$ 个边界框的坐标和尺寸信息。
  • 置信度 (Confidence Score): 每个预测框的置信度,表示该框包含对象的可能性以及预测的准确性
  • 类别概率 (Class Probabilities): 该网格单元包含的目标属于 $C$ 个类别的概率分布。

YOLO 的最终输出是一个 $S \times S \times (B \times 5 + C)$ 的张量。

3. You Only Look Once

这个名字意味着:整个检测流程只需要对图像进行一次前向传播,就能直接得出所有目标的分类和定位结果,极大地加快了速度。


🆚 YOLO 与两阶段模型的对比

特性 YOLO (单阶段) Faster R-CNN (两阶段)
检测步骤 一步到位:作为回归问题,直接预测框和类别。 两步:RPN 提议 $\to$ 检测头精修。
速度 极快(能达到 45 FPS 甚至更高),是实时检测的首选。 较快,但通常慢于 YOLO。
背景误检 。因为它对整个图像进行全局推理,能更好地编码上下文信息。 较高。主要依赖于局部 RoI 的特征。
定位精度 原始版本相对较低。由于网格约束,难以精确预测高度重叠或小物体。 。RoI Align/Pooling 和两阶段精修保证了高精度定位。

迭代与发展(YOLO 系列)

原始 YOLO 模型的缺点在于定位精度较差,特别是对小物体和密集物体。后续的迭代版本不断解决了这些问题:

  • YOLOv2 (YOLO9000): 引入 Batch Normalization、使用锚框(Anchor Boxes)(与 SSD 类似)、使用多尺度训练,大幅提高准确率。
  • YOLOv3: 引入 FPN (特征金字塔网络) 结构,使用多个特征图进行预测(类似于 SSD),改善了对小物体的检测效果。
  • YOLOv4/v5/v7/v8: 这些版本在架构、数据增强、优化技巧(如 $1 \times 1$ 卷积的进一步应用)上不断改进,在速度和精度上都达到了新的平衡点,是目前业界应用最广泛的实时目标检测器之一。

总结:YOLO 以牺牲部分定位精度为代价,实现了目标检测的革命性提速,是目前最受欢迎的实时检测模型系列。

http://www.gsyq.cn/news/56260.html

相关文章:

  • 2025年11月国内箱式变压器,干式变压器,油浸式变压器,高低压成套设备,箱式变电站源头厂家权威推荐与综合实力解析:力王电气集团有限公司
  • 2025年下半年箱式变压器,干式变压器,油浸式变压器,高低压成套设备,箱式变电站公司权威排名表单及选购指南
  • 2025年CNBD测评四川工作服、劳保服、连体服、残疾人服装品牌公司权威排名:金豆服饰领跑行业的技术实力解析
  • OIFC 2025.11.21 模拟赛总结
  • g linux
  • fuse linux
  • 虚幻基础:行为树 - 指南
  • C语言`FILE`结构体 与 Python文件对象 的对比
  • 虚拟机共享文件夹实现自动挂载
  • 专业的技术文档 | Apache Pulsar 如何满足金融级的容灾场景
  • PostgreSQL技术大讲堂 - 第111讲:浅谈向量数据库pgvector的使用
  • 人大金仓kingbase数据库大小写敏感设置
  • 2025年11月最新推荐!云南旅游旅行社口碑排行榜权威发布,帮你选靠谱服务商避坑指南
  • 2025年11月新推荐!云南旅游旅行社口碑排行榜,权威榜单助选靠谱服务商
  • 2025 年 11 月实木定制地板厂家推荐排行榜,纯实木地板,原木地板,定制木地板,多层实木地板,环保实木地板公司推荐
  • function sql的版本兼容性如何
  • Java 分哪些版本 都有什么不同
  • 2025 年 11 月重型机床厂家推荐排行榜,龙门铣床,落地镗铣床,数控立式车床,深孔钻镗床公司推荐,专业制造与高效加工口碑之选
  • 2025 年 11 月 6150 机床厂家推荐排行榜,普通车床,数控车床,精密机床,重型机床公司推荐,实力与口碑双重保障
  • 2025 年 11 月实木地热地板厂家推荐排行榜,纯实木地热地板,多层实木地热地板,环保地热地板,锁扣地热地板公司推荐
  • 2025 年 11 月双头对接机床厂家推荐排行榜,双头对接机床,双头对接机床设备,双头对接机床厂家公司推荐
  • ftp配置linux
  • 2025 年 11 月数控机床厂家推荐排行榜,CNC 数控机床,精密数控机床,数控车床,数控铣床,加工中心厂家推荐
  • 2025 年 11 月实木地板厂家推荐排行榜,多层实木地板,纯实木地板,进口实木地板,环保实木地板公司精选
  • 2025 年 11 月柏尔地板厂家推荐排行榜,实木地板,多层实木地板,地暖地板,环保地板公司推荐,甄选优质材质与精湛工艺!
  • 【新品抢先看】精密拆装新纪元!正点原子S40/S40P 电动螺丝刀,以黑科技定义工具高端新纪元!
  • 2025 XTOOL X100 MAX 2 Key Programmer: 42 Services, ECU Programming, J2534 VCI KC501
  • ftp登录linux
  • GODIAG VAG Test Platform GT110+GT111 CAN-Bus Pogo Pin for 3rd/3.5th/4th Gen VAG IMMO Key Matching
  • 编译Ollama支持AMD Instinct MI50显卡,并调用ROCm7.0.2,实现Qwen3 VL模型支持