当前位置: 首页 > news >正文

【RV1126B 实战连载 03】从YOLOv5到YOLO26,RV1126B 通用目标检测模型部署实测

前言:

本期聚焦:作为眺望电子RV1126B实战连载的第三篇,针对YOLO系列目标检测模型,我们选取了跨越三个代际的版本:作为经典工业利器的YOLOv5、新一代性能跃升的YOLO11,以及2025年发布的里程碑之作YOLO26。三代模型将在同一个IPC-RV1126B套件上接受部署实测展示。

目标检测(Object Detection),从图像中同时识别”是什么物体”和”物体在哪里”,早已成为计算机视觉领域的核心任务。自动驾驶需要它识别路上的行人和车辆,智慧安防依赖它实现异常行为的实时告警,机器人视觉更需要它来理解三维空间中的物体位置。可以说,无论机器需要”看见”并”理解”什么样的世界,目标检测都在其中发挥着不可替代的作用。

眺望电子推出的RV1126B AI视觉开放平台为中小型视觉模型的端侧部署提供了扎实的硬件底座。平台同时兼容SC450AI和IMX415等主流摄像头模组,通过MIPI CSI接口实现图像采集与NPU推理的紧密耦合,开发者可以较便捷地完成从模型转换到摄像头实时推演的全流程验证。

一、YOLO系列模型演进

YOLO(You Only Look Once)是计算机视觉领域最具传奇色彩的模型,在将近十年的时间里持续引领着实时目标检测的技术风向。从2016年第一版问世至今,YOLO经历了一次次架构迭代,每一次都针对前代模型的性能瓶颈进行精准突破。理解这段演进脉络,有助于我们在RV1126B上做出更明智的模型选型决策。

1.1YOLOv5

YOLOv5的真正魅力在于它找到了一个罕见的平衡点:它的精度足以应对大多数工业检测场景,而速度又快到可以在普通GPU甚至部分边缘设备上流畅运行。对于开发者而言:模型结构成熟、社区资源丰富、文档完善、部署链路经过千锤百炼。

因此YOLOv5是工业界应用最广泛的目标检测模型之一,奠定 PyTorch 模块化基础,追求工程稳定与易用性。

1.2YOLO11

YOLO11在YOLOv5奠定的基础上进行了全方位的架构革新。它在特征提取能力上下了大功夫——通俗地说,就是让模型”看得更细、理解更深”。且并没有为了追求精度而牺牲速度。

对于那些已经在产线上部署了YOLOv5、但又渴望在不更换硬件的前提下获得更好检测效果的团队来说,YOLO11无疑提供了一个极具吸引力的升级选项。

1.3YOLO26

YOLO26不再仅仅是一个目标检测模型,而是首个原生统一五大视觉任务的统一架构。检测、实例分割、图像分类、姿态估计(关键点检测)、定向边界框检测。对于嵌入式开发者而言,这意味着一套代码、一个模型权重可以灵活切换多种视觉能力,极大地降低了多任务场景下的开发和维护成本。

同时还优化了两个长期困扰YOLO系列的速度瓶颈——NMS(非极大值抑制,一种后处理去重算法)和DFL(分布焦点损失),让推理过程更加简洁高效。并将低功耗嵌入式设备纳入了考量范围。它的架构优化不仅着眼于实验室里的mAP(平均精度均值)指标,更关心模型在NPU上究竟能跑出怎样的实际帧率。

接下来的章节,我们将把这三代模型一一部署到IPC-RV1126B套件上实测。

二. YOLO v5/v11/v26模型实战部署

2.1 统一部署环境

将SC450AI摄像头(IMX415同样支持)与IPC-RV1126B接口底板的MIPI CSI接口轻轻扣合,并完成POE电源板安装与供电,本模型例程通过网络推流进行视频实时输出,需确保以太网是正常连接状态。

软件环境的准备更为轻松。直接从GitHub拉取官方仓库:

git clone https://github.com/hbt021211-coder/talowe-rv1126b-aidemo

如果网络条件不便,也可以使用配套光盘中的离线包,路径位于 Core-RV1126B-IPC核心板光盘资料\4-软件资料\3-RV1126B模型应用\talowe-rv1126b-aidemo.zip。仓库中已经包含了三个模型的预编译RKNN文件和完整例程,省去了从零编译的繁琐步骤。

视频预览方面,套件板通过UDP推流将推理画面发送到PC端。在Ubuntu接收终端上提前启动GStreamer管道:

gst-launch-1.0 udpsrc port=5000 ! application/x-rtp,media=video,encoding-name=H264,payload=96 ! rtph264depay ! avdec_h264 ! videoconvert ! autovideosink

2.2YOLOv5部署实测

通过adb将编译好的应用包推送到IPC-RV1126B套件板:

adb push talowe_yolov5_detection_cam/cpp/install/rv1126b_linux_aarch64/rknn_yolov5_detection_cam/ /userdata/aidemo

推送完成后进入目录,执行:

./rknn_yolov5_detection_cam model/yolov5.rknn /dev/video31 192.168.0.19

● model/yolov5.rknn 是RKNN格式模型文件

● /dev/video31 对应SC450ai摄像头设备节点

● 192.168.0.19 则是Ubuntu接收端的IP地址

Ubuntu端的GStreamer窗口几乎是同步亮起的。画面中,摄像头实时采集的每一帧都被YOLOv5逐帧分析,各目标被彩色检测框标注着类别与置信度。

画面左上角醒目地显示着两路帧率数据:一路是摄像头采集帧率,另一路是NPU推理帧率。后者稳定维持在一个令人满意的数值区间,说明RKNN模型在RV1126B的NPU上跑得相当从容。

2.3YOLO11部署实测

YOLOv5验证通过后,换上YOLO11的感受可以用”无缝切换”来形容。推送路径和运行逻辑完全一致:

adb push talowe_yolo11_detection_cam/cpp/install/rv1126b_linux_aarch64/rknn_yolo11_detection_cam/ /userdata/aidemo

进入目录后执行:

    ./rknn_yolo11_detection_cam model/yolo11.rknn /dev/video31 192.168.0.191

    命令结构、参数含义、甚至左上角的帧率显示方式都与YOLOv5一致。

    实际跑起来后,相比YOLOv5,YOLO11对中小型目标的定位更为精准,检测框的抖动明显减少,在光照不均的场景下置信度也更稳定。

    2.4YOLO26部署实测

    最后登场的是YOLO26。推送命令遵循相同的模式:

    adb push talowe_yolo26_detection_cam/cpp/install/rv1126b_linux_aarch64/rknn_yolo26_detection_cam/ /userdata/aidemo

    运行命令同样一脉相承:

    ./rknn_yolo26_detection_cam model/yolo26.rknn /dev/video31 192.168.0.191

    YOLO26的画面表现进一步验证了新一代算法的进化。在实际场景中,YOLO26对密集目标的区分能力明显更强,检测框的贴合度也更接近目标的真实轮廓。

    三、结语

    从YOLOv5的经典实用,到YOLO11的精度跃升,再到YOLO26的全面进化——同一套硬件平台完整承载了三代算法的能力演进,这就是边缘AI部署的”一步到位”。

    三次部署的命令结构几乎是一个模板刻出来的——这正是眺望电子RV1126B AI视觉开放平台最值得称道的工程化能力。它意味着无论模型如何迭代演进,底层的推理框架、驱动接口和部署流程都保持着高度稳定,开发者基于统一的talowe-rv1126b-aidemo仓库,切换模型只需替换一个rknn文件、修改一条命令。大幅缩短了从算法验证到产品落地的周期。

    完整开发资料或者套件申请可向眺望电子技术支持联系获取。

    http://www.gsyq.cn/news/1595384.html

    相关文章:

  • 如何用Mermaid Live Editor实现5分钟完成复杂图表设计?
  • Rhino.Inside.Revit终极指南:如何用5个步骤彻底改变你的BIM参数化设计工作流
  • Console Log 最全使用详解
  • FeHelper:一站式前端开发工具箱,让你的浏览器变身全能助手
  • Möbius加权下第k大素因子模q余数的均匀分布研究
  • AMD Ryzen处理器终极调试指南:SMUDebugTool硬件性能深度掌控
  • 3步掌握终极M3U8下载解决方案:N_m3u8DL-CLI-SimpleG高效视频下载工具完全指南
  • 基于毫米波雷达与双模通信的智能水位监测系统设计
  • PaperXie AI PPT 生成器:网页端一站式文稿转演示文档,彻底告别手动排版煎熬
  • 官宣!职坐标与通义云启QoderWork CN达成战略合作!
  • Win10驱动安装报错:哈希值不在目录的解决方案
  • 终极KMS智能激活脚本:5分钟搞定Windows和Office免费激活
  • 2026 电话机器人厂商测评及盘点:AI 外呼系统哪家更适合中小企业?
  • 如何在Windows上创建完美虚拟显示器:ParsecVDisplay完整指南
  • 3个步骤掌握SMUDebugTool:AMD Ryzen处理器性能优化的终极指南
  • ThinkPHP5反序列化漏洞实战:从文件上传到RCE的完整利用链剖析
  • 斯坦福2026 AI指数报告:生成AI三年普及率达53%,中美性能差距基本消除
  • 前端开发效率革命:FeHelper全功能工具箱实战指南
  • CMU团队提出RT-VLA:双分支解耦+多级蒸馏,让端到端自动驾驶模型提速44倍!
  • 太流批了,断网神器
  • 目前正规的AI智能体APP哪家专业
  • 树莓派远程访问新方案:Raspberry Pi Connect零配置实战指南
  • 企业级智能体推荐|当业务跑在技术前面,九科信息智能体bit-Agent如何让创新不再等待
  • 汝南抓药实测:这两家药材最地道
  • 2026年AI爆发,小白也能轻松上手!收藏这些实用工具,让你不被时代抛下!
  • 登录页面跳转
  • 零门槛AI翻唱终极指南:用AICoverGen让任何人声唱任何歌
  • 【Springboot毕设全套源码+文档】基于SpringBoot的招聘系统的设计与实现(丰富项目+远程调试+讲解+定制)
  • JPEXS FFDec:5个步骤掌握Flash逆向工程与SWF文件反编译
  • 高层小区二次供水泵房物联网系统方案