当前位置: 首页 > news >正文

【计算机科学与应用】YOLO-Apple:一种用于苹果幼果检测的改进型目标检测方法

导读:

针对自然果园场景中,苹果幼果因通体青绿色、与叶片色调相近,且本身尺度偏小、分布密集又易被枝叶遮挡,检测时易出现漏检与误检的问题,文章提出了一种面向苹果幼果检测的改进型目标检测模型YOLO-Apple。该方法以YOLOv11n为基线,在主干C2PSA模块引入轻量特征增强单元Mona (C2PSA_Mona)以强化复杂背景下的特征映射能力,改造C3k2模块并在其增强块嵌入EMA注意力(C3k2_EMA),提升特征表达与选择能力。实验采用来自新疆阿克苏市与石河子市等自然场景采集的5558张苹果幼果图像数据集,按7:2:1划分为训练、验证与测试集。结果表明,YOLO-Apple在测试集上实现P= 91.5%、R= 75.9%、F1 = 83.0、mAP@0.5 = 84.4%的检测性能,在6.5 GFLOPs计算量与2.6 M参数量的轻量级开销下优于多款主流对比模型;消融实验验证了C2PSA_Mona与C3k2_EMA模块的改进有效性,为自然果园苹果幼果检测提供了新方法。

作者信息:

韩昕辰, 安一文*, 武红欣:塔里木大学信息工程学院,新疆 阿拉尔;塔里木绿洲农业教育部重点实验室,新疆 阿拉尔

论文详情

在本研究中,数据集图像来自 AI Studio 的苹果幼果目标识别数据集。

YOLOv11n被选定为本研究的基线模型。通过对 C3k2 模块 和 C2PSA 模块进行针对性改进,构建得到 YOLO-Apple 检测模型,其结构图如图 2 所示。

C2PSA_Mona 的结构图如图 3 所示。

EMA 的结构如图 4 所示。

为选择出最佳模型,本研究使用多种评估指标用于评估模型的性能和计算效率,包括精确率 (Precision, P)、召回率(Recall, R)、mAP@0.5、F1 分数(F1-score)、计算量(GFLOPs)和参数量(Parameters) 等。

所有实验均在同一台设备上进行,该设备配备 AMD5500 处理器,NVIDIA GeForce RTX 5080 显卡, 该显卡具有 16 GB 显存,所使用系统为 Ubuntu 22.04,内存为 48 GB。在实验环境上,使用 Python 3.11.5、 CUDA12.8 和 PyTorch 2.9.1 作为框架。在训练设置上,图片大小为 640 × 640,训练轮次为 200 轮,使用 SGD 作为优化器,批量大小设置为 8。

为验证所提出模块对苹果幼果检测性能的贡献,本文以基线模型(YOLOv11n)为对照,逐步引入各模 块进行消融实验,结果如表 1 所示。

为验证 YOLO-Apple 模型在苹果幼果检测中的性能优势,本研究选取了多种主流的目标检测算法作 为对比实验,包括 YOLOv8n、YOLOv9-tiny、YOLOv10n、YOLOv12n和 YOLOv13n。实验结果如表 2 所示。

本研究针对苹果幼果小目标、遮挡与密集分布等检测难点,提出检测模型 YOLO-Apple。在实验数据 集上,YOLO-Apple 在保持较低复杂度(6.5 GFLOPs,2.6 M 参数)的前提下取得最佳综合性能:P = 91.5%、R = 75.9%、F1 = 83.0、mAP@0.5 = 84.4%。与多种主流轻量模型对比,YOLO-Apple 的 mAP@0.5 相比最 优基线提升约 2.0%,召回率也达到最高,说明其对幼果漏检抑制更有效。消融实验进一步表明,逐步引 入 C2PSA_Mona 与 C3k2_EMA 可稳定提升检测效果,最终在几乎不增加参数量的情况下实现精度与召 回的同步改善。

基金项目:

塔里木大学校长基金胡杨英才项目(TDZKSS202341)

原文链接:

https://doi.org/10.12677/csa.2026.165203

http://www.gsyq.cn/news/1457557.html

相关文章:

  • QoSDiff框架:扩散模型与对抗注意力在QoS预测中的应用
  • 【企业AI成熟度诊断工具包】:含智能等级自测表、工具匹配矩阵与ROI预估模型
  • AI大模型盈利模式待解,美国专家乔·韦曼谈商业化、信任与成本问题
  • FDTD Solutions 8.0仿真效率提升指南:从手动建模到参数化扫描与优化
  • 终极指南:一键安装Windows包管理器Winget的智能解决方案
  • EBIF框架:非线性控制系统精确双线性化的新方法
  • AI赋能:让快马平台的Kimi模型为你打造会推荐懂交流的智能闺蜜浏览器
  • 别再只会用updateById了!MyBatis-Plus更新操作的三种实战场景与选择指南
  • Spring AI 生产级实战:记忆管理
  • 苹果辅助功能开启引导式访问
  • ESP8266 AP模式避坑指南:除了创建热点,这些softAPConfig和连接管理的细节你注意了吗?
  • 信号处理中的“幽灵”:常数1的傅里叶变换,那个2π到底是怎么冒出来的?
  • R语言鸢尾花分析实战包:从数据探索到模型评估全流程代码+报告
  • 避坑指南:用FDTD Solutions 8.0做薄膜仿真时,我踩过的那些‘坑’(反射率结果不对?网格设置误区?)
  • 虚拟仿真实验教学平台选哪家靠谱?六维拆解帮你避坑
  • 告别手动转换:在CAPL中高效处理CAN FD和以太网SOME/IP的Hex数据块
  • 2026年新消息:南京民间纠纷律师咨询哪位好?关键维度解析 - 2026年企业资讯
  • 打破平台壁垒:WorkshopDL让Steam创意工坊模组自由下载
  • HiL仿真调试进阶:如何用Speedgoat和Simulink Real-Time打造高实时性演示系统?
  • 主线内核驱动全志A13 GPU实战:在Ubuntu 18.04上搞定Mali 400开源驱动
  • YOLO11涨点优化:数据增强 | 利用Mosaic-9增强全景拼接,进一步丰富小目标上下文,专治检测尺度失衡
  • AirSim仿真卡顿?手把手教你用Python API(1.3.1)优化图像采集与数据传输效率
  • 别再只调参数了!Simulink模块的‘隐藏属性’:回调、优先级与注释实战指南
  • 易语言游戏脚本实战:用乐玩插件FindPic实现自动任务交接(附完整源码)
  • AI辅助开发:让快马平台智能解析并应用awesome-design-md设计资源
  • Halcon图像处理实战:用decompose3和trans_from_rgb搞定彩色图像分割与HSV转换
  • 运筹学面试必考:线性规划对偶问题,从‘对称形式’到‘影子价格’的经济学解读
  • 科研绘图利器GMT的中文支持到底怎么搞?从Ghostscript原理到四种字体实战
  • 深耕高端制造领域,提供稳定品质的17-4PH不锈钢供应服务 - 品牌2026
  • Windows系统优化神器:Chris Titus Tech WinUtil完全指南,告别繁琐配置!