当前位置: 首页 > news >正文

基于 YOLO 的城市河流漂浮垃圾实时计数:为防洪与水资源管理装上 “AI 慧眼”

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID计算机视觉研究院学习群扫码在主页获取加入方式https://pmc.ncbi.nlm.nih.gov/articles/PMC12920366/pdf/10661_2026_Article_15040.pdf计算机视觉研究院专栏Column of Computer Vision Institute城市内涝频发河道漂浮垃圾竟是关键 “推手”如何用 AI 实现实时监测、自动计数、预警联动本文研究给出了可落地的解决方案。PART/1痛点城市河流中的漂浮垃圾不只是污染问题更是防洪隐患——阻塞水流、抬高上游水位直接加重内涝传统人工巡查、普通监控耗时、滞后、易漏判现有 AI 模型多只识别 “垃圾” 一类缺乏细分类无法支撑防洪决策。针对这些痛点研究团队搭建了一套YOLO 视频监控的实时漂浮垃圾监测框架在马来西亚莎阿南易涝河道落地验证。PART/2方案方案双 YOLO 模型搭配兼顾速度与精度团队选用YOLOv7 YOLOv9双模型协同互补短板YOLOv7速度快、鲁棒性强适配边缘设备 24 小时不间断运行YOLOv9小目标、低对比度、半淹没垃圾检测更优雨天更稳。系统硬件部署整套监测单元包含AI 云台相机、NVIDIA Jetson 边缘计算设备、雷达水位计、气象站支持昼夜全天候作业数据不上云也能实时推理。数据集与分类构建15000 张实景图像数据集覆盖 13 类垃圾瓶子、树枝、易拉罐、杯子、泡沫、塑料袋、成堆垃圾、塑料盒、纸板、遮阳棚、桌子、椅子、大伞精准匹配城市河道真实场景。核心流程现场安装→数据采集→图像预处理与增强YOLOv7/YOLOv9 训练→模型导出边缘设备实时推理→垃圾分类计数→阈值预警→决策支持。PART/3结果结果YOLOv7 整体更优雨天选 YOLOv9在真实河道光照、反光、浑浊、雨天等复杂环境下测试综合性能YOLOv7 全面领先mAP0.5 达91.8%精度、召回率、F1 值更稳定恶劣天气YOLOv9 在雨天、模糊场景下衰减更小漏检更少实时性边缘端 YOLOv7 达23.4 FPSYOLOv9 达 19.8 FPS均满足实时要求。混淆矩阵与精度 / 召回曲线显示模型对常见塑料、瓶罐类识别极准主要误判来自形状相似垃圾与强光眩光。关键指标对比精度YOLOv7 对成堆垃圾、塑料容器更准YOLOv9 对树枝、塑料袋略优召回率YOLOv7 整体更高尤其小目标不漏检mAPYOLOv7 在多阈值下均领先定位更精准。PART/4价值价值从 “看垃圾” 到 “防洪水”这套系统不只是环保监测更是防洪前置预警工具垃圾密度突增→预判河道堵塞→提前清淤分类识别→判断污染源→精准治理联动水位、雨量数据→构建一体化防洪预警助力联合国 SDG 11可持续城市、SDG 13气候行动目标。PART/5总结与展望✅ 结论YOLOv7 更适合城市河道常态化实时监测YOLOv9 可作为恶劣天气补充✅ 创新实景数据集、双模型对比、边缘端落地、计数预警一体化 未来融合雷达 / 红外、扩展多流域、打造 AI 水文学混合预警系统。AI 让河道 “看得见、数得清、能预警”为城市防洪与水资源管理提供低成本、可复制的智能方案有相关需求的你可以联系我们END转载请联系本公众号获得授权计算机视觉研究院学习群等你加入ABOUT计算机视觉研究院计算机视觉研究院主要涉及深度学习领域主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架提供论文一键下载并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程让大家真正体会摆脱理论的真实场景培养爱动手编程爱动脑思考的习惯往期推荐YOLO-TLA一种基于 YOLOv5 的高效轻量级小目标检测模型ViT-YOLO基于Transformer的用于目标检测的YOLO算法SSMA-YOLO一种轻量级的 YOLO 模型具备增强的特征提取与融合能力适用于无人机航拍的船舶图像检测LUD-YOLO一种用于无人机的新型轻量级目标检测网络Gold-YOLO基于聚合与分配机制的高效目标检测器Drone-YOLO一种有效的无人机图像目标检测「无人机AI」“空中城管”无人机AI光伏巡检自动化解决方案无人机视角下多类别船舶检测及数量统计机场项目解决飞行物空间大小/纵横比、速度、遮挡等问题引起的实时目标检测问题2PCNet昼夜无监督域自适应目标检测附原代码YOLO-S小目标检测的轻量级、精确的类YOLO网络大改Yolo框架 | 能源消耗极低的目标检测新框架附论文下载改进的检测算法用于高分辨率光学遥感图像目标检测
http://www.gsyq.cn/news/1293923.html

相关文章:

  • HFSS入门指南(一)核心界面解析与仿真前关键设置
  • Unity | HDRP高清渲染管线进阶指南:光照探针与反射探针实战解析
  • 避开Halcon频域滤波的坑:从‘帽子图’案例详解gen_highpass/gen_lowpass参数怎么调才有效
  • 火灾模拟终极指南:3步掌握Fire Dynamics Simulator实战技巧
  • 2026年宁夏短视频代运营与一站式网络营销服务商深度横评:企业怎么选 - 年度推荐企业名录
  • 2026年银川企业短视频代运营与一站式网络营销服务商深度评测指南 - 年度推荐企业名录
  • Claude Code 总遇封号与 Token 不足问题可转向 Taotoken
  • 终极指南:如何用FanControl彻底解决电脑风扇噪音问题 [特殊字符]
  • Rust命令行工具开发实战:从架构设计到工程化发布
  • Python爬虫必备:Windows 10/11下用pip一键安装lxml库(附常见错误排查)
  • 话费卡回收技巧:轻松兑换现金的最佳攻略! - 团团收购物卡回收
  • 终极散热优化指南:如何用G-Helper解决华硕笔记本过热问题
  • 【ElevenLabs老年女性语音实战指南】:20年AI语音工程师亲测的5大适配陷阱与3步高保真克隆法
  • ABB_2600运动学:从MDH建模到姿态转换的完整实现
  • 为什么你的藏文TTS输出总是“平调”?ElevenLabs藏语声调建模机制深度逆向(附Python声调校准工具包)
  • ARM PMU性能监控单元原理与编程实践
  • 3大核心功能深度解析:如何用FanControl打造个性化静音散热系统
  • 为什么92%的日企开发者调不出原生级日语语调?ElevenLabs隐藏prompt工程与音素对齐技巧大揭秘
  • Word转PDF怎么转?免费在线转换工具对比 | 2026年实测推荐 - AI测评专家
  • 构建高效个人知识库:Git+Markdown实践与ClawCode项目解析
  • DeFi套利机器人实战:Polymarket预测市场自动化交易系统设计与实现
  • NGA论坛优化摸鱼体验插件:终极指南与实战应用
  • 【限时解锁】ElevenLabs奥里亚文语音隐藏功能:动态口音迁移+方言强度滑块(仅v4.2.1+企业版可用)
  • 从安装到实测:基于 Claude Code + GLM-4.7 的前端生成与评测实战
  • Raspberry Pi Imager终极指南:快速创建树莓派启动盘的完整教程
  • 企业级自托管AI平台部署实战:Open WebUI架构深度解析与安全部署方案
  • 如何快速掌握终极鼠标悬停翻译神器:MouseTooltipTranslator完整使用指南
  • DJI A3飞控实战:从校准到模式切换的飞行安全指南
  • 捡垃圾实战:让ESXi 7.0 U3识别老古董Mellanox ConnectX-2 10G网卡(附完整驱动修改脚本)
  • 终极OBS WebSocket远程控制指南:简单三步实现自动化直播管理