当前位置: 首页 > news >正文

078.半监督学习:利用少量标注数据和大量无标签数据训练YOLO

上周在产线部署缺陷检测模型,遇到个头疼事:新产线只收集到200张标注图,但历史无标签数据有2万张。客户问:“能不能用上那堆没标的数据?” 这问题直接戳中工业场景的痛点——标注成本高、周期长。今天聊聊我们怎么用半监督学习,让YOLO既吃“细粮”也啃“粗粮”。一、从伪标签迭代开始:别指望一步到位刚开始想得太简单:直接用有标签数据训个初始模型,去预测无标签数据,把高置信度的预测框当作真值,混回训练集再训。结果第一轮就崩了——初始模型在无标签数据上误检严重,噪声标签把模型带偏了,mAP掉了5个点。教训:伪标签的质量比数量重要。我们改成了三步迭代法:用有标签数据训练一个“保守模型”(提高置信度阈值,严格数据增强)。对无标签数据做强增强(Mosaic+RandAugment)预测,只保留最高置信度的10%预测框。混合训练时,给伪标签样本设置更低的损失权重(0.3左右)。# 伪标签生成核心片段forunlab_imginunlabeled_dataset:# 强增强版本用于预测
http://www.gsyq.cn/news/1342622.html

相关文章:

  • 彻底掌控Windows Defender:开源工具defender-control完全指南
  • STM32矩阵按键详解——4×4行列扫描与非阻塞消抖(硬件总结六)
  • 用LLM从零搭3D小世界编辑器|小白也能搞定的AI Native开发实录
  • 注释与常用快捷键
  • 【Unity】MiniGame编辑器小游戏(十六)中国象棋局域网对战【Chinese Chess】(下)
  • 把SAC model的数据导出到BW的ADSO中
  • 强制启动 Cursor IDE 主程序(不带 Agent 模式)
  • AI 的持续学习:从会话中提取可复用知识
  • [具身智能-833]:Ollama部署大模型后,如何与大模型进行通信?
  • SMARTFORM不同模板一起打印
  • 工程实战:基于 GPIO 物理旁路极速部署机器人电梯调度系统的设计
  • 嘉立创EDA:原理图到PCB学习总结
  • 忙碌”幻觉:你以为在推进项目,其实只是在逃避
  • 全球石墨纤维粉市场分析与行业发展趋势
  • 凡亿AD22--PCB生产Gerber文件输出
  • AI犯了错没人追责,工程师犯了错丢饭碗?
  • AI电商助手项目策划书(Demo版)
  • 探索C/C++程序从源码到可执行文件的编译之旅
  • Mamba架构原理与工业级长文本处理实战指南
  • 【限时解密】Midjourney后现代风格黄金参数矩阵(含27组实测CR值对比数据):错过本轮更新将永久失去V6.1前最后兼容窗口期
  • 软考高项案例分析1:项目整合管理
  • 论文AI率爆表怕延毕?5招实测降AI率,3分钟知网AIGC过审上岸
  • 太突然!IPO紧要关头,Karpathy加入Anthropic
  • GanttProject:免费开源项目管理软件的终极完整指南
  • 卷赢了!山东大学学者七库联合发文一区TOP(IF 10.6),解锁痴呆研究新赛道!
  • K8s Ingress Nginx 控制器配置 HTTPS 自动重定向的 YAML 要怎么写?
  • 从 Excel 手算理解 MLP(多层感知机)的完整计算过程
  • 英伟达的“围城”:云厂商自研芯片,攻到了哪一步?
  • 2026年q2天津闲置酒水回收正规机构实力盘点:天津名贵酒品回收回收/天津洋酒回收/天津礼盒酒水回收/优选推荐 - 优质品牌商家
  • Transformer架构优化与高效计算实践