当前位置：首页 > news >正文

078.半监督学习：利用少量标注数据和大量无标签数据训练YOLO

news 2026/6/27 19:19:46

上周在产线部署缺陷检测模型，遇到个头疼事：新产线只收集到200张标注图，但历史无标签数据有2万张。客户问：“能不能用上那堆没标的数据？” 这问题直接戳中工业场景的痛点——标注成本高、周期长。今天聊聊我们怎么用半监督学习，让YOLO既吃“细粮”也啃“粗粮”。一、从伪标签迭代开始：别指望一步到位刚开始想得太简单：直接用有标签数据训个初始模型，去预测无标签数据，把高置信度的预测框当作真值，混回训练集再训。结果第一轮就崩了——初始模型在无标签数据上误检严重，噪声标签把模型带偏了，mAP掉了5个点。教训：伪标签的质量比数量重要。我们改成了三步迭代法：用有标签数据训练一个“保守模型”（提高置信度阈值，严格数据增强）。对无标签数据做强增强（Mosaic+RandAugment）预测，只保留最高置信度的10%预测框。混合训练时，给伪标签样本设置更低的损失权重（0.3左右）。# 伪标签生成核心片段forunlab_imginunlabeled_dataset:# 强增强版本用于预测

http://www.gsyq.cn/news/1342622.html

相关文章：

彻底掌控Windows Defender：开源工具defender-control完全指南

STM32矩阵按键详解——4×4行列扫描与非阻塞消抖（硬件总结六）

用LLM从零搭3D小世界编辑器｜小白也能搞定的AI Native开发实录

注释与常用快捷键

【Unity】MiniGame编辑器小游戏（十六）中国象棋局域网对战【Chinese Chess】（下）

把SAC model的数据导出到BW的ADSO中

强制启动 Cursor IDE 主程序（不带 Agent 模式）

AI 的持续学习：从会话中提取可复用知识

[具身智能-833]：Ollama部署大模型后，如何与大模型进行通信?

SMARTFORM不同模板一起打印

工程实战：基于 GPIO 物理旁路极速部署机器人电梯调度系统的设计

嘉立创EDA：原理图到PCB学习总结

忙碌”幻觉：你以为在推进项目，其实只是在逃避

全球石墨纤维粉市场分析与行业发展趋势

凡亿AD22--PCB生产Gerber文件输出

AI犯了错没人追责，工程师犯了错丢饭碗？

AI电商助手项目策划书（Demo版）

探索C/C++程序从源码到可执行文件的编译之旅

Mamba架构原理与工业级长文本处理实战指南

【限时解密】Midjourney后现代风格黄金参数矩阵（含27组实测CR值对比数据）：错过本轮更新将永久失去V6.1前最后兼容窗口期

软考高项案例分析1：项目整合管理

论文AI率爆表怕延毕？5招实测降AI率，3分钟知网AIGC过审上岸

太突然！IPO紧要关头，Karpathy加入Anthropic

GanttProject：免费开源项目管理软件的终极完整指南

卷赢了！山东大学学者七库联合发文一区TOP（IF 10.6），解锁痴呆研究新赛道！

K8s Ingress Nginx 控制器配置 HTTPS 自动重定向的 YAML 要怎么写？

从 Excel 手算理解 MLP（多层感知机）的完整计算过程

英伟达的“围城”：云厂商自研芯片，攻到了哪一步？

2026年q2天津闲置酒水回收正规机构实力盘点：天津名贵酒品回收回收/天津洋酒回收/天津礼盒酒水回收/优选推荐 - 优质品牌商家

Transformer架构优化与高效计算实践