当前位置: 首页 > news >正文

初始学习率 0.002

初始学习率 0.002 是 Faster R-CNN 精细微调场景下的保守配置,比标准值 0.02 小10倍,适用于迁移学习冻结Backbone或Warmup预热阶段。

一、0.002 的使用场景

场景1:分层学习率中的Backbone

Python
复制
# Backbone微调慢,Head训练快
optimizer = optim.SGD([{'params': model.backbone.parameters(), 'lr': 0.002},      # 仅0.002{'params': model.rpn.parameters(), 'lr': 0.02},            # 0.02{'params': model.roi_heads.parameters(), 'lr': 0.02 * 1.2} # 0.024
], momentum=0.9)
 
原理:预训练Backbone(如ResNet)已具备通用特征,大lr会破坏其结构,导致训练崩溃。0.002是微调临界点,既学习新知识,又保留旧知识。
http://www.gsyq.cn/news/74860.html

相关文章:

  • animation实现卡片翻转动效‌
  • 完整教程:复盘Netflix的2025:广告业务、线下业态和视频播客
  • 深入解析:Photoshop图形工具组与图层样式
  • 利用Eval Villain进行客户端路径遍历(CSPT)漏洞挖掘与利用
  • MongoDB Docker 镜像制作与部署指南 - 教程
  • 详细介绍:28种CSS3炫酷加载动画:创建引人入胜的网页加载体验
  • 内部网关协议——OSPF 协议(开放最短路径优先)(链路状态路由协议) - 指南
  • 【GitHub热门项目】(2025-11-09) - 详解
  • 深入解析:Nginx优化与防盗链
  • [GESP202312 三级] 小猫分鱼
  • markdown文档格式分析,再使用python对md文件进行结构化拆解
  • CMake Uninstall
  • Day12-20251206
  • [NOI2015 程序自动分析]
  • 【基础】Unity着色器网格和计算对象介绍
  • 首单半价对话框的实现
  • Anchor宽高比
  • SAM3模型来了,手把手带你运行SAM3模型代码,SAM3模型初探!
  • 从可优化到可进化:企业智能化的本质、边界与治理
  • 线段树学习笔记
  • 短剧小程序 2025 核心痛点分析:内容、工艺与合规的三重困境
  • 「Java EE开发指南」如何在MyEclipse中构建EJB 2 Session Bean?(一)
  • 文件摆渡系统哪个好:提升企业文件交换安全性的首选方案
  • 115.娇三“独处-再思考”
  • 2025最新发布!耐磨的轮胎推荐:五大高耐磨胎精选报告
  • 2025年权威发布!防爆胎更换推荐:权威防爆胎更换TOP指南
  • 路由注入
  • 实用指南:C++幻象:内存序、可见性与指令重排
  • 实验三
  • 实验五