当前位置: 首页 > news >正文

梯度下降法数学理解

1、数学梯度下降法

目标:求函数 f(x)=x2的最小值。
我们知道最小值在 x=0 处,但梯度下降法不需要知道这个,它会自己找到。

步骤

  1. 初始位置:随便取 x=4

  2. 学习率(步长):η=0.1

  3. 梯度:f′(x)=2x。梯度的反方向就是 −2x

  4. 更新公式:xnew=x−η⋅f′(x)=x−0.1×(2x)=x−0.2x=0.8x

迭代过程

  • 第0步:x=4

  • 第1步:x=0.8×4=3.2

  • 第2步:x=0.8×3.2=2.56

  • 第3步:x=0.8×2.56=2.048

  • 第4步:x=1.638

  • 第5步:x=1.310

  • 第6步:x=1.048

  • 第7步:x=0.838

  • 第8步:x=0.671

  • ……

  • 第n步:x 逐渐逼近 0

结论:梯度下降法每次沿着“负梯度方向”更新 x,使函数值 f(x)=x2不断下降,最终收敛到最小值点 x=0。

2、神经网络中使用梯度下降法

整个过程可以拆成 4 步:

1. 定义损失函数

假设一个神经网络做分类任务,最后一层输出预测值 y^,真实标签是 y。
定义一个损失函数 LL(比如交叉熵损失或均方误差),用来衡量预测与真实之间的差距。
目标:找到网络中的所有权重 W 和偏置 b,使 LL最小。

2. 前向传播(Forward)

输入一个 batch 的样本,数据从输入层依次经过各层(线性变换 + 激活函数),一直传到输出层,得到预测值 y^​。
同时,每一层的中间结果(激活值、加权和)需要保存下来,供后面反向传播使用。

实际训练中的循环

整个流程是迭代的:

Repeat:

  1. 随机取一个 mini-batch 的数据

  2. 前向传播计算损失

  3. 反向传播计算每个参数的梯度

  4. 用梯度下降(或其变体,如SGD、Adam)更新参数,Until损失收敛或达到指定迭代次数

总结:

模型先随机给定w值和b值,然后让模型能得到一个预测值,然后用1/2(y*-y)*(y*-y),得到损失。

然后连用链式求导法,逐渐反推出w值和b值。不断地训练模型,不断地更新w和b,直到损失趋于平稳,把模型放到验证集上去验证模型的泛化能力。然后判断是否需要减小或者增大学习率来再次对模型进行训练。

3、损失曲线看模型训练结果

现象可能原因是否正常
损失下降过早平坦(如第 2 个 epoch 就平坦,且最终损失值仍然很高)学习率过小、模型欠拟合(容量不足)、特征预处理不当不正常,需要调整
平坦后突然再次下降(阶梯状)优化器跳出局部极小值(如 SGD with momentum)正常,但需关注是否收敛
平坦后持续轻微上升过拟合(验证集上更明显)、学习率过大导致震荡不正常,需正则化或降低学习率
损失平坦但验证损失远高于训练损失过拟合不正常

参考链接:

梯度下降法

http://www.gsyq.cn/news/1532802.html

相关文章:

  • Novel-downloader:可扩展通用型小说下载解决方案的技术架构解析
  • MuleSoft AI编排:企业级LLM集成的七层可审计架构
  • Python闭包与装饰器的高级陷阱
  • Sqribble:面向知识工作者的文档操作系统与自动化交付方案
  • Python装饰器与描述符在ORM中的实现
  • 国内有哪些航空配餐类上市公司? - 品牌2026
  • 全球光模块龙头中际旭创300308:股价估值与基本面查询全攻略
  • Linux 调度器优化:从 CFS 到实时调度的性能调优实践
  • 【安徽大学主办,权威背书 | IEEE出版,EI 检索稳定 | 连续四届全部论文完成见刊检索,每届都在提交后2-3个月检索 | 设奖项评选】第五届半导体与电子技术国际研讨会(ISSET 2026)
  • D2R Pixel Bot:暗黑破坏神2重制版终极自动化解决方案
  • 2026年医院室内空气净化服务商推荐:病房与候诊区治理选型指南 - 观域传媒
  • 3步实现Windows电脑接收AirPlay投屏:完全免费开源方案指南
  • 如何轻松下载网页视频?这款免费Chrome插件3分钟帮你搞定
  • FoundationPose:零样本6D物体姿态估计基础模型实践指南
  • Windows Python 3.8下rasterio 1.3.10 wheel文件安装与GIS开发环境配置指南
  • 3个核心技术:解决STL到STEP格式转换的完整指南
  • 实战恶意软件分析:从动态行为监控到内存取证与自动化逆向
  • 2026年小草围挡与防腐彩涂板行业生态全景分析:从山东到西北的供应链与工程实践 - 优质品牌商家
  • codex添加第三方skills两种方法和使用方法
  • NSK直线导轨LH25BN升级NH25BN全指南
  • 2026年 广东LCD液晶显示屏厂家推荐榜单:车载屏/工控屏/医疗屏/数字标牌,专业显示技术实力派之选 - 品牌发掘
  • 杰理之Linein 采样延时优化【篇】
  • 靠谱软件外包公司到底好在哪
  • 逆变仿真全流程解析:从模型构建到实测验证的工程实践
  • 瑞芯微RK3576芯片开发全解析:从核心架构到AI模型部署实战
  • 小样本目标检测实战:100张标注+400张无标签数据构建可用模型
  • 抖音礼物图标PNG图片制作免抠图素材下载,2035个透明PNG素材打包分享(含等级图标、粉丝团图标、礼物图标)
  • Vulkan编程指南:高性能图形API的中文学习路径与技术决策分析
  • 如何快速修复损坏二维码:QRazyBox专业工具的完整解决方案
  • 非单调依赖类型理论NM-DEKL3∞的架构与实现