当前位置: 首页 > news >正文

2026年全新优化版李宏毅机器学习课程笔记

bilibili

课程链接:2026年全新优化版李宏毅机器学习系统课程

1、经典案例

预测宝可梦combat power(CP)值,进化比较强的宝可梦

step1:Model

老师举了一个线性模型的例子,xi是特征,wi是权重,b是偏置

step2:Goodness of Function

收集了10只宝可梦的数据,横轴表示原始CP值,纵轴表示进化后的CP值,n表示样本数量即10个

经过一系列函数f的作用下,我们引入Loss函数,来判断模型好坏,具体操作如下:

设定线性模型

训练数据经过一系列函数

得到Loss函数

接下来,绘制10个样本经过训练得到Loss函数,❌是最小值,在深度学习中,我们要找到最优的损失,即真实值预测值的偏差为0,即loss为0,那我们就需要找到对应minLoss对应的w和b,也为接下来引入梯度下降埋入伏笔

其loss函数热力图如下:

Step3:梯度下降 Gradient desent

损失函数只有w一个参数,先随机找一个初始点w0,计算该点的斜率,结合学习率进行更新w权重,可以想象一个人想下山,在该点出左看右看,发现哪里是下山的路,反复迭代后,可能会出现如下图的情况,陷入局部最优点。

出现两个参数w、b时,对这两个进行偏微分,如下图

整体的操作还是先随机选w和b的初始点,不断的更新,就能找到相对较小的loss函数

损失函数以及其梯度下降的可视化(visualize),箭头的方向都等高线出的切线方向,在线性模型中,我们的loss函数是凹函数,没有局部最优,无论从哪出发都能找到最优。

L(w,b)的偏微分公式如下,y^是预测值

如图,线性模型在测试集上表现不好,泛化能力不行,假如测试集就死红点位置,红点离直线距离较远,说明我们的模型效果不好,需要重新选择模型

选择另外的模型,引入二次项,如图,但我们如果接着引入x三次方、x的四次方……,模型越来越复杂,在测试集表现越来越好,但测试集表现越来越差,模型出现过拟合问题,同时,我们在选择模型时,要选择在测试集表现最好的模型

上面我们只考虑了CP值,没有考虑物种

重新设计模型,每一个物种都有自己的线性模型,通过这种0-1的算法让每一个物种都有自己的线性模型,

我们最在意的还是能不能在测试集上看到新的宝可梦,我们还想让model在Testing 表现更好,还有其他hidden factor吗?

Back to step 1 重新设计模型

考虑了种类、CP、高度h、重量w四个参数,但是出现过拟合,后面使用正则化,调合适的

总结:进化后的CP值跟初始cp值、物种有很大关系,应该还有其他hidden factor是我们没有发现的,掌握梯度下降、过拟合、正则化这些知识点。最终,我们认为现在的model如果上线到网络中,error将会比测试集上表现还要大

http://www.gsyq.cn/news/1622631.html

相关文章:

  • 提示工程不是修辞游戏:大模型认知协议与鲁棒性设计
  • Transformer词嵌入层深度解剖:语义校准、位置耦合与梯度调控
  • 大模型是怎么推荐企业的?GEO 优化的技术原理深度解析
  • Fetch API 核心原理与生产级实践指南
  • Ubuntu 18.04 搭建高可用 Docker 私有仓库实战
  • 《代码世界的侦探笔录 ——C/C++ 日志系统设计趣味精讲》
  • STM32外部EEPROM存储方案设计与优化实践
  • Claude Code 进化:从代码助手到 AI 编程代理的实战指南
  • Anthropic确定性边界协议(DBP):让LLM适配层归零
  • 等了16个月!特斯拉HW3老车主用上FSD V14 Lite,体验飞跃但上限已定
  • GPT-4动态稀疏激活:2%参数如何实现千亿模型高效推理
  • 企业官网开发工具推荐:从设计到代码一体化平台解析
  • GPT-4参数量与激活率真相:1.8万亿不是显存需求,2%不是固定公式
  • DeepSeek稀疏注意力:降低KV缓存与FLOPs的工业级实践
  • Git合并原理与实战:从冲突解决到团队协作规范
  • ChatGPT Excel处理避坑指南:11个高危操作导致数据泄露/公式错乱/格式崩坏(含企业级安全审计清单)
  • ARM64平台PL2303串口驱动编译与兼容性解决方案
  • GPU算力短缺下的AI训练成本优化实战方案
  • MC74HC165A与PIC18F2585的SPI接口设计与优化
  • Dify+RAGFlow构建企业级合同智能审查系统
  • 基于A89307和PIC18F55K42的15A无刷电机FOC控制方案
  • 摸版值${code}替换
  • Linux服务器入侵检测实战:命令行应急响应与安全排查指南
  • 大模型架构中的抽象层归零:语义路由层的消融与内化
  • GPT-4参数量与激活率的真相:MoE架构下的工程权衡
  • Windows系统文件BarcodeProvisioningPlugin.dll丢失找不到问题解决
  • OCR噪声如何系统性拖垮RAG效果:从视觉重建到可信问答
  • AI模型能力评估与发布策略:从Claude 3到Llama.cpp实践解析
  • 百考通AI 10分钟生成逻辑闭环导师认可的专业开题报告
  • 【AI大模型进阶】大模型能推理吗?用“鸡兔同笼”测试各大模型的智商